有时在处理文件时候,我们需要将中文姓名转换为拼音,或者是转换为拼音首字母,本文将介绍三种Python实现的方法,最后给一个批量操作的代码案例!

一、xpinyin

开门见山,Python中文字转拼音可以使用xpinyin,直接使用pip安装即可

pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

接着导入xpinyin下的 Pinyin 方法如下

from xpinyin import Pinyin

首先试试中文名转拼音,

p = Pinyin()result1 = p.get_pinyin('叶伏天')result1

结果如下:

'ye-fu-tian'

tone_marks可以显示声调

result2 = p.get_pinyin('叶伏天', tone_marks='marks')

结果如下:

'yè-fú-tiān'

去掉空格

s = result1.split('-')result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize()result3结果如下:'Ye Futian'




python 拼音转文字 python pinyin_java 中文转拼音


有时需要中文名转拼音首字母,也很简单


python 拼音转文字 python pinyin_python 拼音转文字_02


二、pypinyin

另一种方法是使用pypinyin,安装同样可以使用pip

# 安装pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

直接导入就行

import pypinyin

再来看看中文名转拼音的实现办法

result1 = pypinyin.pinyin('叶庭云', style=pypinyin.NORMAL)result1

结果如下:

[['ye'], ['ting'], ['yun']]

启用多音节来实现声调

result2 = pypinyin.pinyin('叶庭云', heteronym=True)result2

结果如下:

[['yè', 'xié'], ['tíng'], ['yún']]

因为返回的是一个嵌套的list,所以需要简单调整一下

result_ = [i[0] for i in result1]result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()result3

结果如下:

'Ye Tingyun'

启用多音字模式时,竟然发现 ‘叶’ 也是多音字,查询了资料发现确实是这样,涨知识啦!


python 拼音转文字 python pinyin_java中文转拼音_03


python 拼音转文字 python pinyin_python 拼音转文字_04


下面是中文名转拼音首字母的方法


python 拼音转文字 python pinyin_java 中文转拼音_05


三、snownlp

最后一种办法是使用snownlp,同样的pip安装与导入如下:

# 安装pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com# 导入from snownlp import SnowNLP

中文名转拼音

s = SnowNLP('叶庭云')s.pinyin

结果如下:

['ye', 'ting', 'yun']

将list转为字符串

result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize()result4

结果如下:

'Ye Tingyun'


python 拼音转文字 python pinyin_python 拼音转文字_06


最后是中文名转拼音首字母


python 拼音转文字 python pinyin_java 中文转拼音_07


四、批量将中文名转换成拼音

现在,掌握了基本使用后,我们就能利用批量操作来解放双手

import pypinyinimport pandas as pddf = pd.read_excel('学生名单_test.xls')df.head()

先导入一份学生名单如下


python 拼音转文字 python pinyin_python 拼音转文字_08


下面是使用pypinyin批量将全部学生的中文姓名转换为拼音

pinyin_name = []first_pinyin = []for i in df['姓名']:    result = pypinyin.pinyin(i, style=pypinyin.NORMAL)    result_ = [i[0] for i in result]    result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize()    result3 = ''.join([i[0].upper() for i in result_])    print(result2, i, sep=' ')    pinyin_name.append(result2)    first_pinyin.append(result3)    df['英文名'] = pinyin_namedf['拼音首字母'] = first_pinyindf.head()

或者是转换为拼音首字母,运行结果如下:


python 拼音转文字 python pinyin_python 拼音转文字_09