有時在處理文件時候,我們需要將中文姓名轉(zhuǎn)換為拼音,或者是轉(zhuǎn)換為拼音首字母,本文將介紹三種Python實現(xiàn)的方法,最后給一個批量操作的代碼案例!
開門見山,Python中文字轉(zhuǎn)拼音可以使用xpinyin,直接使用pip安裝即可?
pip install xpinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
接著導(dǎo)入xpinyin下的 Pinyin 方法如下
from xpinyin import Pinyin
首先試試中文名轉(zhuǎn)拼音,
p = Pinyin() result1 = p.get_pinyin('葉伏天') result1
結(jié)果如下:
'ye-fu-tian'
tone_marks
可以顯示聲調(diào)
result2 = p.get_pinyin('葉伏天', tone_marks='marks')
結(jié)果如下:
'yè-fú-tiān'
去掉空格?
s = result1.split('-') result3 = s[0].capitalize() + ' ' + ''.join(s[1:]).capitalize() result3 結(jié)果如下: 'Ye Futian'
有時需要中文名轉(zhuǎn)拼音首字母,也很簡單?
另一種方法是使用pypinyin,安裝同樣可以使用pip
# 安裝 pip install pypinyin -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
直接導(dǎo)入就行?
import pypinyin
再來看看中文名轉(zhuǎn)拼音的實現(xiàn)辦法
result1 = pypinyin.pinyin('葉庭云', style=pypinyin.NORMAL) result1
結(jié)果如下:
[['ye'], ['ting'], ['yun']]
啟用多音節(jié)來實現(xiàn)聲調(diào)
result2 = pypinyin.pinyin('葉庭云', heteronym=True) result2
結(jié)果如下:
[['yè', 'xié'], ['tíng'], ['yún']]
因為返回的是一個嵌套的list,所以需要簡單調(diào)整一下
result_ = [i[0] for i in result1] result3 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() result3
結(jié)果如下:
'Ye Tingyun'
啟用多音字模式時,竟然發(fā)現(xiàn) ‘葉' 也是多音字,查詢了資料發(fā)現(xiàn)確實是這樣,漲知識啦!
下面是中文名轉(zhuǎn)拼音首字母的方法
最后一種辦法是使用snownlp,同樣的pip安裝與導(dǎo)入如下:
# 安裝 pip install snownlp -i http://pypi.douban.com/simple --trusted-host pypi.douban.com # 導(dǎo)入 from snownlp import SnowNLP
中文名轉(zhuǎn)拼音?
s = SnowNLP('葉庭云') s.pinyin
結(jié)果如下:
['ye', 'ting', 'yun']
將list轉(zhuǎn)為字符串
result4 = s.pinyin[0].capitalize() + ' ' + ''.join(s.pinyin[1:]).capitalize() result4
結(jié)果如下:
'Ye Tingyun'
最后是中文名轉(zhuǎn)拼音首字母
現(xiàn)在,掌握了基本使用后,我們就能利用批量操作來解放雙手
import pypinyin import pandas as pd df = pd.read_excel('學生名單_test.xls') df.head()
先導(dǎo)入一份學生名單如下
下面是使用pypinyin批量將全部學生的中文姓名轉(zhuǎn)換為拼音
pinyin_name = [] first_pinyin = [] for i in df['姓名']: result = pypinyin.pinyin(i, style=pypinyin.NORMAL) result_ = [i[0] for i in result] result2 = result_[0].capitalize() + ' ' + ''.join(result_[1:]).capitalize() result3 = ''.join([i[0].upper() for i in result_]) print(result2, i, sep=' ') pinyin_name.append(result2) first_pinyin.append(result3) df['英文名'] = pinyin_name df['拼音首字母'] = first_pinyin df.head()
或者是轉(zhuǎn)換為拼音首字母,運行結(jié)果如下:
以上就是python 批量將中文名轉(zhuǎn)換為拼音的詳細內(nèi)容,更多關(guān)于python 中文名轉(zhuǎn)換為拼音的資料請關(guān)注腳本之家其它相關(guān)文章!
標簽:哈爾濱 大慶 烏蘭察布 烏蘭察布 郴州 平頂山 合肥 海南
巨人網(wǎng)絡(luò)通訊聲明:本文標題《python 批量將中文名轉(zhuǎn)換為拼音》,本文關(guān)鍵詞 python,批量,將,中文名,轉(zhuǎn)換,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。