這里演示一下文本中提取中文年份
import re m0 = "在一九四九年新中國(guó)成立比一九九零年低百分之五點(diǎn)二人一九九六年擊敗俄軍,取得實(shí)質(zhì)獨(dú)立" pattrern1 = '[零一二三四五六七八九]{4,}' pattrern2 = '[〇一二三四五六七八九零壹貳叁肆伍陸柒捌玖貮兩]{4,}' time1 = re.findall(pattrern1,m0)#轉(zhuǎn)化數(shù)字
提取年份如:‘1949', ‘1990', ‘1996'
這里給出許多正則表達(dá)式的樣例:example
創(chuàng)建一個(gè)字典然后講數(shù)字進(jìn)項(xiàng)匹配:
CN_NUM = { '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0, '壹': 1, '貳': 2, '叁': 3, '肆': 4, '伍': 5, '陸': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '兩': 2,} for i in range(len(time1)): new_str = '' for j in time1[i]: new_str += str(CN_NUM[j]) time1[i] = new_str time1
這樣結(jié)果就出來(lái)啦,成功將上文例子中文年份轉(zhuǎn)化成阿拉伯?dāng)?shù)字:‘1949', ‘1990', ‘1996'
# 2、將句子中年份的大寫(xiě)數(shù)字改為阿拉伯?dāng)?shù)字 import re m0 = "在一九四九年新中國(guó)成立比一九九零年低百分之五點(diǎn)二人一九九六年擊敗俄軍,取得實(shí)質(zhì)獨(dú)立" pattrern1 = '[零一二三四五六七八九]{4,}' pattrern2 = '[〇一二三四五六七八九零壹貳叁肆伍陸柒捌玖貮兩]{4,}' time1 = re.findall(pattrern1,m0)#轉(zhuǎn)化數(shù)字 CN_NUM = { '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0, '壹': 1, '貳': 2, '叁': 3, '肆': 4, '伍': 5, '陸': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '兩': 2,} for i in range(len(time1)): new_str = '' for j in time1[i]: new_str += str(CN_NUM[j]) time1[i] = new_str time1
到此這篇關(guān)于python將中文數(shù)字轉(zhuǎn)化成阿拉伯?dāng)?shù)字的文章就介紹到這了,更多相關(guān)python中文數(shù)字轉(zhuǎn)阿拉伯?dāng)?shù)字內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
標(biāo)簽:懷化 浙江 石家莊 梅州 昆明 錫林郭勒盟 文山 西寧
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python將中文數(shù)字轉(zhuǎn)化成阿拉伯?dāng)?shù)字的簡(jiǎn)單方法》,本文關(guān)鍵詞 python,將,中文,數(shù)字,轉(zhuǎn),化成,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。