手上現(xiàn)有若干份財(cái)務(wù)分析報(bào)告的Word文檔,如下:
每一份Word文檔中的內(nèi)容如下:
為了方便后續(xù)審閱,需要將所有文檔中所有含有資金的語句標(biāo)紅加粗,如圖所示
為了解決這個(gè)需求簡(jiǎn)單復(fù)習(xí)一下相關(guān)知識(shí)。Word文檔一般而言由文檔(document) - 段落(paragraph) - 文字塊(run) 三級(jí)結(jié)構(gòu)組成:
從需求反饋中可以看出,本質(zhì)上我們需要做的就是對(duì)所有含有資金的文字塊Run進(jìn)行樣式調(diào)整
因此,本需求的邏輯如下:
1.創(chuàng)建一個(gè)空文件夾(用于存放修改后的財(cái)務(wù)報(bào)告,避免直接對(duì)原文件修改)
2.通過glob獲取目標(biāo)文件夾下的所有Word路徑
3.利用docx模塊對(duì)每個(gè)Word文檔遍歷,并獲取包含特定詞的文字塊
4.對(duì)文字塊進(jìn)行樣式修改
首先導(dǎo)入需要的庫并設(shè)置目標(biāo)文件夾路徑
from docx import Document from docx.shared import RGBColor, Pt, Cm import os import glob # 此處更換創(chuàng)建文件夾的路徑 mkdir_path = r'C:\Users\xxx\new_dir' # 此處更換所有文件所在的位置 file_path = r'C:\Users\xxx\'
os和glob我們都很熟悉,這里簡(jiǎn)單介紹一下docx模塊 這是一個(gè)非標(biāo)準(zhǔn)庫,在命令行中我們需要輸入以下命令安裝:
pip install python-docx
尤其要注意安裝時(shí)候輸入的是python-docx,而實(shí)際調(diào)用時(shí)為docx
實(shí)例化具體的Word文檔代碼為:
from docx import Document wordfile = Document(path)
如果不指定路徑則為創(chuàng)建新的Word文檔,這點(diǎn)跟操作Excel的openpyxl不太一樣,有機(jī)會(huì)再做介紹。
現(xiàn)在我們建立文件夾存放新生成的文件,首先判斷文件夾是否存在,不存在時(shí)再運(yùn)行os.mkdir避免報(bào)錯(cuò)
if not os.path.exists(mkdir_path): os.mkdir(mkdir_path)
接著遍歷Word文檔,利用glob模塊的通配符,框架如下:
for file in glob.glob(file_path + '/*.docx'): pass
根據(jù)三級(jí)結(jié)構(gòu),一個(gè)文檔Document有一個(gè)或多個(gè)段落Paragragh,一個(gè)段落Paragraph有一個(gè)或多個(gè)文字塊Run,合起來代碼為:
for file in glob.glob(file_path + '/*.docx'): docx = Document(file) for paragraph in docx.paragraphs: for run in paragraph.runs: pass
最后我們針對(duì)特定詞修改樣式,遍歷到文字塊后就可以做判斷了
... for run in paragraph.runs: if '資金' in run.text: run.font.bold = True # 加粗 run.font.color.rgb = RGBColor(255, 0, 255) # 設(shè)置字體顏色 # 最后切記保存 docx.save(mkdir_path + '/' + os.path.basename(file))
當(dāng)然,除了修改字體顏色和加粗之外,還支持其他樣式的設(shè)置,以下列出常用的作為參考:
# 加粗 run.font.bold = True # 斜體 run.font.italic = True # 下劃線 run.font.underline = True # 刪除線 run.font.strike = True # 字號(hào) run.font.size = Pt(20) # 陰影 run.font.shadow = True # 字體顏色 run.font.color.rgb = RGBColor(255, 0, 255)
至此,整個(gè)需求就順利結(jié)束了,附上完整代碼:
from docx import Document from docx.shared import RGBColor, Pt, Cm import os import glob mkdir_path = r'C:\xxx\new_dir)' if not os.path.exists(mkdir_path): os.mkdir(mkdir_path) keyword = '資金' file_path = r'C:\Users\xxx' for file in glob.glob(file_path + '\*.docx'): docx = Document(file) for paragraph in docx.paragraphs: for run in paragraph.runs: if keyword in run.text: run.font.bold = True run.font.color.rgb = RGBColor(255, 0, 0) docx.save(mkdir_path + '/' + os.path.basename(file))
通過本文的Python自動(dòng)化腳本制作過程,我們可以再次體會(huì)Python辦公自動(dòng)化的強(qiáng)大!如果對(duì)自動(dòng)化代碼和數(shù)據(jù)感興趣可以在后臺(tái)回復(fù)自動(dòng)化獲取。
當(dāng)然除了調(diào)整Word字體顏色,其他的大多數(shù)樣式調(diào)整都可以使用Python完成,也可以與Excel和PPT結(jié)合,這些就留給讀者自己開發(fā)。
最后還是希望大家能夠理解Python辦公自動(dòng)化的一個(gè)核心就是批量操作-解放雙手,讓復(fù)雜的工作自動(dòng)化!
以上就是Python快速優(yōu)雅的批量修改Word文檔樣式的詳細(xì)內(nèi)容,更多關(guān)于Python 批量修改Word文檔樣式的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
標(biāo)簽:株洲 潛江 常德 通遼 呂梁 銅川 黑龍江 阿里
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python快速優(yōu)雅的批量修改Word文檔樣式》,本文關(guān)鍵詞 Python,快速,優(yōu)雅,的,批量,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。