Python 自動化修改word的案例
利用Python docx模塊,可以很方便地打開和修改Word 2007及以后的文檔。本文簡單地介紹了如何使用python修改word文檔中的內容。
word文檔的內容是一封表揚信,內容見下圖:
表揚信.png
現在需要通過python對,”表揚信.docx”文檔進行修改,需要修改的地方已在圖中標記出。
1、第一個箭頭處,首行縮進2字符
2、第二個箭頭處,對段落進行左縮進2字符,并添加“向小z同學學習!”
3、第三個和第四個箭頭處,進行右對齊,并右縮進2cm
4、趙東來,修改為小z
5、陸亦可,修改為大Z
6、她,修改為他
7、狗糧,修改為貓糧
代碼如下:
from docx import Documentfrom docx.shared import Cmfrom docx.enum.text import WD_ALIGN_PARAGRAPHimport re document=Document(r'g:CSPython Scripts表揚信.docx')# 首先對段落格式進行修改,docx默認標題也屬于段落,因此“表揚信”是第一段paragraphs=document.paragraphsparagraphs[2].paragraph_format.first_line_indent=Cm(0.74)paragraphs[3].paragraph_format.left_indent=Cm(0.74)paragraphs[4].paragraph_format.alignment=WD_ALIGN_PARAGRAPH.RIGHTparagraphs[4].paragraph_format.right_indent=Cm(2)paragraphs[5].paragraph_format.alignment=WD_ALIGN_PARAGRAPH.RIGHTparagraphs[5].paragraph_format.right_indent=Cm(2)# 對文本進行修改# 修改第二段paragraphs[1].text='小Z同學:'# 將第三段陸亦可替換為大Z,她替換為他。通過python的正則表達式,可以很簡單地實現文本的替換和查找。text=re.sub(’陸亦可’,’大Z’,paragraphs[2].text)text=re.sub(’她’,’他’,text)paragraphs[2].text=text# 在第四段后面加上paragraphs[3].add_run('向小z同學學習!')# 修改表格里面的內容tables=document.tablestables[0].cell(1,0).text='貓糧'tables[0].cell(2,0).text='貓糧'tables[0].cell(3,0).text='貓糧'# 插入一張圖片,圖片寬度設置為11.8cmdocument.add_picture(’fun.jpg’, width=Cm(11.8))document.save()
運行代碼,結果見下圖:
修改后.png
本文對word文檔中的內容主要在如下幾方面進行了修改:
段落文字的替換和添加
段落排列的對齊和縮進
表格文字的修改
在文檔中插入圖片
docx模塊功能強大,還支持對word文檔,字體、顏色、樣式、章節、分頁符、制表位等的修改。通過python批量化操作word文檔,可以有效地節省時間,告別繁瑣重復的工作。
結論通過對word文檔段落、表格和圖片的操作,結合python的正則表達式,目前,可以想到的能實現的功能如下:
1、批量制作word名片、信件、通知等(功能與word郵件合并功能類似)
2、對多個文檔的內容進行一鍵提取和替換
3、通過docx模塊,python將Excel、郵件、網頁、matplotlib、支持python接口的軟件等資源整合在一起,提取相關信息,自動生成word報告
4、在女朋友面前裝逼
后續有時間,將對docx模塊中的paragraph(段落)、table(表格)等對象進行詳細的介紹。
補充:Python修改Word文檔內容和插入圖片
代碼如下
#!/usr/bin/python# coding:utf-8import docxdef main(): filepath = ’test.docx’ filepath1 = ’wtest.docx’ newdocx = docx.Document(filepath) table = newdocx.tables for oTable in table: rows_num = len(oTable.rows) columns_num = len(oTable.columns) cell = oTable.cell(3, 0) # cell.add_paragraph('a') cell.text = '' cell.paragraphs[-1].runs[0].add_picture(’t1.jpg’) print(rows_num) print(columns_num) newdocx.save(filepath1)if __name__ == ’__main__’: main()
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持好吧啦網。如有錯誤或未考慮完全的地方,望不吝賜教。
相關文章:
