当前位置:   article > 正文

Python办公自动化之Word文档自动化:全网最全,看这一篇就够了!

python word库

作者丨超级大洋葱806

来源丨杰哥的IT之旅

https://blog.csdn.net/u014779536/article/details/108418066

环境安装

使用Python操作word大部分情况都是写操作,也有少许情况会用到读操作,在本次教程中都会进行讲解,本次课程主要用到以下4个库,请大家提前安装。

升级pip(便于安装最新库)

python -m pip install -U pip setuptools

c65a9f3f72460b9757c2ebf1f9f20a5a.png

python-docx(我们大部分操作都是使用此库)

安装方法:

pip install python-docx

80c8b7edc4eb781bf6a97db9013e7b57.png

使用方法:

  1. from docx import Document
  2. from docx.shared import Inches

官方文档:

https://python-docx.readthedocs.io/en/latest/index.html

win32com(主要用作doc转docx格式转换用)

安装方法:

pip install pypiwin32

99493306b06ebe5d5a5ece010f17ffa9.png

使用方法:

  1. import win32com
  2. from win32com.client import Dispatch, constants

官方文档:

https://docs.microsoft.com/en-us/dotnet/api/microsoft.office.interop.word?view=word-pia

mailmerge(用作按照模板生成大量同类型文档)

安装方法:

pip install docx-mailmerge

78498f632265fe1b3b8b74f877604e6d.png

使用方法:

from mailmerge import MailMerge

官方文档:

https://pypi.org/project/docx-mailmerge/

matplotlib(Python 的绘图库,本期简单讲解,后期会有专门的课程)

安装方法:

pip install matplotlib

0ee8a4448555c5abd6c71d18cab3d536.png

使用方法:

import matplotlib.pyplot as plt

官方文档:

https://matplotlib.org/3.2.2/tutorials/introductory/sample_plots.html

9ce5d62f1113b79edf2a6c10c66798ba.png

Python-docx 新建文档

示例代码1:

  1. from docx import Document
  2. document = Document()
  3. document.save('new.docx')

效果如下:

12beaaa24bafe8bba02f72834bb15e35.png

示例代码 0.1 Python-docx新建文档.py:

  1. from docx import Document
  2. def GenerateNewWord(filename):
  3.     document = Document()
  4.     document.save(filename)
  5. if __name__ == "__main__":
  6.     print("大家好!我们今天开始学习word文档自动化")
  7.     print("我们先来直接生成一个名为‘new.docx’的文档")
  8.     document = Document()
  9.     document.save('new.docx')
  10.     print("没错,里面什么都没有")
  11.     # 我是华丽的分隔符
  12.     print("我们使用函数生成一个word文档试试")
  13.     newname = '使用函数生成的文档.docx'
  14.     GenerateNewWord(newname)

效果如下:

dd2c00b18f8f8c0422f930a8caceed79.png

Python-docx 编辑已存在文档

我们很多时候需要在已存在的word文档上添加自己的内容,那么我们赶紧看看应该怎样操作吧~

旧文档:

006f07e0462059901e90c65ad4e1742a.png

  1. from docx import Document
  2. document = Document('exist.docx')
  3. document.save('new.docx')

也许你会说,没有没搞错,就这三句话?是的,就这三句,你就完成了旧文档的复制,如果你想修改,直接添加内容就行了呢!

效果如下:

7c398f63ee54a7b5d474affe826c4c6a.png

win32com 将 doc 转为 docx

旧文档:

35179120ed0ed8ba1fac23b52a0164d2.png

示例代码:

  1. import os
  2. from win32com import client as wc
  3. def TransDocToDocx(oldDocName,newDocxName):
  4.     print("我是 TransDocToDocx 函数")
  5.     # 打开word应用程序
  6.     word = wc.Dispatch('Word.Application')
  7.     # 打开 旧word 文件
  8.     doc = word.Documents.Open(oldDocName)
  9.     # 保存为 新word 文件,其中参数 12 表示的是docx文件
  10.     doc.SaveAs(newDocxName, 12)
  11.     # 关闭word文档
  12.     doc.Close()
  13.     word.Quit()
  14.     print("生成完毕!")
  15. if __name__ == "__main__":
  16.     # 获取当前目录完整路径
  17.     currentPath = os.getcwd()
  18.     print("当前路径为:",currentPath)
  19.     # 获取 旧doc格式word文件绝对路径名
  20.     docName = os.path.join(currentPath,'旧doc格式文档.doc')
  21.     print("docFilePath = ", docName)
  22.     # 设置新docx格式文档文件名
  23.     docxName = os.path.join(currentPath,'新生成docx格式文档.docx')
  24.     TransDocToDocx(docName,docxName)

效果如下:

c3d5e1fd95f1dd88b83e4fff26f589f6.png

597c780fa34a4dd8811ad9f165834569.png

win32com 操作 word

打开新的word文档并添加内容

示例代码:

  1. import win32com
  2. from win32com.client import Dispatch, constants
  3. import os
  4. # 创建新的word文档
  5. def funOpenNewFile():
  6.     word = Dispatch('Word.Application')
  7.     # 或者使用下面的方法,使用启动独立的进程:
  8.     # word = DispatchEx('Word.Application')
  9.     # 如果不声明以下属性,运行的时候会显示的打开word
  10.     word.Visible = 1  # 0:后台运行 1:前台运行(可见)
  11.     word.DisplayAlerts = 0  # 不显示,不警告
  12.     # 创建新的word文档
  13.     doc = word.Documents.Add()
  14.     # 在文档开头添加内容
  15.     myRange1 = doc.Range(00)
  16.     myRange1.InsertBefore('Hello word\n')
  17.     # 在文档末尾添加内容
  18.     myRange2 = doc.Range()
  19.     myRange2.InsertAfter('Bye word\n')
  20.     # 在文档i指定位置添加内容
  21.     i = 0
  22.     myRange3 = doc.Range(0, i)
  23.     myRange3.InsertAfter("what's up, bro?\n")
  24.     # doc.Save()  # 保存
  25.     doc.SaveAs(os.getcwd() + "\\funOpenNewFile.docx")  # 另存为
  26.     doc.Close()  # 关闭 word 文档
  27.     word.Quit()  # 关闭 office
  28. if __name__ == '__main__':
  29.     print("当前文件路径名:",os.getcwd())
  30.     print("调用funOpenNewFile()")
  31.     funOpenNewFile()

效果如下:

7753c67612c56a631b8eab79a9bf1cf0.png

打开已存在word文档并添加内容

前提条件:

abb1c37ca5242533f4b2ee4fe74dac9a.png

示例代码:

  1. import win32com
  2. from win32com.client import Dispatch, constants
  3. import os
  4. # 打开已存在的word文件
  5. def funOpenExistFile():
  6.     word = Dispatch('Word.Application')
  7.     # 或者使用下面的方法,使用启动独立的进程:
  8.     # word = DispatchEx('Word.Application')
  9.     # 如果不声明以下属性,运行的时候会显示的打开word
  10.     word.Visible = 1  # 0:后台运行 1:前台运行(可见)
  11.     word.DisplayAlerts = 0  # 不显示,不警告
  12.     doc = word.Documents.Open(os.getcwd() + "\\3.1 win32com测试.docx") # 打开一个已有的word文档
  13.     # 在文档开头添加内容
  14.     myRange1 = doc.Range(00)
  15.     myRange1.InsertBefore('Hello word\n')
  16.     # 在文档末尾添加内容
  17.     myRange2 = doc.Range()
  18.     myRange2.InsertAfter('Bye word\n')
  19.     # 在文档i指定位置添加内容
  20.     i = 0
  21.     myRange3 = doc.Range(0, i)
  22.     myRange3.InsertAfter("what's up, bro?\n")
  23.     # doc.Save()  # 保存
  24.     doc.SaveAs(os.getcwd() + "\\funOpenExistFile.docx")  # 另存为
  25.     doc.Close()  # 关闭 word 文档
  26.     word.Quit()  # 关闭 office
  27. if __name__ == '__main__':
  28.     print("当前文件路径名:",os.getcwd())
  29.     print("调用funOpenExistFile()")
  30.     funOpenExistFile()

效果如下:

6c25ef0c505eb98bb8ac21579972dd2d.png

转换word为pdf

示例代码:

  1. import win32com
  2. from win32com.client import Dispatch, constants
  3. import os
  4. # 生成Pdf文件
  5. def funGeneratePDF():
  6.     word = Dispatch("Word.Application")
  7.     word.Visible = 0  # 后台运行,不显示
  8.     word.DisplayAlerts = 0  # 不警告
  9.     doc = word.Documents.Open(os.getcwd() + "\\3.3 win32com转换word为pdf等格式.docx") # 打开一个已有的word文档
  10.     doc.SaveAs(os.getcwd() + "\\3.3 win32com转换word为pdf等格式.pdf"17)  # txt=4, html=10, docx=16, pdf=17
  11.     doc.Close()
  12.     word.Quit()
  13. if __name__ == '__main__':
  14.     funGeneratePDF()

效果如下:

a5a440d4dbcec7f88192fb43ad7a0bca.png

Python-docx 操作 word

官方文档:(最权威指南,没有之一)

https://python-docx.readthedocs.io/en/latest/

Python-docx官方例程

前提条件:

8f344079a40c427ab066ec40c5dfc3c4.png

示例代码:

  1. from docx import Document
  2. from docx.shared import Inches
  3. document = Document()
  4. document.add_heading('Document Title'0)
  5. p = document.add_paragraph('A plain paragraph having some ')
  6. p.add_run('bold').bold = True
  7. p.add_run(' and some ')
  8. p.add_run('italic.').italic = True
  9. document.add_heading('Heading, level 1', level=1)
  10. document.add_paragraph('Intense quote', style='Intense Quote')
  11. document.add_paragraph(
  12.     'first item in unordered list', style='List Bullet'
  13. )
  14. document.add_paragraph(
  15.     'first item in ordered list', style='List Number'
  16. )
  17. document.add_picture('countrygarden.png', width=Inches(1.25))
  18. records = (
  19.     (3'101''Spam'),
  20.     (7'422''Eggs'),
  21.     (4'631''Spam, spam, eggs, and spam')
  22. )
  23. table = document.add_table(rows=1, cols=3)
  24. hdr_cells = table.rows[0].cells
  25. hdr_cells[0].text = 'Qty'
  26. hdr_cells[1].text = 'Id'
  27. hdr_cells[2].text = 'Desc'
  28. for qty, id, desc in records:
  29.     row_cells = table.add_row().cells
  30.     row_cells[0].text = str(qty)
  31.     row_cells[1].text = id
  32.     row_cells[2].text = desc
  33. document.add_page_break()
  34. document.save('4.1 Python-docx官方例程.docx')

最终效果:

15df7d0007cdcf93233a62e77975439a.png

c0f9058b146c1a4b03b2ff740734e554.png

b4106ea763c623d562fe03de7b1c07c9.png

Python-docx官方例程解析

5d44a6ae6ecf7ac643db75733a1bc57e.png

e6019715903924c8bbdd274d6f140253.png

导入库操作

from docx import Document

导入英寸单位操作(可用于指定图片大小、表格宽高等)

from docx.shared import Inches

新建一个文档

document = Document()

加载旧文档(用于修改或添加内容)

document = Document('exist.docx')

添加标题段落

document.add_heading('Document Title'0)

b26a5103a7d77aa668517991ade86732.png

添加段落操作

段落在 Word 中是基本内容。它们用于正文文本,也用于标题和项目列表(如项目符号)。

p = document.add_paragraph('A plain paragraph having some ')

在指定段落上添加内容

  1. p.add_run('bold').bold = True   # 添加粗体文字
  2. p.add_run(' and some ')     # 添加默认格式文字
  3. p.add_run('italic.').italic = True  # 添加斜体文字

6159d6682d9db955a7b04bdd4967b8d7.png

添加标题操作

等级1-9 也就是标题1-标题9,我们可以在旧文档中将标题格式设置好,使用Python-docx打开旧文档,再添加相应等级标题即可。

document.add_heading('Heading, level 1', level=1)

3e06928b340335fda14589f490153b5e.png

添加指定样式段落

样式详情:

https://python-docx.readthedocs.io/en/latest/user/styles-understanding.html#understanding-styles

  1. document.add_paragraph('Intense quote', style='Intense Quote')
  2. # 以下两句的含义等同于上面一句
  3. p = document.add_paragraph('Intense quote')
  4. p.style = 'Intense Quote'

添加无序列表操作

document.add_paragraph( 'first item in unordered list', style='List Bullet')

添加有序列表操作

document.add_paragraph( 'first item in ordered list', style='List Number')

792b784239b6553cec4abddee693ab6f.png

添加图片操作

第一个参数为图片路径,需要正确无误

第二个参数为图片大小,单位英寸

document.add_picture('countrygarden.png', width=Inches(1.25))

c2df2067e64c82f20a29388debcaaf79.png

新建表格操作

table = document.add_table(rows=1, cols=3)

填充标题行操作

  1. hdr_cells = table.rows[0].cells
  2. hdr_cells[0].text = 'Qty'
  3. hdr_cells[1].text = 'Id'
  4. hdr_cells[2].text = 'Desc'

为每组内容添加数据行并填充

  1. for qty, id, desc in records:
  2.     row_cells = table.add_row().cells
  3.     row_cells[0].text = str(qty)
  4.     row_cells[1].text = id
  5.     row_cells[2].text = desc

设置标题样式操作

table.style = 'LightShading-Accent1'

386c8fadd715375f75a5ee4d3730c335.png

添加分页符操作

document.add_page_break()

保存当前文档操作

document.save('4.1 Python-docx官方例程.docx')

Python-docx 表格样式设置

表格样式设置代码:

  1. from docx import *
  2. document = Document()
  3. table = document.add_table(33, style="Medium Grid 1 Accent 1")
  4. heading_cells = table.rows[0].cells
  5. heading_cells[0].text = '第一列内容'
  6. heading_cells[1].text = '第二列内容'
  7. heading_cells[2].text = '第三列内容'
  8. document.save("demo.docx")

遍历所有样式:

  1. from docx.enum.style import WD_STYLE_TYPE
  2. from docx import Document
  3. document = Document()
  4. styles = document.styles
  5. # 生成所有表样式
  6. for s in styles:
  7.     if s.type == WD_STYLE_TYPE.TABLE:
  8.         document.add_paragraph("表格样式 :  " + s.name)
  9.         table = document.add_table(33, style=s)
  10.         heading_cells = table.rows[0].cells
  11.         heading_cells[0].text = '第一列内容'
  12.         heading_cells[1].text = '第二列内容'
  13.         heading_cells[2].text = '第三列内容'
  14.         document.add_paragraph("\n")
  15. document.save('4.3 所有表格样式.docx')

效果如下(大家按照喜欢的样式添加即可):

f5655c0e0542953ddb22d96a120ebbc8.png

f1b99e8cd68785325effab3ff2ed7206.png

docx&matplotlib 自动生成数据分析报告

最终效果

15edd0006a5e6ab02817ab9a6f4a11b9.png

数据获取

我们这里使用xlrd作为数据获取所使用的库,简单回顾一下:

  1. import xlrd
  2. xlsx = xlrd.open_workbook('./3_1 xlrd 读取 操作练习.xlsx')
  3. # 通过sheet名查找:xlsx.sheet_by_name("sheet1")
  4. # 通过索引查找:xlsx.sheet_by_index(3)
  5. table = xlsx.sheet_by_index(0)
  6. # 获取单个表格值 (2,1)表示获取第3行第2列单元格的值
  7. value = table.cell_value(21)
  8. print("第3行2列值为",value)
  9. # 获取表格行数
  10. nrows = table.nrows
  11. print("表格一共有",nrows,"行")
  12. # 获取第4列所有值(列表生成式)
  13. name_list = [str(table.cell_value(i, 3)) for i in range(1, nrows)]
  14. print("第4列所有的值:",name_list)

表格内容:

2fb485b8b1018f595145e2df253d8556.png

编写数据获取代码:

我们这里只获取用户姓名和,分数,并将它们保存到列表中,看代码。

  1. # 获取学习成绩信息
  2. def GetExcelInfo():
  3.     print("开始获取表格内容信息")
  4.     # 打开指定文档
  5.     xlsx = xlrd.open_workbook('学生成绩表格.xlsx')
  6.     # 获取sheet
  7.     sheet = xlsx.sheet_by_index(0)
  8.     # 获取表格行数
  9.     nrows = sheet.nrows
  10.     print("一共 ",nrows," 行数据")
  11.     # 获取第2列,和第4列 所有值(列表生成式),从第2行开始获取
  12.     nameList = [str(sheet.cell_value(i, 1)) for i in range(1, nrows)]
  13.     scoreList = [int(sheet.cell_value(i, 3)) for i in range(1, nrows)]
  14.     # 返回名字列表和分数列表
  15.     return nameList,scoreList

获取结果:

ca4243de2b2a8d1d75be9e42c51c5876.png

柱状图生成

我们先将获取的姓名和成绩使用 字典 数据结构关联起来,再对其排序:

  1. # 将名字和分数列表合并成字典(将学生姓名和分数关联起来)
  2. scoreDictionary = dict(zip(nameList, scoreList))
  3. print("dictionary:",scoreDictionary)
  4. # 对字典进行值排序,高分在前,reverse=True 代表降序排列
  5. scoreOrder = sorted(scoreDictionary.items(), key=lambda x: x[1], reverse=True)
  6. print("scoreOrder",scoreOrder)

效果如下:

  1. # 合成的字典
  2. dictionary: {'Dillon Miller'41'Laura Robinson'48'Gabrilla Rogers'28'Carlos Chen'54'Leonard Humphrey'44'John Hall'63'Miranda Nelson'74'Jessica Morgan'34'April Lawrence'67'Cindy Brown'52'Cassandra Fernan'29'April Crawford'91'Jennifer Arias'61'Philip Walsh'58'Christina Hill P'14'Justin Dunlap'56'Brian Lynch'84'Michael Brown'68}
  3. # 排序后,再次转换成列表
  4. scoreOrder [('April Crawford'91), ('Brian Lynch'84), ('Miranda Nelson'74), ('Michael Brown'68), ('April Lawrence'67), ('John Hall'63), ('Jennifer Arias'61), ('Philip Walsh'58), ('Justin Dunlap'56), ('Carlos Chen'54), ('Cindy Brown'52), ('Laura Robinson'48), ('Leonard Humphrey'44), ('Dillon Miller'41), ('Jessica Morgan'34), ('Cassandra Fernan'29), ('Gabrilla Rogers'28), ('Christina Hill P'14)]

a70163d31e063da1050f55690c606165.png

使用 matplotlib 生成柱状图:

  1. # 生成学生成绩柱状图(使用matplotlib)
  2. # 会生成一张名为"studentScore.jpg"的图片
  3. def GenerateScorePic(scoreList):
  4.     # 解析成绩列表,生成横纵坐标列表
  5.     xNameList = [str(studentInfo[0]) for studentInfo in scoreList]
  6.     yScoreList = [int(studentInfo[1]) for studentInfo in scoreList]
  7.     print("xNameList",xNameList)
  8.     print("yScoreList",yScoreList)
  9.     # 设置字体格式
  10.     matplotlib.rcParams['font.sans-serif'] = ['SimHei']  # 用黑体显示中文
  11.     # 设置绘图尺寸
  12.     plt.figure(figsize=(10,5))
  13.     # 绘制图像
  14.     plt.bar(x=xNameList, height=yScoreList, label='学生成绩', color='steelblue', alpha=0.8)
  15.     # 在柱状图上显示具体数值, ha参数控制水平对齐方式, va控制垂直对齐方式
  16.     for x1, yy in scoreList:
  17.         plt.text(x1, yy + 1, str(yy), ha='center', va='bottom', fontsize=16, rotation=0)
  18.     # 设置标题
  19.     plt.title("学生成绩柱状图")
  20.     # 为两条坐标轴设置名称
  21.     plt.xlabel("学生姓名")
  22.     plt.ylabel("学生成绩")
  23.     # 显示图例
  24.     plt.legend()
  25.     # 坐标轴旋转
  26.     plt.xticks(rotation=90)
  27.     # 设置底部比例,防止横坐标显示不全
  28.     plt.gcf().subplots_adjust(bottom=0.25)
  29.     # 保存为图片
  30.     plt.savefig("studentScore.jpg")
  31.     # 直接显示
  32.     plt.show()

效果如下:

2ee538404dfeb09e1bc16832bed307ac.png

生成最终报告

代码如下:

  1. # 开始生成报告
  2. def GenerateScoreReport(scoreOrder,picPath):
  3.     # 新建一个文档
  4.     document = Document()
  5.     # 设置标题
  6.     document.add_heading('数据分析报告'0)
  7.     # 添加第一名的信息
  8.     p1 = document.add_paragraph("分数排在第一的学生姓名为: ")
  9.     p1.add_run(scoreOrder[0][0]).bold = True
  10.     p1.add_run(" 分数为: ")
  11.     p1.add_run(str(scoreOrder[0][1])).italic = True
  12.     # 添加总体情况信息
  13.     p2 = document.add_paragraph("共有: ")
  14.     p2.add_run(str(len(scoreOrder))).bold = True
  15.     p2.add_run(" 名学生参加了考试,学生考试的总体情况: ")
  16.     # 添加考试情况表格
  17.     table = document.add_table(rows=1, cols=2)
  18.     table.style = 'Medium Grid 1 Accent 1'
  19.     hdr_cells = table.rows[0].cells
  20.     hdr_cells[0].text = '学生姓名'
  21.     hdr_cells[1].text = '学生分数'
  22.     for studentName,studentScore in scoreOrder:
  23.         row_cells = table.add_row().cells
  24.         row_cells[0].text = studentName
  25.         row_cells[1].text = str(studentScore)
  26.     # 添加学生成绩柱状图
  27.     document.add_picture(picPath, width=Inches(6))
  28.     document.save('学生成绩报告.docx')

9ff6d639158909109d9df0a981a275ad.png

完整代码

  1. import xlrd
  2. import matplotlib
  3. import matplotlib.pyplot as plt
  4. from docx import Document
  5. from docx.shared import Inches
  6. # 获取学习成绩信息
  7. def GetExcelInfo():
  8.     print("开始获取表格内容信息")
  9.     # 打开指定文档
  10.     xlsx = xlrd.open_workbook('学生成绩表格.xlsx')
  11.     # 获取sheet
  12.     sheet = xlsx.sheet_by_index(0)
  13.     # 获取表格行数
  14.     nrows = sheet.nrows
  15.     print("一共 ",nrows," 行数据")
  16.     # 获取第2列,和第4列 所有值(列表生成式),从第2行开始获取
  17.     nameList = [str(sheet.cell_value(i, 1)) for i in range(1, nrows)]
  18.     scoreList = [int(sheet.cell_value(i, 3)) for i in range(1, nrows)]
  19.     # 返回名字列表和分数列表
  20.     return nameList,scoreList
  21. # 生成学生成绩柱状图(使用matplotlib)
  22. # 会生成一张名为"studentScore.jpg"的图片
  23. def GenerateScorePic(scoreList):
  24.     # 解析成绩列表,生成横纵坐标列表
  25.     xNameList = [str(studentInfo[0]) for studentInfo in scoreList]
  26.     yScoreList = [int(studentInfo[1]) for studentInfo in scoreList]
  27.     print("xNameList",xNameList)
  28.     print("yScoreList",yScoreList)
  29.     # 设置字体格式
  30.     matplotlib.rcParams['font.sans-serif'] = ['SimHei']  # 用黑体显示中文
  31.     # 设置绘图尺寸
  32.     plt.figure(figsize=(10,5))
  33.     # 绘制图像
  34.     plt.bar(x=xNameList, height=yScoreList, label='学生成绩', color='steelblue', alpha=0.8)
  35.     # 在柱状图上显示具体数值, ha参数控制水平对齐方式, va控制垂直对齐方式
  36.     for x1, yy in scoreList:
  37.         plt.text(x1, yy + 1, str(yy), ha='center', va='bottom', fontsize=16, rotation=0)
  38.     # 设置标题
  39.     plt.title("学生成绩柱状图")
  40.     # 为两条坐标轴设置名称
  41.     plt.xlabel("学生姓名")
  42.     plt.ylabel("学生成绩")
  43.     # 显示图例
  44.     plt.legend()
  45.     # 坐标轴旋转
  46.     plt.xticks(rotation=90)
  47.     # 设置底部比例,防止横坐标显示不全
  48.     plt.gcf().subplots_adjust(bottom=0.25)
  49.     # 保存为图片
  50.     plt.savefig("studentScore.jpg")
  51.     # 直接显示
  52.     plt.show()
  53. # 开始生成报告
  54. def GenerateScoreReport(scoreOrder,picPath):
  55.     # 新建一个文档
  56.     document = Document()
  57.     # 设置标题
  58.     document.add_heading('数据分析报告'0)
  59.     # 添加第一名的信息
  60.     p1 = document.add_paragraph("分数排在第一的学生姓名为: ")
  61.     p1.add_run(scoreOrder[0][0]).bold = True
  62.     p1.add_run(" 分数为: ")
  63.     p1.add_run(str(scoreOrder[0][1])).italic = True
  64.     # 添加总体情况信息
  65.     p2 = document.add_paragraph("共有: ")
  66.     p2.add_run(str(len(scoreOrder))).bold = True
  67.     p2.add_run(" 名学生参加了考试,学生考试的总体情况: ")
  68.     # 添加考试情况表格
  69.     table = document.add_table(rows=1, cols=2)
  70.     table.style = 'Medium Grid 1 Accent 1'
  71.     hdr_cells = table.rows[0].cells
  72.     hdr_cells[0].text = '学生姓名'
  73.     hdr_cells[1].text = '学生分数'
  74.     for studentName,studentScore in scoreOrder:
  75.         row_cells = table.add_row().cells
  76.         row_cells[0].text = studentName
  77.         row_cells[1].text = str(studentScore)
  78.     # 添加学生成绩柱状图
  79.     document.add_picture(picPath, width=Inches(6))
  80.     document.save('学生成绩报告.docx')
  81. if __name__ == "__main__":
  82.     # 调用信息获取方法,获取用户信息
  83.     nameList,scoreList = GetExcelInfo()
  84.     # print("nameList:",nameList)
  85.     # print("ScoreList:",scoreList)
  86.     # 将名字和分数列表合并成字典(将学生姓名和分数关联起来)
  87.     scoreDictionary = dict(zip(nameList, scoreList))
  88.     # print("dictionary:",scoreDictionary)
  89.     # 对字典进行值排序,高分在前,reverse=True 代表降序排列
  90.     scoreOrder = sorted(scoreDictionary.items(), key=lambda x: x[1], reverse=True)
  91.     # print("scoreOrder",scoreOrder)
  92.     # 将进行排序后的学生成绩列表生成柱状图
  93.     GenerateScorePic(scoreOrder)
  94.     # 开始生成报告
  95.     picPath = "studentScore.jpg"
  96.     GenerateScoreReport(scoreOrder,picPath)
  97.     print("任务完成,报表生成完毕!")

Python-docx 修改旧 word 文档

回顾:打开旧文档,并另存为新文档

我们这里就拿上一节生成的学生成绩报告作为示例:

  1. from docx import Document
  2. if __name__ == "__main__":
  3.     document = Document('6 学生成绩报告.docx')
  4.     # 在这里进行操作,此处忽略
  5.     document.save('修改后的报告.docx')

读取word文档的内容

示例代码:

  1. from docx import Document
  2. if __name__ == "__main__":
  3.     document = Document('6 学生成绩报告.docx')
  4.     # 读取 word 中所有内容
  5.     for p in document.paragraphs:
  6.         print("paragraphs:",p.text)
  7.     # 读取 word 中所有一级标题
  8.     for p in document.paragraphs:
  9.         if p.style.name == 'Heading 1':
  10.             print("Heading 1:",p.text)
  11.     # 读取 word 中所有二级标题
  12.     for p in document.paragraphs:
  13.         if p.style.name == 'Heading 2':
  14.             print("Heading 2:", p.text)
  15.     # 读取 word 中所有正文
  16.     for p in document.paragraphs:
  17.         if p.style.name == 'Normal':
  18.             print("Normal:", p.text)
  19.     document.save('修改后的报告.docx')

效果如下:

d4d842591ee8d8e26dbc15443d21cedb.png

a72d7dff2dc0c1699132905a2950da70.png

读取docx中表格内容

示例代码:

  1. from docx import Document
  2. if __name__ == "__main__":
  3.     document = Document('6 学生成绩报告.docx')
  4.     # 读取表格内容
  5.     for tb in document.tables:
  6.         for i,row in enumerate(tb.rows):
  7.             for j,cell in enumerate(row.cells):
  8.                 text = ''
  9.                 for p in cell.paragraphs:
  10.                     text += p.text
  11.                 print(f'第{i}行,第{j}列的内容{text}')
  12.     document.save('修改后的报告.docx')

效果如下:

b47576413dca672d6eee3c1a3cf3f621.png

修改word中的内容

示例代码:

  1. from docx import Document
  2. if __name__ == "__main__":
  3.     document = Document('6 学生成绩报告.docx')
  4.     # 修改 word 中所有内容
  5.     for p in document.paragraphs:
  6.         p.text = "修改后的段落内容"
  7.     # 修改表格内容
  8.     for tb in document.tables:
  9.         for i,row in enumerate(tb.rows):
  10.             for j,cell in enumerate(row.cells):
  11.                 text = ''
  12.                 for p in cell.paragraphs:
  13.                     p.text = ("第",str(i),"行",str(j),"列")
  14.                 print(f'第{i}行,第{j}列的内容{text}')
  15.     document.save('6.4 修改后的报告.docx')

效果如下:

d4eaec9e5273a4ca2bf63e8ef78ca213.png

docx-mailmerge 自动生成万份劳动合同

创建合同模板

添加内容框架

ae168753f66a46cc2062c7f7e9b76203.png

创建一个域

e13e2ea9950a79891783770345cc6ed9.png

设置域名

d71feb55dba625ef5a3aa1b78e316636.png

9cce35a9943473fd02c081540685bb83.png

依次全部添加

c1bccb3f69a6d32aef74395d40f3dfc8.png

生成1份证明

示例代码:

  1. from mailmerge import MailMerge
  2. template = '薪资证明模板.docx'
  3. document = MailMerge(template)
  4. document.merge(name = '唐星',
  5.                id = '1010101010',
  6.                year = '2020',
  7.                salary = '99999',
  8.                job = '嵌入式软件开发工程师')
  9. document.write('生成的1份证明.docx')

效果如下:

84df5035481ff0bebdcafe98fa7b39cb.png

哈哈哈哈!!月入10万,走向人生巅峰~

生成10000份证明

示例代码:

  1. from mailmerge import MailMerge
  2. from datetime import datetime
  3. # 生成单份合同
  4. def GenerateCertify(templateName,newName):
  5.     # 打开模板
  6.     document = MailMerge(templateName)
  7.     # 替换内容
  8.     document.merge(name='唐星',
  9.                    id='1010101010',
  10.                    year='2020',
  11.                    salary='99999',
  12.                    job='嵌入式软件开发工程师')
  13.     # 保存文件
  14.     document.write(newName)
  15. if __name__ == "__main__":
  16.     templateName = '薪资证明模板.docx'
  17.     # 获得开始时间
  18.     startTime = datetime.now()
  19.     # 开始生成
  20.     for i in range(10000):
  21.         newName = f'./10000份证明/薪资证明{i}.docx'
  22.         GenerateCertify(templateName,newName)
  23.     # 获取结束时间
  24.     endTime = datetime.now()
  25.     # 计算时间差
  26.     allSeconds = (endTime - startTime).seconds
  27.     print("生成10000份合同一共用时: ",str(allSeconds)," 秒")
  28.     print("程序结束!")

效果如下:

530059511e3b8357e3313f0c687f2998.png

0d395a4e968c04323d84bab0a6c0e064.png

只花了89秒,平均不到 0.01 就能生成一个!!快

26b284b2c758c9ddde30fa95cf7bb653.png


最后是广告时间,推荐一下我们的会员群(不喜欢可以忽略哈),目前有风投天使投资人,猎头HR,抖音大V,情感博主,律师,心理咨询师,医疗销售,地产,保险,钢琴老师,运营商,企业咨询,跨境电商,建筑,互联网行业的数据分析师,后端开发,python测试等行业的同学加入。

微信咨询:coder_v5 (务必备注你的来意)

 
 

微信长按试看内容

三天内不满意可直接退款!!!

d4fccf14a97e032b2093a8209cdbab23.png

  1. 推荐阅读:
  2. 入门: 最全的零基础学Python的问题  | 零基础学了8个月的Python  | 实战项目 |学Python就是这条捷径
  3. 干货:爬取豆瓣短评,电影《后来的我们》 | 38年NBA最佳球员分析 |   从万众期待到口碑扑街!唐探3令人失望  | 笑看新倚天屠龙记 | 灯谜答题王 |用Python做个海量小姐姐素描图 |碟中谍这么火,我用机器学习做个迷你推荐系统电影
  4. 趣味:弹球游戏  | 九宫格  | 漂亮的花 | 两百行Python《天天酷跑》游戏!
  5. AI: 会做诗的机器人 | 给图片上色 | 预测收入 | 碟中谍这么火,我用机器学习做个迷你推荐系统电影
  6. 小工具: Pdf转Word,轻松搞定表格和水印! | 一键把html网页保存为pdf!|  再见PDF提取收费! | 用90行代码打造最强PDF转换器,word、PPT、excel、markdown、html一键转换 | 制作一款钉钉低价机票提示器! |60行代码做了一个语音壁纸切换器天天看小姐姐!|
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/661022
推荐阅读
相关标签
  

闽ICP备14008679号