赞
踩
本次实验主要介绍Python针对Word办公自动化的需求产生背景及由来及其具体实现。包括但不限于:
完成本实验后,您将能够
本次任务主要了解为什么需要用到针对Word的办公自动化操作,通过一个实际工作场景切入。
小张在一家黄金饰品公司工作,每天上午都需要给大约200个客户发送word版的今日黄金价格信息通知
每份通知文档只有日期,价格,客户名不一样
小张只得每天反复修改wrod文档,每次大概需要2个小时来完成这项重复的工作
如何能够非常高效的完成这件事情呢?
学完今天的内容后,由原来第天要花2个小时完成的事情,变成现在的一键搞定,效率提升了几百倍。
如何做到?
终于找到了 python-docx Python 库,文档齐全,功能强大,用来解决替换问题不在话下。
开始之前,先简单了解下 python-docx !
本次任务主要讲解了什么python-docx库,如何安装这个第三方库。同时也简单介结了一下Word文档模型。
python-docx 是用于创建可修改 微软 Word 的一个 python 库,提供全套的 Word 操作,是最常用的 Word 工具
使用前,先了解几个概念:
Document
:是一个 Word 文档 对象,Document 是独立的,打开不同的 Word 文档,就会有不同的 Document 对象,相互之间没有影响Paragraph
:是段落,一个 Word 文档由多个段落组成,当在文档中输入一个回车键,就会成为新的段落,输入 shift + 回车,不会分段Run
表示一个节段,每个段落由多个 节段 组成,一个段落中具有相同样式的连续文本,组成一个节段,所以一个 段落 对象有个 Run 列表例如有一个 Word,内容是:
word 文档内容则 结构这样划分:
第二个 段落(paragraph),没有内容,所以 节段(run)为空
可以用 pip 来安装:
pip install python-docx
出现如下图提示,说明安装成功:
python-docx 安装后,测试一下:
from docx import Document
doc = Document()
doc.add_paragraph('Hello,Python.')
doc.save("test.docx")
本次任务主要讲解了如何利用Python-docx库操作Word文档。
在上面小试牛刀中,介绍了插入段落(paragraph)的用法,下面在介绍一些 python-docx 的其他功能
为了简洁,下面例子中省略了 Document 类的引入和实例化代码,doc为 Document 的实例
默认情况下添加的标题是最高一级的,即一级标题,通过参数 level
设定,范围是 1 ~ 9,也有 0 级别,表示的是段落标题:
# 添加一级标题
doc.add_heading('我是一级标题')
doc.add_heading('我也是一级标题',level=1)
doc.add_heading('我是二级标题', level=2)
doc.add_heading('我是三级标题', level=3)
doc.add_heading('我是段落标题', level=0)
doc.add_paragraph('我是一个普通段落.')
doc.save("test01.docx")
在前面 python-docx 文档结构图可以看到,段落中,不同样式的内容,被划分成多个 节段(Run),文字样式是通过 节段(Run)来设置的
from docx import Document
document = Document()
paragraph = document.add_paragraph('添加一个段落')
# 设置 节段文字为加粗
run1 = paragraph.add_run('我是粗体的')
run1.bold = True
# 设置 节段文字为斜体
run2 = paragraph.add_run('我是斜体的')
run2.italic = True
document.save("demo02.docx")
print("demo02.docx created!")
设置字体稍微复杂些,例如设置一段文字为 宋体
:
......
from docx.oxml.ns import qn
paragraph = document.add_paragraph('我的字体是')
paragraph.add_run(' 黑体')
run3 = paragraph.runs[1]
run3.bold = True
run3.font.name = '黑体'
run3._element.rPr.rFonts.set(qn('w:eastAsia'), '黑体')
......
..... from docx.shared import RGBColor from docx.shared import Pt from docx.oxml.ns import qn paragraph = document.add_paragraph('我的颜色是') paragraph.add_run('红色') run4 = paragraph.runs[1] font = run4.font font.name = u'微软雅黑' run4._element.rPr.rFonts.set(qn('w:eastAsia'), u'微软雅黑') font.size = Pt(14) # RGB颜色对照表:http://www.wahart.com.hk/rgb.htm font.color.rgb = RGBColor(255, 48, 48) ......
document = Document()
# 1,全局设置字体与大小:微软雅黑 14号字
print(document.styles['Normal'].font.name)
document.styles['Normal'].font.name = u'微软雅黑'
document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'微软雅黑')
document.styles['Normal'].font.size = Pt(14)
document.add_paragraph().add_run("1,我是第一段!")
.....
可以动态的给一个文档添加段落、文本并给文本设置样式。
import docx from docx import Document from docx.shared import Inches from docx.enum.text import WD_ALIGN_PARAGRAPH from docx.shared import Inches from docx.shared import Pt from docx.oxml.ns import qn # 创建文档 document = Document() # 添加第一个段落,并在该段落中添加内容 document.add_paragraph().add_run("1,我是第一段!") # document.add_paragraph("1,我是第一段!") # 与上面的写法等价 # 添加第二个段落,并在该段落中添加内容 run1 = document.add_paragraph().add_run("2,我是第二段!") # 创建字体对象 font1 = run1.font # 打印默认字体的名称 print(font1.name) # 设置run1内容的字体及字号 font1.name = 'Microsoft YaHei UI' # 设置字体为12号字 font1.size = Pt(12) # 打印字体 print(font1.name) # 设置第三段字体 paragraph = document.add_paragraph("3,我是") run2 = paragraph.add_run("第三段!") # 设置run2内容的字体及字号 font2 = run2.font font2.name = 'Microsoft YaHei UI' font2.size = Pt(14) # 设置第三段字体,在第三段中添加两个节段 paragraph.add_run("我是") run3 = paragraph.add_run("微软雅黑") font3 = run3.font font3.name = u"微软雅黑" run3._element.rPr.rFonts.set(qn('w:eastAsia'), u'微软雅黑') font3.size = Pt(16) document.save('demo03.docx') print("docx保存成功!")
本次任务主要讲解了如何利用Python-docx库操作Word文档实现自动化的案例。
小张在一家黄金饰品公司工作,每天上午都需要给大约200个客户发送word版的今日黄金价格信息通知每份通知文档只有日期,价格,客户名不一样,小张只得每天反复修改wrod文档,每次大概需要2个小时来完成这项重复的工作。
客户通知的模板如下:
NotifyWord.py
from docx import Document from docx.enum.text import WD_PARAGRAPH_ALIGNMENT from docx.shared import Pt,RGBColor from docx.oxml.ns import qn import time price = input('请输入今天的黄金价格:') customers = ['客户1', '客户2', '客户3', '客户4', '客户5', '客户6', '客户7', '客户8', '客户9'] # today = time.strftime("%Y-%m-%d", time.localtime()) today = time.strftime("%Y/%m/%d", time.localtime()) # today = time.strftime("%Y年%m月%d日", time.localtime()) # today = time.strftime("%Y{y}%m{m}%d{d}", time.localtime()).format(y='年', m='月', d='日') # 循环创建文档 for customer in customers: # 创建文档对象 document = Document() # 设置全局样式 document.styles['Normal'].font.name='微软雅黑' document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'),'微软雅黑') document.styles['Normal'].font.size = Pt(21) # 创建通知标题 p1 = document.add_paragraph() p1.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER run1 = p1.add_run('关于下达 %s 价格通知' % (today)) run1.font.size = Pt(28) run1.font.bold = True p1.space_after = Pt(5) p1.space_before = Pt(5) # 客户名称 p2 = document.add_paragraph() run2 = p2.add_run(customer + ': ') run2.font.name = '仿宋_GB2312' run2.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312') run2.font.bold = True run2.font.color.rgb= RGBColor(255,48,48) # 通知内容 p3 = document.add_paragraph() run3 = p3.add_run(' 根据公司的安排,为提供优质的客户服务,我单位拟定了今日黄金价格为 %s 元,特此通知。' % (price)) # 通知落款 p4 = document.add_paragraph() p4.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT run4 = p4.add_run('(联系人:小张 电话:13633393934)') run4.font.name = '仿宋_GB2312' run4.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312') # 保存文档 document.save('./doc/%s-价格通知.docx' % customer)
在项目上击右键,新建doc目录 , 执行代码,效果如下:
运行成功之后:
本次任务是通过如下练习达到对上述知识技能点掌握的目的。
**自动化任务需求:**自动批量生成学员放假通知单,模板如下:
特别说明:
1)假设有10个学生(可以直接写在程序列表中)
2)假设有10个学生家长(家长的名称也可以直接写在程序列表中)
3)运行时提示
请输入放假开始时间(如:2021-7-1):
请输入放假结束时间(如:2021-8-31):
请输入老师名称:
4)最下边落款的时间为当前系统时间
打开Pycharm,进入默认界面,选择 File—>New...
,如下图所示:
在弹出的窗口中选择 Python file
,输入:StudentHolidy,创建StudentHolidy.py文件:
在其中输入代码如下:
from docx import Document from docx.enum.text import WD_PARAGRAPH_ALIGNMENT from docx.shared import Pt,RGBColor from docx.oxml.ns import qn import time from datetime import datetime import datetime students = ['学生A', '学生B', '学生C', '学生D', '学生E', '学生F', '学生G', '学生H', '学生I'] mothers = ['家长A', '家长B', '家长C', '家长D', '家长E', '家长F', '家长G', '家长H', '家长I'] startDate = input('请输入放假开始时间(如:2021-7-1):') endDate = input('请输入放假结束时间(如:2021-9-1):') teacher = input('请输入老师名称:') # 计算放假结束时间加一天后的入学报到时间 # 伪代码:nextDate = 将endDate这个字符串转换为日期时间类型 + 一天 nextDate = datetime.datetime.strptime(endDate,'%Y-%m-%d')+datetime.timedelta(days=+1) # 开学时间 openSchool = '{0}月{1}日'.format(nextDate.month,nextDate.day) # 得到今天的时间 today = time.strftime('%Y年%m月%d日',time.localtime()) # 循环创建文档 for i in range(len(students)): # 创建文档对象 document = Document() # 向document文档写入数据的过程 # 设置全局样式 document.styles['Normal'].font.name='微软雅黑' document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'),'微软雅黑') document.styles['Normal'].font.size = Pt(14) # 创建通知标题 p1 = document.add_heading('{0}学生放假通知书'.format(students[i])) p1.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER # 创建抬头 p2 = document.add_paragraph('尊敬的同学家长:') run1 = p2.add_run(mothers[i]) run1.font.bold = True run1.font.color.rgb = RGBColor(255,0,0) # 通知内容 p3 = document.add_paragraph() p3.add_run('我校根据上级要求,决定从 %s 开始放寒假,下学期于 %s 开学报到。%s 正式上课。' % (startDate,endDate,openSchool)) # 通知落款-1 p4 = document.add_paragraph() p4.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT run2 = p4.add_run(today) run2.font.name = '宋体' run2.element.rPr.rFonts.set(qn('w:eastAsia'),'宋体') run2.font.size = Pt(14) # 通知落款-2 p5 = document.add_paragraph() p5.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT run3 = p5.add_run(teacher) run2.font.name = '宋体' run2.element.rPr.rFonts.set(qn('w:eastAsia'),'宋体') run2.font.size = Pt(14) document.save('./docx/{0}-学生放假通知书.docx'.format(students[i]))
在项目Code目录上击右键,新建 docx 目录:
然后再StudentHolidy.py 文件上击右键运行,执行效果如下:
敲回车执行效果如下:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。