当前位置:   article > 正文

python办公自动化pdf下载,你们都用Python实现了哪些办公自动化?

《使用python自动处理无聊的内容》免费pdf下载

处理Excel、Word、PDF等常用办公软件,处理CSV文件和JSON数据,从Web抓取网络信息,批量处理大量图片,发送电子邮件和短信等等,用Python都可以轻松完成!

光说不练假把式,人邮君举几个有趣的、实用的例子一起看看叭~

1、从多个PDF中合并选择的页面

假定你有一个很无聊的任务,需要将几十个PDF 文档合并成一个PDF 文档。每一个文档都有一个封面作为第一页,但你不希望合并后的文档中重复出现这些封面。即使有许多免费的程序可以合并PDF,很多也只是简单地将文档合并在一起。

让我们来写一个Python 程序,定制需要合并到PDF 中的页面。

总的来说,程序需要完成以下任务。

找到当前工作目录中的所有PDF 文档。

按文档名排序,这样就能有序地添加这些PDF。

除了第一页之外,将每个PDF 的所有页面写入输出的文档。

从实现的角度来看,代码需要执行以下操作。

调用os.listdir(),找到当前工作目录中的所有文件,并去除非PDF 文档。

调用Python 的sort()列表方法,将文档名按字母排序。

为输出的PDF 文档创建PdfFileWriter 对象。

循环遍历每个PDF 文档,为它创建PdfFileReader 对象。

针对每个PDF 文档,循环遍历每一页,第一页除外。

将页面添加到输出的PDF。

将输出的PDF 写入一个文档,名为allminutes.pdf。

针对这个项目,打开一个新的文件编辑器窗口,将它保存为combinePdfs.py。

4b27e30408c6065918535a51e7ff6f54.png

第 1 步:找到所有PDF 文档

首先,程序需要取得当前工作目录中所有带.pdf 扩展名的文档列表,并对它们排序。

让你的代码看起来像这样:

97e4d3316b0022ee3787cc633a6992e9.png

在#!行和介绍程序做什么的描述性注释之后,代码导入了os 和PyPDF2 模块①。os.listdir('.')调用将返回当前工作目录中所有文档的列表。代码循环遍历这个列表,将带有.pdf 扩展名的文档添加到pdfFiles 中②。然后,列表按照字典顺序排序,调用sort()时需要带有key/str.lower 关键字参数③。

代码创建了一个PdfFileWriter 对象,以保存合并后的PDF 页面④。最后,使用一些注释语句简要描述了剩下的程序。

第 2 步:打开每个PDF 文档

现在,程序必须读取pdfFiles 中的每个PDF 文档。在程序中加入以下代码:

8c28e71126e98f21dc4b35fa30d2fd41.png

针对每个PDF 文档,循环内的代码调用open(),以'wb'作为第二个参数,用读二进制的模式打开文档。open()调用会返回一个File 对象,它被传递给PyPDF2.PdfFileReader(),以创建针对那个PDF 文档的PdfFileReader 对象。

第 3 步:添加每一页

针对每个PDF 文档,程序需要循环遍历每一页,第一页除外。在程序中添加以下代码:

a77c904fa449342cac37658b6fa4fa4b.png

for 循环内的代码将每个Page 对象复制到PdfFileWriter 对象。要记住,你需要跳过第一页。因为PyPDF2 认为0 是第一页,所以循环应该从1 开始①,然后向上增长到pdfReader.umPages 中的整数,但不包括它。

第 4 步:保存结果

在这些嵌套的for 循环完成后,pdfWriter 变量将包含一个PdfFileWriter 对象,以合并所有PDF 的页面。最后一步是将这些内容写入硬盘上的一个文档。在程序中添加以下代码:

cb220b9bcdfef87ee016d735097f17a4.png

向open()传入'wb',以写二进制的模式打开PDF 文档allminutes.pdf。然后,将得到的File 对象传给write()方法,以创建实际的PDF 文档。调用close()方法,结束程序。

2、向会员发送会费提醒电子邮件

假定你一直“自愿”为“强制自愿俱乐部”记录会员会费。这确实是一项枯燥的工作,包括维护一个电子表格,记录每个月谁交了会费,并用电子邮件提醒那些没交的会员。你不必自己查看电子表格,而是向会费逾期的会员复制、粘贴和发送相同的电子邮件。

让我们用Python编写一个脚本,帮你完成任务。

在较高的层面上,下面是程序要完成的任务。

从Excel 电子表格中读取数据。

找出上个月没有交费的所有会员。

找到他们的电子邮件地址,向他们发送针对个人的提醒。

这意味着代码需要执行以下操作。

用openpyxl 模块打开并读取Excel 文档的单元格(处理Excel 文档参见第13 章)。

创建一个字典,包含会费逾期的会员。

调用smtplib.SMTP()、ehlo()、starttls()和login(),登录SMTP 服务器。

针对会费逾期的所有会员,调用sendmail()方法,发送针对个人的电子邮件提醒。

打开一个新的文件编辑器窗口,并保存为sendDuesReminders.py。

第 1 步:打开Excel 文件

假定用来记录会费支付的Excel 电子表格看起来如图 18-2 所示,放在名为duesRecords.xlsx的文件中。可以从异步社区本书对应页面下载该文件。该电子表格中包含每个成员的姓名和电子邮件地址。每个月有一列,用来记录会员的付款状态。在成员支付会费后,对应的单元格就记为paid。

该程序必须打开duesRecords.xlsx,通过读取sheet.max_column 属性,弄清楚最近一个月的列。

在文件编辑器窗口中输入以下代码:

8ac647fc146bc186f1f6b3a1bee9ffee.png

348e12fc43a6d613b0b13d926f5dd28e.png

记录会员会费支付的电子表格

导入openpyxl、smtplib 和sys 模块后,我们打开duesRecords.xlsx 文件,将得到的Workbook 对象保存在wb 中①。然后取得Sheet1,将得到的Worksheet 对象保存在sheet中②。既然有了Worksheet 对象,就可以访问行、列和单元格了。我们将最后一列保存在lastCol 中③,然后用行号1 和lastCol 来访问应该记录着最近月份的单元格。取得该单元格的值,并将其保存latestMonth 中④。

第 2 步:查找所有未支付会费的成员

一旦确定了最近一个月的列数(保存在lastCol 中),就可以循环遍历第一行(这是列标题)之后的所有行,看看哪些成员在该月会费的单元格中写着paid。如果会员没有支付会费,就可以从列1 和列2 中分别抓取成员的姓名和电子邮件地址。这些信息将放入unpaidMembers字典,它记录最近一个月没有交费的所有成员。将以下代码添加到sendDuesReminder.py 中:

a3d747ce5dc2b3cc0a5e21b1d2dbe181.png

这段代码设置了一个空字典unpaidMembers,然后循环遍历第一行之后所有的行①。对于每一行,最近月份的值保存在payment 中②。如果payment 不等于'paid',则第一列的值保存在name 中③,第二列的值保存在email 中④,将name 和email 添加到unpaidMembers 中⑤。

第 3 步:发送定制的电子邮件提醒

得到所有未付费成员的名单后,就可以向他们发送电子邮件提醒了。将下面的代码添加到程序中,但要代入你的真实电子邮件地址和提供商的信息:

a7442ce2405fc4f76c43c7bde1a882e3.png

调用smtplib.SMTP()并传入提供商的域名和端口,来创建一个SMTP 对象。调用ehlo()和starttls(),然后调用login(),并传入你的电子邮件地址和sys.argv[1](其中保存着你的口令字符串)。在每次运行程序时,将口令作为命令行参数输入,避免在源代码中保存口令。程序登录到你的电子邮件账户后,就应该遍历unpaidMembers 字典,向未支付会费的会员的电子邮件地址发送针对个人的电子邮件。将以下代码添加到sendDuesReminders.py:

9126949c520c3f550e950194f0ba5bcd.png

这段代码循环遍历unpaidMembers 中的姓名和电子邮件。对于每个没有付费的成员,我们用最新的月份和成员的名称定制了一条消息,并保存在body 中?。输出表示正在向这个会员的电子邮件地址发送电子邮件?。然后调用sendmail(),向它传入地址和定制的消息?。返回值保存在sendmailStatus 中。

回忆一下,如果SMTP 服务器在发送某个电子邮件时报告错误,sendmail()方法将返回一个非空的字典值。for 循环的最后部分在④行检查返回的字典是否非空,如果非空,则输出收件人的电子邮件地址以及返回的字典。

程序完成发送所有电子邮件后,调用quit()方法,与SMTP 服务器断开连接。

如果运行该程序,输出结果会像这样:

3adc3f5bc06e67b13e9acd133b6665d6.png

收件人会收到一封关于他们未支付会费的邮件,看起来就像你手动发送的邮件一样。

《Python编程快速上手 让繁琐工作自动化 第2版》中还有很多这样有意思又实用的例子,比如“简单的倒计时程序”、“生成随机的测验试卷文件”、“取得当前的天气数据”等等,步骤清晰,简单易用,各行各业的人都可以学习使用,真正实现零基础快速入门。

没有编程基础的同学也不用担心,本书就是一本面向初学者的Python编程实用指南。

本书的第一部分介绍了基本的Python编程概念,第二部分介绍了一些不同的任务,通过编写Python程序,可以让计算机自动完成它们。第二部分的每一章都有一些项目程序供读者学习。每章的末尾还提供了一些习题和深入的实践项目,帮助读者巩固所学的知识。附录部分提供了所有习题的解答。

这本经典畅销书也是刚刚在千呼万唤中出版了第2版,重磅升级以给大家带来更好的学习体验,更详细地介绍了解一下——

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/164289?site
推荐阅读
相关标签
  

闽ICP备14008679号