当前位置:   article > 正文

Python办公自动化,有效告别繁琐操作,955不是梦,建议收藏!

Python办公自动化,有效告别繁琐操作,955不是梦,建议收藏!

一、报表合并

将文件夹下所有excel文件合并为一个文件。但是这里仅支持合并excel文件中的sheet1,如果合并的excel文件有多个sheet,请大家自行修改代码的merge_excel()函数。合并步骤如下:

1、获取路径下所有文件。
2、新建一个excel文件,用于存储全部数据。
3、逐个打开需要合并的excel文件,逐行读取数据,再用一个列表来保存每行数据,最后在该列表中存储所有的数据。
4、向excel文件中逐行写入。

# coding:utf-8

import xlrd
import os
import xlwt
from xlutils.copy import copy

def get_allfile_msg(file_dir):
    for root, dirs, files in os.walk(file_dir):
        '''
        print(root) #当前目录路径  
        print(dirs) #当前路径下所有子目录  
        print(files) #当前路径下所有非目录子文件 
        '''
        return root, dirs, [file for file in files if file.endswith('.xls') or file.endswith('.xlsx')]


def get_allfile_url(root, files):
    """
    将目录的路径加上'/'和文件名,组成文件的路径
    :param root: 路径
    :param files: 文件名称集合
    :return: none
    """
    allFile_url = []
    for file_name in files:
        file_url = root + '/' + file_name
        allFile_url.append(file_url)
    return allFile_url


def all_to_one(root, allFile_url, file_name='allExcel.xls', title=None, have_title=True):
    """
    合并文件
    :param root: 输出文件的路径
    :param allFile_url: 保存了所有excel文件路径的集合
    :param file_name: 输出文件的文件名
    :param title: excel表格的表头
    :param have_title: 是否存在title(bool类型),默认为true,不读取excel文件的第0行
    :return: none
    """
    # 首先在该目录下创建一个excel文件,用于存储所有excel文件的数据
    file_name = root + '/' + file_name
    create_excel(file_name, title)

    list_row_data = []
    for f in range(0, len(allFile_url)):
    #for f in allFile_url:
        # 打开excel文件
        print('打开%s文件' % allFile_url[f])
        excel = xlrd.open_workbook(allFile_url[f])
        # 根据索引获取sheet,这里是获取第一个sheet
        table = excel.sheet_by_index(0)
        print('该文件行数为:%d,列数为:%d' % (table.nrows, table.ncols))

        # 获取excel文件所有的行
        for i in range(table.nrows):
            # yezi表头修改处,如果表头是2行则为2,1行则为1
            if have_title and i < top and f != 0:
                continue
            else:
                row = table.row_values(i)  # 获取整行的值,返回列表
                list_row_data.append(row)

    print('总数据量为%d' % len(list_row_data))
    # 写入all文件
    add_row(list_row_data, file_name)

# 创建文件名为file_name,表头为title的excel文件
def create_excel(file_name, title):
    print('创建文件%s' % file_name)
    a = xlwt.Workbook()
    # 新建一个sheet
    table = a.add_sheet('sheet1', cell_overwrite_ok=True)
    # 写入数据
    #for i in range(len(title)):
    #    table.write(0, i, title[i])
    a.save (file_name)

# 向文件中添加n行数据
def add_row(list_row_data, file_name):
    # 打开excel文件
    allExcel1 = xlrd.open_workbook(file_name)
    sheet = allExcel1.sheet_by_index(0)
    # copy一份文件,准备向它添加内容
    allExcel2 = copy(allExcel1)
    sheet2 = allExcel2.get_sheet(0)

    # 写入数据
    i = 0
    for row_data in list_row_data:
        for j in range(len(row_data)):
            sheet2.write(sheet.nrows + i, j, row_data[j])
        i += 1
    # 保存文件,将原文件覆盖
    allExcel2.save(file_name)
    print('合并完成')

if __name__ == '__main__':
    # 设置文件夹路径
    # "\"为字符串中的特殊字符,加上r后变为原始字符串,则不会对字符串中的"\t"、"\r" 进行字符串转义
    file_dir = '.\\01 报表合并\\word'
    #模板顶部表头行数,当前行数减1
    top = 2
    # 设置文件名,用于保存数据
    file_name = 'save_demo.xls'

    # 获取文件夹的路径,该路径下的所有文件夹,以及所有文件
    root, dirs, files = get_allfile_msg(file_dir)
    # 拼凑目录路径+文件名,组成文件的路径,用一个列表存储
    allFile_url = get_allfile_url(root, files)
    # have_title参数默认为True,为True时不读取excel文件的首行
    all_to_one(root, allFile_url, file_name=file_name, title=None, have_title=True)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83
  • 84
  • 85
  • 86
  • 87
  • 88
  • 89
  • 90
  • 91
  • 92
  • 93
  • 94
  • 95
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • 103
  • 104
  • 105
  • 106
  • 107
  • 108
  • 109
  • 110
  • 111
  • 112
  • 113

图片

图片

二、批量word转pdf

import win32com.client
import pythoncom
import os

class Word_2_PDF(object):

    def __init__(self, filepath, Debug=False):
        """
        :param filepath:
        :param Debug: 控制过程是否可视化
        """
        self.wordApp = win32com.client.Dispatch('word.Application')
        self.wordApp.Visible = Debug
        self.myDoc = self.wordApp.Documents.Open(filepath)

    def export_pdf(self, output_file_path):
        """
        将Word文档转化为PDF文件
        :param output_file_path:
        :return:
        """
        self.myDoc.ExportAsFixedFormat(output_file_path, 17, Item=7, CreateBookmarks=0)

    def close(self):
        self.wordApp.Quit()

if __name__ == '__main__':

    rootpath = os.getcwd()  # 文件夹路径
    save_path = os.getcwd()   # PDF储存位置
    pythoncom.CoInitialize()

    os_dict = {root:[dirs, files] for root, dirs, files in os.walk(rootpath)}
    for parent, dirnames, filenames in os.walk(rootpath):
        for filename in filenames:
            if u'.doc' in filename and u'~$' not in filename:
                  # 直接保存为PDF文件
                #print(rootpath+filename)
                a = Word_2_PDF(rootpath +'\\'+ filename, True)
                title = filename.split('.')[0]  # 删除.docx
                a.export_pdf(rootpath  +'\\'+ title+'.pdf')
    print('转化完成')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42

图片

三、合同生成

from openpyxl import load_workbook
from docx import Document
from os import listdir
'''
定义替换函数
'''
def replace_text(old_text, new_text):
    #读取所有的自然段
    all_paragraphs = document.paragraphs
    for paragraph in all_paragraphs:
        #循环读取所有的run,并进行新旧文本的替换
        for run in paragraph.runs:
            run_text = run.text.replace(old_text, new_text)
            run.text = run_text
    #读取所有的表格
    all_tables = document.tables
    for table in all_tables:
        for row in table.rows:
            #循环读取表格中所有的cells,并进行新旧文本的替换
            for cell in row.cells:
                cell_text = cell.text.replace(old_text, new_text)
                cell.text = cell_text
'''
获取Excel和Word的文件名
'''
for file in listdir():
    print(file, 'listdir')
    if '模板.docx' in file:
        docx_name = file
    if '信息.xlsx' in file:
        xlsx_name = file
'''
读取Excel内数据
'''
wb = load_workbook(xlsx_name)
sheetx0 = wb.sheetnames
sheetx = wb[sheetx0[0]]

#新文件以第几列数据命名
filename_pos = 1
'''
循环读取并替换
'''
#合同要素Excel中逐列循环
for row in range(3,sheetx.max_row+1):
    document = Document(docx_name)
    #openpyxl在使用sheetx.max_column时可能会读取到空的单元格,这里进行剔除
    if sheetx.cell(row=row,column=1).value!=None:
        #合同要素Excel中逐行循环
        for l in range(1,sheetx.max_column+1):
            #合同要素Excel中对第一列逐行读取编号
            old_text = sheetx.cell(row=1,column=l).value
            #合同要素Excel中对循环的当前列逐行读取新要素
            new_text = sheetx.cell(row=row,column=l).value
            replace_text(str(old_text),str(new_text)) #进行替换
            #定义文件名为当前列第一行的内容
            filename = str(sheetx.cell(row=row,column=filename_pos).value)
        #按定义的文件名进行保存
        document.save("%s.docx"%(filename))
print('合同生成完毕!')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60

图片

四、读者福利

小编是一名Python开发工程师,自己整理了一套最新的Python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。如果你也喜欢编程,想通过学习Python转行、做副业或者提升工作效率,这份【最新全套Python学习资料】 一定对你有用!

对于0基础小白入门:

如果你是零基础小白,想快速入门Python是可以考虑的!

1、学习时间相对较短,学习内容更全面更集中

2、可以找到适合自己的学习方案

我已经上传至CSDN官方,如果需要可以扫描下方二维码都可以免费获取【保证100%免费】

1、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

2、Python课程视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

img

3、精品书籍

书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。

img

4、清华编程大佬出品《漫画看学Python》

用通俗易懂的漫画,来教你学习Python,让你更容易记住,并且不会枯燥乏味。

img

5、Python实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

img

6、互联网企业面试真题

我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。

img

这份完整版的Python全套学习资料已经上传至CSDN官方,朋友们如果需要可以点击下方链接扫描下方二v码都可以免费获取【保证100%免费】

最新全套【Python入门到进阶资料 & 实战源码 &安装工具】

以上全套资料已经为大家打包准备好了,希望对正在学习Python的你有所帮助!

如果你觉得这篇文章有帮助,可以点个赞呀~

我会坚持每天更新Python相关干货,分享自己的学习经验帮助想学习Python的朋友们少走弯路!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/276415
推荐阅读
相关标签
  

闽ICP备14008679号