赞
踩
办公中经常会遇到合并excel的情况,人工挨个复制很烦还容易出错,所以就想到了python和openpyxl。参考了几个大模型给出的代码,发现没那么难,整理后得出了本文的代码。本文代码可合并excel一个或多个工作薄,每个工作薄可含一个或多个工作表。
将需要合并的excel文档全部放在一个文件夹,以下代码保存.py文件后放在此文件夹。无需更改任何代码,直接运行。代码运行结束后会在文件夹中生成一个名为merged_file.xlsx的excel文档,这个文档就是所有工作簿所有工作表合并后的文档。合并后的文档,即merged_file.xlsx,第一列为每一行数据对应的工作薄和工作表的名字。
openpyxl需要升级为最新版。升级方法如下:
徽标键+R呼出运行窗口;输入cmd,呼出命令行窗口,运行命令pip install --upgrade openpyxl
本文持续更新,如有其他需求可在评论区留言。
- import os
- import openpyxl
- from openpyxl import load_workbook
- from openpyxl.utils import get_column_letter
-
- def merge_excel_files(input_folder, output_file):
- # 获取输入文件夹中的所有Excel文件
- excel_files = [f for f in os.listdir(input_folder) if f.endswith('.xlsx') or f.endswith('.xls')]
- print(excel_files)
- # 创建一个新的工作簿用于存储合并后的数据
- merged_workbook = openpyxl.Workbook()
- merged_sheet = merged_workbook.active
- i=0
- # 遍历所有Excel文件
- for file in excel_files:
- # 打开当前Excel文件
- workbook = openpyxl.load_workbook(os.path.join(input_folder, file))
- i= i+1
- print("序列",'{0:>5}'.format(i),file)
- sheet_names = workbook.sheetnames
- for sheet_name in sheet_names:
- sheet = workbook[sheet_name]
- # 获取当前工作表的最大行和列
- max_row = sheet.max_row
- max_col = sheet.max_column
- for row in sheet.iter_rows(values_only=True):
- a = list(row)
- a.insert(0,file+'-'+sheet_name)
- a = tuple(a)
- row = a
- merged_sheet.append(row)
- # 将当前工作表的数据复制到合并后的工作表中
-
- ## for row in range(1, max_row + 1):
- ## for col in range(1, max_col + 1):
- ## cell = sheet.cell(row=row, column=col)
- ## merged_sheet.cell(row=row, column=col).value = cell.value
- ##
- # 保存合并后的工作簿
- merged_workbook.save(output_file)
-
- # 使用示例
- input_folder = os.getcwd()
- output_file = 'merged_file.xlsx'
- merge_excel_files(input_folder, output_file)
-
- print('ok')
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。