赞
踩
换成智谱清言来生成python
prompt 采用教材示例
假设你是最懂数据处理的专家,take the breath,let’s think step by step。帮我写一个python脚本来执行以下两个任务:
1.汇总:脚本应该遍历当前文件夹中的所有Excel文件,并将它们的内容汇总到一个新的Excel文件中。第一行需要在汇总的表格中,每行数据需要添加一个新列“表格名”,以标识该数据来自哪个原始表格。完成后,请将这个新的Excel文件保存在当前目录下,并命名为“汇总”。
2.统计:在“汇总”文件中,除了上述汇总内容,还请添加一个新的工作表。在这个新工作表中,我需要统计湖南地区办公用品类别的总销售额、总数量和总利润。为您参考,我上传了一个示例表格,其中包含了类似的数据格式和内容。
当前文件夹中其中一个表格数据如下所示:
行 ID 订单 ID 订单日期 发货日期 邮寄方式 客户 ID 客户名称 细分 城市 省/自治区 国家/地区 地区 产品 ID 类别 子类别 产品名称 销售额 数量 折扣 利润
11 CN-2018-4195213 2018/12/22 2018/12/24 二级 谢雯-21700 谢雯 小型企业 榆林 陕西 中国 西北 技术-设备-10000001 技术 设备 爱普生 计算器, 耐用 434.28 2 0 4.2
44 CN-2018-2932548 2018/5/17 2018/5/22 二级 唐婉-21385 唐婉 小型企业 南昌 江西 中国 华东 办公用-收纳-10004212 办公用品 收纳具 Fellowes 锁柜, 蓝色 1935.08 2 0 0
import os import pandas as pd # 设置工作目录为当前文件夹 os.chdir('./作业1/') # 请替换为实际文件夹的路径 # 存储所有Excel文件的路径 excel_files = [file for file in os.listdir() if file.endswith('.xlsx')] # 汇总所有Excel文件的数据 all_data = pd.DataFrame() for file in excel_files: df = pd.read_excel(file) # 为每行数据添加“表格名”列 df['表格名'] = file all_data = all_data.append(df, ignore_index=True) # 将汇总后的数据保存到新的Excel文件中 all_data.to_excel('汇总.xlsx', index=False) # 统计湖南地区办公用品类别的总销售额、总数量和总利润 # 假设“汇总”文件中包含“汇总”工作表 summary_data = pd.read_excel('汇总.xlsx', sheet_name='汇总') # 筛选湖南地区办公用品类别的数据 filtered_data = summary_data[(summary_data['省/自治区'] == '湖南') & (summary_data['类别'] == '办公用品')] # 计算总销售额、总数量和总利润 total_sales = filtered_data['销售额'].sum() total_quantity = filtered_data['数量'].sum() total_profit = filtered_data['利润'].sum() # 将统计结果保存到新的工作表中 statistical_summary = pd.DataFrame({ '总销售额': total_sales, '总数量': total_quantity, '总利润': total_profit }) statistical_summary.to_excel('汇总.xlsx', sheet_name='统计', index=False)
但是:它并没有按照要求,把sheet名字改为汇总。
下一步,统计湖南地区统计信息时会报错,因为找不到 ‘汇总’ 这个sheet
在这里,我很不争气的手动改了sheet名,没想到又报了新的错误:
这是 DataFrame 创建的错误,所以又把value修改为list类型。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。