当前位置:   article > 正文

python读入excel,进行excel处理的基础操作_python 循环读入excel中的每个sheet

python 循环读入excel中的每个sheet

1.合并多个Excel文件的sheet

可以使用Python中的pandas库来读取和合并多个Excel文件的sheet。 首先需要安装pandas库,可以使用以下命令进行安装: ``` pip install pandas ``` 接下来,可以使用以下代码来读取和合并多个Excel文件的sheet:

  1. ```python
  2. import pandas as pd
  3. # 定义要读取的Excel文件列表
  4. excel_files = ['file1.xlsx', 'file2.xlsx', 'file3.xlsx']
  5. # 定义要读取的sheet名称
  6. sheet_names = ['Sheet1', 'Sheet2', 'Sheet3']
  7. # 定义一个空的DataFrame
  8. df = pd.DataFrame()
  9. # 循环读取每个Excel文件的每个sheet,并将其合并到df中
  10. for file, sheet in zip(excel_files, sheet_names):
  11. data = pd.read_excel(file, sheet_name=sheet)
  12. df = pd.concat([df, data])
  13. # 将合并后的数据保存到一个新的Excel文件中
  14. df.to_excel('merged.xlsx', index=False)
  15. ```

在上面的代码中,首先定义了要读取的Excel文件列表和sheet名称列表。然后使用一个空的DataFrame来存储合并后的数据。接着使用循环来读取每个Excel文件的每个sheet,并将其合并到df中。最后将合并后的数据保存到一个新的Excel文件中。 需要注意的是,如果要合并的Excel文件中的sheet结构不同,可能需要进行一些数据清洗和处理,以确保合并后的数据结构一致。

2.pandas库来读取多个Excel文件,并按列显示数据。 

可以使用pandas库来读取多个Excel文件,并按列显示数据。

首先,需要安装pandas库。可以使用以下命令进行安装:

```
pip install pandas
```

然后,可以使用pandas的read_excel函数来读取Excel文件。可以使用glob库来获取所有需要读取的Excel文件的文件名,然后使用循环来读取每个文件并将它们合并到一个DataFrame中。最后,可以使用pandas的iloc函数来按列显示数据。

  1. 以下是一个示例代码:
  2. ```python
  3. import pandas as pd
  4. import glob
  5. # 获取所有需要读取的Excel文件的文件名
  6. excel_files = glob.glob('*.xlsx')
  7. # 循环读取每个Excel文件并将它们合并到一个DataFrame中
  8. df = pd.DataFrame()
  9. for file in excel_files:
  10.     data = pd.read_excel(file)
  11.     df = pd.concat([df, data], axis=0)
  12. # 按列显示数据
  13. print(df.iloc[:, 0:3])
  14. ```

在上面的代码中,`glob.glob('*.xlsx')`会获取当前目录下所有扩展名为xlsx的文件名。`pd.read_excel(file)`会读取每个Excel文件并将其存储在一个DataFrame中。`pd.concat([df, data], axis=0)`会将每个DataFrame合并到一个大的DataFrame中。`df.iloc[:, 0:3]`会按列显示前三列数据。

 3.使用Python中的pandas库来读取和修改Excel文件

 

可以使用Python中的pandas库来读取和修改Excel文件。以下是一个示例代码,可以读取多个Excel文件并更改列名:

  1. ```python
  2. import pandas as pd
  3. import glob
  4. # 获取所有Excel文件的文件名
  5. excel_files = glob.glob('*.xlsx')
  6. # 循环读取每个Excel文件并更改列名
  7. for file in excel_files:
  8.     df = pd.read_excel(file)
  9.     df = df.rename(columns={'old_column_name': 'new_column_name'})
  10.     df.to_excel(file, index=False)
  11. ```

在上面的代码中,`glob.glob('*.xlsx')`会获取当前目录下所有扩展名为xlsx的文件名。然后,使用一个循环来读取每个Excel文件,使用`pd.read_excel()`函数读取Excel文件,使用`df.rename()`函数更改列名,最后使用`df.to_excel()`函数将修改后的数据写回到原始Excel文件中。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/768694
推荐阅读
相关标签
  

闽ICP备14008679号