赞
踩
处理Excel一般涉及到如下场景:
正常读取一个txt格式的文件,可以使用open的方法进行打开,再通过readlines进行读取!
具体如下:
path = r'test.txt'
frame = open(path, encoding='utf-8')
print(frame.readlines())
# 不用则把文件关闭
frame.close()
截图如下:(txt涉及中文需要加多一个参数 encoding='utf-8'
)
工作表操作: 使用 openpyxl
库时,可以操作工作表,读取单元格的值、设置单元格的值,以及进行各种其他工作表级别的操作
Excel 样式: openpyxl
设置单元格的样式,包括字体、颜色、边框等
写入 Excel 文件: 除了读取,openpyxl
也支持创建新的 Excel 文件、写入数据,并保存。
openpyxl 是一个处理 Excel 文件的库
使用过程中需要先安装:pip install openpyxl
示例代码如下:(使用 openpyxl
库逐行读取 Excel 文件的内容。)
from openpyxl import load_workbook
# 打开 Excel 文件
workbook = load_workbook('test.xlsx')
# 选择工作表
sheet = workbook.active
# 读取数据
for row in sheet.iter_rows(min_row=1, max_col=sheet.max_column, max_row=sheet.max_row):
for cell in row:
print(cell.value, end='\t')
print()
截图如下:
数据结构: pandas
使用 DataFrame
这一数据结构表示表格形式的数据。了解如何使用 DataFrame 对象是使用 pandas 的关键
读取指定工作表: 如果 Excel 文件包含多个工作表,可以使用 sheet_name
参数指定要读取的工作表。
例如:pd.read_excel('your_excel_file.xlsx', sheet_name='Sheet1')
数据操作: pandas
提供了丰富的数据操作功能,例如过滤、排序、合并等,可以使用这些功能轻松处理 Excel 中的数据
对于pandas有些特殊,使用过程需要提前安装以下两个库:
pip install pandas
pip install openpyxl
示例代码如下:
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('test.xlsx')
# 显示数据
df.head()
截图如下:
数据类型: xlrd
会尝试自动推断数据类型,但在某些情况下可能需要手动处理数据类型的转换
只读模式: xlrd
是只读库,只能用于读取 Excel 文件。如果需要写入功能,可以使用其他库
这个库,只支持xlx,如果强行使用xlsx,会报错:(也不可直接将xlsx修改为xlx进行编译,毕竟两种excel不是改个后缀就通用了)
使用的前提需要安装:pip install xlrd
import xlrd
# 打开 Excel 文件
workbook = xlrd.open_workbook('test.xls')
# 选择工作表
sheet = workbook.sheet_by_index(0)
# 读取数据
for row in range(sheet.nrows):
for col in range(sheet.ncols):
print(sheet.cell_value(row, col), end='\t')
print()
截图如下:
一般注意事项:
文件路径: 确保提供正确的 Excel 文件路径或将文件放在 Jupyter Notebook 的工作目录中或者是pycharm中的工作目录中!(也可用绝对路径,但迁移项目要小心)
版本兼容性: 检查库的版本,确保与 Python 和其他库的版本兼容
异常处理: 在实际应用中,最好包含适当的异常处理,以处理可能的错误,例如文件不存在、工作表不存在等情况
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。