赞
踩
pandas
是一个强大的数据分析库,它支持多种数据格式的读取。以下是一些常见的文件格式以及如何使用 pandas
读取它们的示例:
CSV 文件:
CSV(逗号分隔值)文件是一种常见的文本文件格式,每行表示一条记录,字段之间用逗号分隔。
import pandas as pd
# 读取CSV文件
df_csv = pd.read_csv('file.csv')
Excel 文件:
pandas
支持读取 Excel 文件。你可以指定要读取的工作表名称或索引。
import pandas as pd
# 读取Excel文件
df_excel = pd.read_excel('file.xlsx', sheet_name='Sheet1')
JSON 文件:
JSON(JavaScript Object Notation)是一种轻量级数据交换格式,pandas
可以从 JSON 文件中读取数据。
import pandas as pd
# 读取JSON文件
df_json = pd.read_json('file.json')
SQL 数据库:
pandas
支持从 SQL 数据库中读取数据。你需要使用 sqlalchemy
库来创建数据库连接。
import pandas as pd
from sqlalchemy import create_engine
# 创建数据库连接
engine = create_engine('sqlite:///mydatabase.db')
# 读取SQL数据库中的表
df_sql = pd.read_sql('tablename', con=engine)
Parquet 文件:
Parquet 是一种高效的列式存储格式,适用于大规模数据集。pandas
可以读取 Parquet 文件。
import pandas as pd
# 读取Parquet文件
df_parquet = pd.read_parquet('file.parquet')
这里只是提供了一些基本示例,实际上,pandas
支持的数据格式远不止这些。你可以根据需要选择适合你数据的读取方法,pandas
文档中包含了更详细的信息和示例。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。