Pandas基础知识（二）——读取文件的函数_pandas模块对于文件的读取函数有

作者：爱喝兽奶帝天荒 | 2024-07-28 10:34:46

踩

pandas模块对于文件的读取函数有

（1）假设上述文件为csv文件，csv文件一般是以英文逗号为数据分隔符，则读取CSV文件如下：


import pandas as pd
df = pd.read_csv('期末成绩统计.csv',sep=',')

（2）假设上述文件为Excel文件，且表格存储在"成绩单"的工作表中，则读取Excel文件如下：


import pandas as pd
df = pd.read_excel('期末成绩统计.xlsx',sheet_name='成绩单', index_col=None)

（3）假设上述文件为TXT文件，则读取TXT文件如下：


import pandas as pd
df = pd.read_table('期末成绩统计.txt', sep='\t',engine='python')

上述三个读取文件的函数有一些公共参数。常见的公用参数含义如下表：

ps：参数设置为其默认值时可以不写该参数

参数名	参数含义	详解
header	文件首行	默认首行为表头，即列名设置为None表示第一行不作为列名
index_col	索引列	默认第一列为索引列 index_col=['姓名','语文']，表示将姓名及语文成绩这两列设置为索引列设置为None表示无索引列
useclos	读取列	默认读取所有列 useclos=['姓名','语文']，表示只读取姓名及语文成绩这两列
parse_dates	时间列	需要转化为时间的列 parse_dates=['XX','YY']，表示将 "XX","YY"这两列转换成时间格式
nrows	读取行数	默认全部读取 nrows=100，表示读取前100行数据

本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】