当前位置:   article > 正文

Pandas基础知识(二)——读取文件的函数_pandas模块对于文件的读取函数有

pandas模块对于文件的读取函数有

1、常见的文件类型以及相应读取文件函数如下表所示:

文件类型文件后缀名读取文件函数
CSV文件.csvread_csv()
Excel文件.xlsx.xlsread_excel()
TXT文件.txtread_table()

2、假设有这么一个文件,文件名为“期末成绩统计”,表中内容如下:

姓名语文数学英语历史地理
小明102981067886
小红103107898478
小强10478889194
小兰105110996979

3、读取文件

(1)假设上述文件为csv文件,csv文件一般是以英文逗号为数据分隔符,则读取CSV文件如下:

  1. import pandas as pd
  2. df = pd.read_csv('期末成绩统计.csv',sep=',')

(2)假设上述文件为Excel文件,且表格存储在"成绩单"的工作表中,则读取Excel文件如下:

  1. import pandas as pd
  2. df = pd.read_excel('期末成绩统计.xlsx',sheet_name='成绩单', index_col=None)

(3)假设上述文件为TXT文件,则读取TXT文件如下:

  1. import pandas as pd
  2. df = pd.read_table('期末成绩统计.txt', sep='\t',engine='python')

4、公共参数

上述三个读取文件的函数有一些公共参数。常见的公用参数含义如下表:

ps:参数设置为其默认值时可以不写该参数

参数名参数含义详解
header文件首行
  • 默认首行为表头,即列名
  • 设置为None表示第一行不作为列名
index_col索引列
  • 默认第一列为索引列
  • index_col=['姓名','语文'],表示将姓名及语文成绩这两列设置为索引列
  • 设置为None表示无索引列
useclos读取列
  • 默认读取所有列
  • useclos=['姓名','语文'],表示只读取姓名及语文成绩这两列
parse_dates时间列
  • 需要转化为时间的列
  • parse_dates=['XX','YY'],表示将 "XX","YY"这两列转换成时间格式
nrows读取行数
  • 默认全部读取
  • nrows=100,表示读取前100行数据

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/爱喝兽奶帝天荒/article/detail/893863
推荐阅读
相关标签
  

闽ICP备14008679号