当前位置:   article > 正文

数据分析05——往Pandas中导入数据_pandas导入数据库

pandas导入数据库

1、导入Excel:

  • 注意这种方法可以导入xlsx和xls两种类型的数据
  • 读入的数据会以DataFrame的格式显示
  • 举例:df = pd.read_excel(‘./data/demo_03.xlsx’)
  • 还可以导入excel文件中具体的某一个表格:pd.read_excel(‘./data/demo_03.xlsx’, sheet_name=‘工作表1’)
  • 导入时要看字段名在excel表的哪一行(以第二行为例):pd.read_excel(‘./data/demo_03.xlsx’, sheet_name=‘工作表3’, header=1)
  • 导入后想把第一行作为列索引,第一列作为行索引:
    df = pd.read_excel(‘your_file.xlsx’, index_col=0, header=0)
  • 通过指定的列索引来导入第1列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[0])
  • 通过指定的列索引来导入第1列、第4列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[0, 3])
  • 通过指定的列名来导入指定列:pd.read_excel(‘./data/demo_03.xlsx’, usecols=[‘name’, ‘sex’])
  • 注意:如果没有执行导出语句,那么在代码编辑器中运行的结果是不会改变源数据的
  • 导出为Excel:df.to_excel(‘./data/demo_08_rank.xlsx’)

2、导入csv文件:

  • 导入csv,并指定编码格式:pd.read_csv(‘./data/demo_03.csv’, encoding=‘utf-8’)

3、导入txt文件:

  • pd.read_csv(‘./data/demo_03.txt’, encoding=‘utf-8’, sep=‘\t’) # sep是指定分隔符

4、导入json,并指定数据结构:

  • json是一种轻量级的数据交换格式,它使用文本进行格式化和编码,通常用于Web服务之间的数据传输。
    • json:非表单结构,读取无意义
    • json:表单结构(split, records, index, table, values),读取有意义
    • 举例:pd.read_json(‘./data/records.json’, orient=‘records’) # orient参数具体给什么就看要导入的数据是类型的json的
  • 在 pd.read_json 函数中,还可以设置其它的 orient 值(类似于第一个参数),以便按照不同的数据结构将 JSON 文件读入到 Pandas 数据库中来供进一步操作。常见的除了 “records” 还包括 “index”、“columns”、“values” 和 “table” 等,具体格式如下:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/木道寻08/article/detail/937828
推荐阅读
相关标签
  

闽ICP备14008679号