当前位置:   article > 正文

【Python】DataFrame基本数据基本导入处理_dataframe导入文件数据

dataframe导入文件数据

自己学习的代码整理文件,方便使用,想起来还会再接着补充

读取文件

  1. import pandas as pd
  2. #csv,excel,txt文件导入代码
  3. ##index_colindex_col='列名' 把此列作为index列
  4. csv_data = pd.read_csv('文件路径.csv',encoding='utf-8')
  5. excel_data = pd.read_excel('文件路径.xlsx',encoding='utf-8',encoding='utf-8')
  6. txt_data = pd.read_table('文件路径.txt',encoding='utf-8')

存储文件

  1. # sep='\t';index=False; encoding='utf-8'
  2. csv_data.to_csv('文件名.csv')
  3. txt_data.to_csv('文件名.txt')
  4. excel_data.to_excel('文件名.xlsx')

更改Dataframe列名

data.columns=['列名1','列名2','列名3']

删除列、行

  1. #labels:要删除的行或列,用列表给出
  2. #axis:默认为0,指要删除的是行,删除列时需指定axis为1
  3. #index :直接指定要删除的行,删除多行可以使用列表作为参数
  4. #columns:直接指定要删除的列,删除多列可以使用列表作为参数
  5. #inplace = True 覆盖之前的DataFrame
  6. data.drop('列名',axis=1)

索引设置

  1. #inplace=True 将序列号设置为索引
  2. #drop = True 删除原始的索引
  3. #如果要将原始索引保留为数据字符串,则可以在reset_index之后使用set_index
  4. data.reset_index()
  5. data.set_index()

缺失值删除

  1. #inplace = True
  2. #删除缺失行
  3. data.dropna()
  4. #删除缺失列
  5. data.dropna(axis=1)
  6. data.dropna(axis='columns')
  7. # 删除所有值都缺失的行
  8. data.dropna(how = 'all')
  9. # 删除至少有两个缺失值的行
  10. data.dropna(thresh = 2)
  11. # 判断缺失值的列范围
  12. data.dropna(subset = ['列1','列2'])
  13. # 指定列的缺失值删除
  14. data.列名.dropna()

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/153153
推荐阅读
相关标签
  

闽ICP备14008679号