【Python】DataFrame基本数据基本导入处理_dataframe导入文件数据

作者：小小林熬夜学编程 | 2024-02-27 13:03:21

踩

dataframe导入文件数据

自己学习的代码整理文件，方便使用，想起来还会再接着补充

读取文件


import pandas as pd
#csv,excel,txt文件导入代码 
##index_colindex_col='列名' 把此列作为index列
csv_data = pd.read_csv('文件路径.csv',encoding='utf-8')
excel_data = pd.read_excel('文件路径.xlsx',encoding='utf-8',encoding='utf-8')
txt_data = pd.read_table('文件路径.txt',encoding='utf-8')

存储文件


# sep='\t';index=False; encoding='utf-8'
csv_data.to_csv('文件名.csv')
txt_data.to_csv('文件名.txt')
excel_data.to_excel('文件名.xlsx')

更改Dataframe列名

data.columns=['列名1','列名2','列名3']

删除列、行


#labels：要删除的行或列，用列表给出
#axis：默认为0，指要删除的是行，删除列时需指定axis为1
#index ：直接指定要删除的行，删除多行可以使用列表作为参数
#columns：直接指定要删除的列，删除多列可以使用列表作为参数
#inplace = True 覆盖之前的DataFrame
data.drop('列名',axis=1)

索引设置


#inplace=True 将序列号设置为索引
#drop = True 删除原始的索引
#如果要将原始索引保留为数据字符串，则可以在reset_index之后使用set_index
data.reset_index()
data.set_index（）

缺失值删除


#inplace = True
#删除缺失行
data.dropna()
 
#删除缺失列
data.dropna(axis=1) 
data.dropna(axis='columns') 
 
# 删除所有值都缺失的行
data.dropna(how = 'all')
 
# 删除至少有两个缺失值的行
data.dropna(thresh = 2)
 
# 判断缺失值的列范围
data.dropna(subset = ['列1','列2'])
 
# 指定列的缺失值删除
data.列名.dropna()

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/153153