赞
踩
- import pandas as pd
- #csv,excel,txt文件导入代码
- ##index_colindex_col='列名' 把此列作为index列
- csv_data = pd.read_csv('文件路径.csv',encoding='utf-8')
- excel_data = pd.read_excel('文件路径.xlsx',encoding='utf-8',encoding='utf-8')
- txt_data = pd.read_table('文件路径.txt',encoding='utf-8')
- # sep='\t';index=False; encoding='utf-8'
- csv_data.to_csv('文件名.csv')
- txt_data.to_csv('文件名.txt')
- excel_data.to_excel('文件名.xlsx')
data.columns=['列名1','列名2','列名3']
- #labels:要删除的行或列,用列表给出
- #axis:默认为0,指要删除的是行,删除列时需指定axis为1
- #index :直接指定要删除的行,删除多行可以使用列表作为参数
- #columns:直接指定要删除的列,删除多列可以使用列表作为参数
- #inplace = True 覆盖之前的DataFrame
- data.drop('列名',axis=1)
- #inplace=True 将序列号设置为索引
- #drop = True 删除原始的索引
- #如果要将原始索引保留为数据字符串,则可以在reset_index之后使用set_index
- data.reset_index()
- data.set_index()
- #inplace = True
- #删除缺失行
- data.dropna()
-
- #删除缺失列
- data.dropna(axis=1)
- data.dropna(axis='columns')
-
- # 删除所有值都缺失的行
- data.dropna(how = 'all')
-
- # 删除至少有两个缺失值的行
- data.dropna(thresh = 2)
-
- # 判断缺失值的列范围
- data.dropna(subset = ['列1','列2'])
-
- # 指定列的缺失值删除
- data.列名.dropna()

Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。