赞
踩
废话不多说,直接开讲!
一、
df.dtypes:用于查看各列的数据类型
不同数据类型之间的转换,其使用方法如下:
- #将df里所有的列转换成str
- df.astype('str')
- df.astype('str').dtypes
- #修改某一列数据的数据类型
- df.column.astype ('str')
- #转换错误
- df.astype('int', errors = 'ignore').dtypes #明确指定转换类型的函数:
Pandas中的Index,其实是不可变的一维数组
- ind=pd.Index([3,4,5,6,7])
- #根据下标获取值
- ind[3]
- #切片获取值
- # ind[::2]
- #有ndim shap dtype size属性
- #但不能进行修改,如果修改就会报错
- # ind[3]=20
- import pandas as pd
- pd.read_excel('stu_data.xlsx')
- pd.read_excel('stu_data.xlsx',sheet_name='Target')
- pd.read_excel('stu_data.xlsx',sheet_name=0)
pd.read_excel('stu_data.xlsx',sheet_name=0,index_col=0)
- pd.read_excel('stu_data.xlsx',sheet_name=0,header=1)
- pd.read_excel('stu_data.xlsx',sheet_name=0,header=None)
pd.read_excel('stu_data.xlsx',usecols=[1,2,3])
pd.read_csv('stu_data.csv',encoding='gbk')
- df =pd.read_csv("stu_data.csv",encoding='gbk',sep=' ')
- pd.read_csv('stu_data.csv',encoding='gbk',sep=',')
导入.txt文件用得方法时read_table(),read_table()是将利用分隔符分开的文件导入。DataFrame的通用函数。它不仅仅可以导入.txt文件,还可以导入.csv文件。
pd.read_table('test_data.txt',encoding='utf8',sep='\t')
pd.read_table('stu_data.csv',encoding='gbk',sep=',')
- df.columns =新的名称 list
- df.columns
df.rename(columns =新旧名称字典:{旧名称,:新名称,}inplace = False :是否直接替换原数据框)
df.rename(columns ={'newname':'name','newname2':'name2'},inplace = True )
- df[[var]] #单列的筛选结果为 DataFream
- df[['var1', 'var2']]#多列时,列名需要用列表形式提供(因此可使用列表中的切片操作)多列的筛选结果为DF
df.drop(index / columns =准备删除的行/列标签,多个时用列表形式提供,inplace = False :是否直接更改原数据框 )
用del删除,del删除的是全部删除,内存中都会删除
- df.drop(columns =['col1','col2'])
- del df['column-name'] 直接删除原数据框相应的一列,建议尽量少用
- del df.column_name #不允许
df[cloumn]=pd.Series([val,val2,val3],index=[c1,c2,c3])
df[cloumn] = df[c2]+df[c3]
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。