赞
踩
#查看缺失值
df.isnull()/df.notnull()
#查看字段缺失值
df.isnull().any() # 列中是否存在空值,只要有一个缺失值即为True
df.isnull().sum() # 每个列属性的缺失值总数
df.isna().sum()
#锁定缺失值存在的行
df[df.isnull().values==True]
isna与null的用法相同
df.dropna() #删除缺失值 默认axis=0行删除
df1.dropna(axis=1) #axis=1列删除还可用axis="index"或axis="columns"
df.dropna(how='any')#how="any":至少有一个缺失值就删除,默认方式
#how="all":全部是缺失值删除
df1.dropna(thresh=6)#至少6个列属性不缺失才不会删除
df1.dropna(subset=['外语'])
#subset表示的使用指定通过某个子集元素来进行删除。可以是一个或者多个,多个使用列表形式
df1.dropna(subset=['外语','语文'])#共同为null才会删除
df.dropna(inplace=True)#df会改变
df.fillna()#填充缺失值
df2.fillna(0)#指定填充数据 df2.fillna(value=2)
#通过字典的形式进行填充,字典的键是我们的列属性名称:
values={"A":2,"B":5,"C":7,"D":9}
df2.fillna(value=values)
df2['B'].fillna(df2['B'].mean())#用缺失值的均值填充
df2.fillna(value=2,limit=2)#limit表示的是缺失值的最多填充个数
df2.fillna(method='ffill') #向前面的那个数填充
#ffill、pad:用缺失值前一个值填充,bfill、backfill:用缺失值后一个数值填充
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。