当前位置:   article > 正文

pandas笔记之缺失值处理_df.isnull() 怎么取true

df.isnull() 怎么取true

缺失值处理

缺失值

null

#查看缺失值
df.isnull()/df.notnull()
#查看字段缺失值
df.isnull().any()  # 列中是否存在空值,只要有一个缺失值即为True
df.isnull().sum() # 每个列属性的缺失值总数
df.isna().sum() 
#锁定缺失值存在的行
df[df.isnull().values==True]
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

删除

isna与null的用法相同
df.dropna() #删除缺失值 默认axis=0行删除
df1.dropna(axis=1) #axis=1列删除还可用axis="index"或axis="columns"


df.dropna(how='any')#how="any":至少有一个缺失值就删除,默认方式
#how="all":全部是缺失值删除

df1.dropna(thresh=6)#至少6个列属性不缺失才不会删除

df1.dropna(subset=['外语'])
#subset表示的使用指定通过某个子集元素来进行删除。可以是一个或者多个,多个使用列表形式
df1.dropna(subset=['外语','语文'])#共同为null才会删除

df.dropna(inplace=True)#df会改变
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

填充

df.fillna()#填充缺失值
df2.fillna(0)#指定填充数据 df2.fillna(value=2)

#通过字典的形式进行填充,字典的键是我们的列属性名称:
values={"A":2,"B":5,"C":7,"D":9}
df2.fillna(value=values)

df2['B'].fillna(df2['B'].mean())#用缺失值的均值填充

df2.fillna(value=2,limit=2)#limit表示的是缺失值的最多填充个数

df2.fillna(method='ffill') #向前面的那个数填充
#ffill、pad:用缺失值前一个值填充,bfill、backfill:用缺失值后一个数值填充

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号