赞
踩
keep_default_na = False:
在利用read_csv读入数据时,对于空数据,pandas默认为NAN填充,利用这个语句可以用Null覆盖NAN.
NAN与任何数据都不相等,包括它本身。
对于NULL,判断字段是否是空省值:
training_set.date == 'null'
对于NAN,判断字段是否是空省值:
training_set.date == training_set.date
1、df.isnull()
元素级别的判断,把对应的所有元素的位置都列出来,元素为空或者NA就显示True,否则就是False
2、df.isnull().any()
列级别的判断,只要该列有为空或者NA的元素,就为True,否则False
3、df.isnull().sum()
将列中为空的个数统计出来
4、df[df.isnull().values==True]
可以只显示存在缺失值的行列,清楚的确定缺失值的位置。
5、test.columns[test.isnull().any()].tolist() #test是dataframe对象
将为空或者NAN的列找出来
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。