当前位置:   article > 正文

机器学习基于缺失值的填充法则_18340082396

18340082396

代码数据网址:https://work.datafountain.cn/forum?id=68&type=2&source=1

  1. ### 导入数据集
  2. import numpy as np # Python中进行数值计算的库
  3. import pandas as pd # Python中进行数据处理的库
  4. import warnings
  5. warnings.filterwarnings('ignore') # 忽略弹出的warnings
  6. data=pd.read_csv("loan.csv",encoding="utf-8")
  7. data.head(5)
  8. print(data.shape)
  9. me v:18340082396

查看缺失值的情况

  1. ### 查看数据集缺失情况
  2. missingDf = data.isnull().sum().sort_values(ascending=False).reset_index()
  3. missingDf.columns = ['feature', 'miss_num']
  4. missingDf['miss_percentage'] = missingDf['miss_num'] / data.shape[0] # 缺失值比例 data.shape= (400000, 145)
  5. missingDf.head(10) # 缺失值最多的前十列特征

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/552296
推荐阅读
相关标签
  

闽ICP备14008679号