当前位置:   article > 正文

python 特征筛选_python中feature-list怎么用

python中feature-list怎么用
  1. #特征初筛
  2. #如果是分类问题:对于分类变量,分析较多类的变迁分布是否差异明显,此类变量不删除
  3. #这里回归问题 则 不考虑
  4. def Remove_singleValue_var(df,var_list):
  5. # 变量取值同一性,删除
  6. Sigle_var = [i for i in df
  7. if df[i].value_counts().sort_values(ascending=False)
  8. .values[0]/len(df) > 0.99]
  9. return Sigle_var
  10. def Remove_low_variance(df,var_list,std_lower=1):
  11. low_variance_var=[]
  12. for i in var_list:
  13. if (len(df[i].value_counts())>10) and (df[i].std()<std_lower):
  14. low_variance_var.append(i)
  15. return low_variance_var
  16. #树模型重要度特征选择
  17. from sklearn.ensemble import RandomForestRegressor
  18. from sklearn.model_selection import KFold
  19. def Select_feature(df,label,col_num=100,n_folds=3):
  20. #X是不含id 的數據,X=self.allldata[:len(self.train)]
  21. '''使用extra tree 进行特征选择'''
  22. '''param:data 数据'''
  23. '''param:col_num 每
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/很楠不爱3/article/detail/140882?site
推荐阅读
相关标签
  

闽ICP备14008679号