当前位置:   article > 正文

【Python】特征选择方法_python 特征选择代码

python 特征选择代码

​​​​​​特征选择作用:

1. 减少特征数量、降维,加强模型的泛化能力,减少过拟合

2. 增强对特征和特征值之间的理解

特征选择方法:

Pearson相关系数——单变量选择

该方法衡量变量之间的线性相关性,取值范围为【-1,1】、

-1表示完全负相关;0表示完全没有线性关系;+1表示完全正相关。

优点:速度快,易于计算

缺点:只能衡量线性相关性

Python代码:使用scipy.stats的 pearsonr函数:

  1. import numpy as np
  2. from scipy.stats import pearsonr
  3. np.random.seed(0)
  4. size = 300
  5. x = np.random.normal(0, 1, size)
  6. y = x + np.random.normal(0, 1, size)
  7. print("Pearsonr", pearsonr(x, y))

随机森林回归——单变量选择

思路:直接使用机器学习算法针对每个单独的特征和因变量建立预测模型。

Python代码:

  1. import numpy as np
  2. from sklearn.model_selection import KFold,cross_val_score,ShuffleSplit
  3. from sklearn.datasets import load_boston
  4. from sklearn.ensemble import RandomForestRegressor
  5. #Load boston housing dataset as an example
  6. bost
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/358955
推荐阅读
相关标签
  

闽ICP备14008679号