赞
踩
接上一篇
print("Feature importances:\n{}".format(tree.feature_importances_))
def plot_feature_importances_cancer(model):
n_features = cancer.data.shape[1]
plt.barh(range(n_features), model.feature_importances_, align='center')
plt.yticks(np.arange(n_features), cancer.feature_names)
plt.xlabel("Feature importance")
plt.ylabel("Feature")
plot_feature_importances_cancer(tree)
顶部划分用到的特征(“worst radius”)是最重要的特征。
这也证实了我们
在分析树时的观察结论,即第一层划分已经将两个类别区分得很好。
但是,如果某个特征的 feature_importance_ 很小,并不能说明这个特征没有提供任何信
息。这只能说明该特征没有被树选中,可能是因为另一个特征也包含了同样的信息
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。