当前位置:   article > 正文

C4.5算法_有13个可能的候选阈值点,比如:过计算 最佳点,如图中红线所示。计算

有13个可能的候选阈值点,比如:过计算 最佳点,如图中红线所示。计算

C4.5是另一个分类决策树算法,基于ID3算法进行改进,相比于ID3算法有如下几个要点:

  1. 用信息增益率来选择属性。ID3选择属性用的是子树的信息增益,ID3使用的是熵(entropy, 熵是一种不纯度度量准则),也就是熵的变化值,而C4.5用的是信息增益率。
  2. 在决策树构造过程中进行剪枝,因为某些具有很少元素的结点可能会使构造的决策树过适应(Overfitting),如果不考虑这些结点可能会更好。
  3. 对非离散数据也能处理。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/你好赵伟/article/detail/612025
推荐阅读
相关标签
  

闽ICP备14008679号