当前位置:   article > 正文

机器学习--条件熵和信息增益的关系,怎么理解条件熵?

熵和信息增益的关系

熵的概念:

表示一个随机变量的复杂性或者不确定性。

举例:

假如双十一我要剁手买一件衣服,但是我一直犹豫着要不要买,我决定买这件事的不确定性(熵)为2.6。

条件熵的概念:

表示在直到某一条件后,某一随机变量的复杂性或不确定性。

举例:
  • 我在看了这件衣服的评价后,我决定买衣服这件事的不确定性是1.2。
  • 我在线下实体店试穿衣服后,我决定买衣服这件事的不确定性是0.9。

信息增益的概念:

表示在知道某一条件后,某一随机变量的不确定性的减少量。

上面条件熵给出了两个:
  • 一个是看了网上的评价,此时的信息增益是

    Gain1=2.6−1.2=1.4Gain1=2.6−1.2=1.4
    
    • 1
  • 另一个是线下试穿了衣服,此时的信息增益

    Gain2=2.6−0.9=1.7Gain2=2.6−0.9=1.7
    
    • 1

很显然我在线下试穿衣服之后对于决定买这件衣服的不确定度下降更多,更通俗的说就是我试穿衣服之后买这件衣服的可能性更大了。所以如果有看买家评价和线下试穿两个属性,首先应该选择线下试穿来构建内部节点。

条件熵的实列:

例子:

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/329394
推荐阅读
相关标签
  

闽ICP备14008679号