当前位置:   article > 正文

第四章朴素贝叶斯法.4.3 期望风险最小化_朴素贝叶斯 期望风险最小化等价于后验概率最大化

朴素贝叶斯 期望风险最小化等价于后验概率最大化


本课程来自深度之眼,部分截图来自课程视频以及李航老师的《统计学习方法》第二版。
公式输入请参考: 在线Latex公式

后验概率最大化

后验概率最大化等价于期望风险最小化
已知条件:
假设朴素贝叶斯使用0-1损失函数,可以写为:
L ( Y , f ( x ) ) = { 1 ,  if  Y ≠ f ( x ) 0 ,  if  Y = f ( ) x L(Y,f(x))={1, if Yf(x)0, if Y=f()x

{1, if Yf(x)0, if Y=f()x
L(Y,f(x))={1, if Y=f(x)0, if Y=f()x
此时期望风险为:
E e x p ( f ) = E [ L ( Y , f ( x ) ) ] E_{exp}(f)=E[L(Y,f(x))] Eexp(f)=E[L(Y,f(x))]
由于这里是分类和样本是离散的,所以上面的期望风险可以写成:
∑ X ∑ Y L ( Y , f ( x ) ) p ( x , y ) = ∑ X ∑ Y L ( Y , f ( x ) ) p ( y ∣ x ) p ( x ) = ∑ X [ ∑ Y L ( Y , f ( x ) ) p ( y ∣ x ) ] p ( x ) \sum_X\sum_YL(Y,f(x))p(x,y)\\ =\sum_X\sum_YL(Y,f(x))p(y|x)p(x)\\ =\sum_X\left[\sum_YL(Y,f(x))p(y|x)\right]p(x) XYL(Y,f(x))p(x,y)=XYL(Y,f(x))p(yx)p(x)=X[YL(Y,f(x))p(yx)]p(x)
可以看到中括号外面是针对所有样本进行求和,因此如果针对期望风险最小化,等价于对中括号里面的东西求最小化:
min ⁡ ∑ Y L ( Y , f ( x ) ) p ( y ∣ x ) \min \sum_YL(Y,f(x))p(y|x) minYL(Y,f(x))p(yx)
如果Y代表K个分类 C k C_k Ck,上式中 ∑ Y \sum_Y Y是针对所有K个类别进行求和,所以可以写为:
∑ k = 1 K [ L ( C k , f ( x ) ) ] P ( C k ∣ X = x ) \sum_{k=1}^K[L(C_k,f(x))]P(C_k|X=x) k=1K[L(Ck,f(x))]P(CkX=x)
也就变成要使得上式最小。

推导

从上面的简单推导得到要证明的东西:
f ( x ) = arg min ⁡ y ∈ Y ∑ k = 1 K [ L ( C k , y ) ] P ( C k ∣ X = x ) f(x)=\underset{y\in Y}{\argmin}\sum_{k=1}^K[L(C_k,y)]P(C_k|X=x) f(x)=yYargmink=1K[L(Ck,y)]P(CkX=x)
可以看到 L ( C k , y ) L(C_k,y) L(Ck,y)中前者是标签,后者是预测值,如果 C k = y C_k=y Ck=y,则 L ( C k , y ) = 0 L(C_k,y)=0 L(Ck,y)=0,因此在累加求和中不用算,只用计算 C k ≠ y C_k\ne y Ck=y的情况,因此上式写为:
f ( x ) = arg min ⁡ y ∈ Y ∑ k = 1 K P ( C k ≠ y ∣ X = x ) f(x)=\underset{y\in Y}{\argmin}\sum_{k=1}^KP(C_k\ne y|X=x) f(x)=yYargmink=1KP(Ck=yX=x)
求和所有 C k ≠ y C_k\ne y Ck=y的概率,等价于 1 − P ( C k = y ∣ X = x ) 1-P(C_k= y|X=x) 1P(Ck=yX=x)的概率,这里理解为预测值x只会属于某一个类别,因此,1减去属于某个类别的概率等价于预测值不属于其他所有类别的概率。因此上式可以写为:
f ( x ) = arg min ⁡ y ∈ Y ( 1 − P ( C k = y ∣ X = x ) ) f(x)=\underset{y\in Y}{\argmin}\left(1-P(C_k= y|X=x)\right) f(x)=yYargmin(1P(Ck=yX=x))
然后转换为最大化问题:
f ( x ) = arg max ⁡ y ∈ Y P ( C k = y ∣ X = x ) f(x)=\underset{y\in Y}{\argmax}P(C_k= y|X=x) f(x)=yYargmaxP(Ck=yX=x)
由此可得,期望风险最小化准则变成了后验概率最大化准则。也就是朴素贝叶斯所采用的定理。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/351912
推荐阅读
相关标签
  

闽ICP备14008679号