当前位置:   article > 正文

【证明】期望风险最小化等价于后验概率最大化_期望风险最小化 后验概率最大化

期望风险最小化 后验概率最大化

引言

在《统计学习方法》一书中,详细说明了期望风险最小化与后验概率最大化之间的关系,但是其中的公式推导过程有所省略,这篇文章作为补充说明。

证明

首先我们假设损失函数为0-1损失函数

L o s s = L ( Y , f ( X ) ) = { 1 , Y ≠ f ( X ) 0 , Y = f ( X ) Loss=L(Y, f(X))=

{1Yf(X)0Y=f(X)
Loss=L(Yf(X))={1Y=f(X)0Y=f(X)

则期望风险为

R e x p ( f ) = R e x p ( L ( Y , f ( X ) ) ) = ∫ X ⋅ Y L ( y , f ( x ) ) P ( y , x ) d x d y = ∫ X ⋅ Y L ( y , f ( x ) ) P ( y ∣ x ) P ( x ) d x d y = ∫ X ∫ Y L ( y , f ( x ) ) P ( y ∣ x ) d y P ( x ) d x = ∫ X ( ∫ Y L ( y , f ( x ) ) P ( y ∣ x ) d y ) P ( x ) d x = E x ( ∫ Y L ( y , f ( X ) ) P ( y ∣ X ) d y )

Rexp(f)=Rexp(L(Y,f(X)))=XYL(y,f(x))P(y,x)dxdy=XYL(y,f(x))P(y|x)P(x)dxdy=XYL(y,f(x))P(y|x)dyP(x)dx=X(YL(y,f(x))P(y|x)dy)P(x)dx=Ex(YL(y,f(X))P(y|X)dy)
Rexp(f)=Rexp(L(Y,f(X)))=XYL(y,f(x))P(y,x)dxdy=XYL(y,f(x))P(yx)P(x)dxdy=XYL(y,f(x))P(yx)dyP(x)dx=X(YL(y,f(x))P(yx)dy)P(x)dx=Ex(YL(y,f(X))P(yX)dy)

朴素贝叶斯估计中是数据是离散的,故

R e x p ( f ) = E x ( ∫ Y L ( y , f ( X ) ) P ( y ∣ X ) d y ) = E x ( ∑ k K L ( c k , f ( X ) ) P ( c k ∣ X ) )

Rexp(f)=Ex(YL(y,f(X))P(y|X)dy)=Ex(kKL(ck,f(X))P(ck|X))
Rexp(f)=Ex(YL(y,f(X))P(yX)dy)=Ex(kKL(ck,f(X))P(ckX))

因此如果要使得期望风险最小化只需要对 X = x X=x X=x逐个极小化即可

F ( x ) = argmin ⁡ y ∈ Y ∑ k K L ( c k , y ) P ( c k ∣ X = x ) ∵ y = f ( X = x ) ∵ E q u a t i o n ( 1 ) w h e n y = c k L ( c k , y ) = 0 = argmin ⁡ y ∈ Y ∑ k K P ( c k ≠ y ∣ X = x ) ∵ E a c h X = x h a s o n l y o n e c k = y = f ( X = x ) = argmin ⁡ y ∈ Y ( 1 − P ( c k = y ∣ X = x ) ) = argmax ⁡ y ∈ Y P ( c k = y ∣ X = x )

F(x)=argminyYkKL(ck,y)P(ck|X=x)y=f(X=x)Equation(1)wheny=ckL(ck,y)=0=argminyYkKP(cky|X=x)EachX=xhasonlyoneck=y=f(X=x)=argminyY(1P(ck=y|X=x))=argmaxyYP(ck=y|X=x)
F(x)=yYargminkKL(ck,y)P(ckX=x)y=f(X=x)Equation(1)wheny=ckL(ck,y)=0=yYargminkKP(ck=yX=x)EachX=xhasonlyoneck=y=f(X=x)=yYargmin(1P(ck=yX=x))=yYargmaxP(ck=yX=x)

结论

可证期望风险最小化等价于后验概率最大化

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/351893
推荐阅读
相关标签
  

闽ICP备14008679号