当前位置:   article > 正文

最小二乘法的平方损失函数的推导_平方误差函数求导

平方误差函数求导

理论推导

在线性模型中,假设预测结果与实际结果有误差为 ε ( i ) \varepsilon^{(i)} ε(i)
则线性模型中,误差可以表示为
ε ( i ) = y ( i ) − θ T x ( i ) \varepsilon^{(i)} = y^{(i)} - \theta^Tx^{(i)} ε(i)=y(i)θTx(i)
根据中心极限定律,假设误差 ε ( i ) \varepsilon^{(i)} ε(i)服从标准正态分布,则可以得到
p ( y ( i ) ∣ x ( i ) ; θ ) = 1 2 π σ e ( − y ( i ) − θ T x ( i ) 2 σ 2 ) p(y^{(i)}|x^{(i)};\theta) = \frac{1}{\sqrt{2\pi}\sigma} e^{(-\frac{y^{(i)} - \theta^Tx^{(i)}}{2\sigma^{2}})} p(y(i)x(i);θ)=2π σ1e(2σ2y(i)θTx(i))
根据最大似然估计得到
L ( u , σ 2 ) = ∏ i = 1 n 1 2 π σ e − ( ε i − u ) 2 2 σ 2 L(u,\sigma^2) = \prod_{i=1}^{n} \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(\varepsilon_i-u)^2}{2 \sigma^2}} L(u,σ2)=i=1n2π σ1e2σ2(εiu)2
取对数得到
l n ( L ( u , σ 2 ) ) = − n 2 l n σ 2 − n 2 l n 2 π − ∑ i = 1 n ( ε i − u ) 2 2 σ 2 ln(L(u,\sigma^2)) = -\frac{n}{2}ln\sigma^2-\frac{n}{2}ln2\pi-\frac{\sum_{i=1}^{n}(\varepsilon_i-u)^2}{2 \sigma^2} ln(L(u,σ2))=2nlnσ22nln2π2σ2i=1n(εiu)2
为了使似然函数最大,式中的 σ \sigma σ在上面的假设中为一个定值,所以要使得似然函数取最大,则 1 2 ∑ i = 1 n ( ε i − u ) 2 {\frac{1}{2}\sum_{i=1}^{n}(\varepsilon_i-u)^2} 21i=1n(εiu)2需要最小,得到平方损失函数为:
J ( θ ) = 1 2 ∑ i = 1 n ( y ( i ) − θ T x ( i ) ) 2 J(\theta) = \frac{1}{2} \sum_{i=1}^{n}(y^{(i)} - \theta^Tx^{(i)})^2 J(θ)=21i=1n(y(i)θTx(i))2

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/279584
推荐阅读
相关标签
  

闽ICP备14008679号