当前位置:   article > 正文

logit回归模型假设_logistic回归模型分析

logistic模型的基本假设是什么

logistic回归模型是一种线性生成模型。本文将介绍logistic回归模型相关的知识,为了更好地理解模型的决策边界函数,本文同时分析了多元变量的协方差对概率分布的影响。

本文脉络:logistic回归模型的含义

logistic模型的决策边界函数分析

logistic模型的参数最优化

logistic回归模型与感知机模型的比较

总结

logistic回归模型的含义

我们把分类模型分成两个阶段,推断阶段和决策阶段,推断阶段对联合概率分布建模,然后归一化,得到后验概率。决策阶段确定每个新输入x的类别。

我们用推断阶段的方法来推导logistic回归模型,首先对类条件概率密度

equation?tex=p%28%5Coverrightarrow%7Bx%7D%7CC_%7Bk%7D%29 和类先验概率分布

equation?tex=p%28C_%7Bk%7D%29 建模,然后通过贝叶斯定理计算后验概率密度。

考虑二分类的情形,类别C1的后验概率密度;

equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29+%3D+%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%29%7D

equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29+%3D+%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%2BP%28%5Coverrightarrow%7Bx%7D%7CC2%29P%28C2%29%7D

equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29+%3D+%5Cfrac%7B1%7D%7B1%2B%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC2%29P%28C2%29%7D+%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D+%7D

equation?tex=ln%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%7CC2%29P%28C2%29%7D+%3D+%5Calpha

则:

equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29+%3D+%5Cfrac%7B1%7D%7B1%2Be%5E%7B-%5Calpha%7D%7D+%3D+%5Csigma%28%5Calpha%29

式中的

equation?tex=%5Csigma%28%5Calpha%29 就是logistic函数

因此,logistic回归的值等于输入变量为x的条件下类别为C1的概率

equation?tex=P%28C1%7C%5Coverrightarrow%7Bx%7D%29

equation?tex=%5Csigma%28%5Calpha%29+%3D+%5Cfrac%7B1%7D%7B1%2Be%5E%7B-a%7D%7D

equation?tex=%5Calpha+%3D+ln%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%7CC1%29P%28C1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%7CC2%29P%28C2%29%7D

equation?tex=a+%3D+ln%5Cfrac%7BP%28%5Coverrightarrow%7Bx%7D%2CC1%29%7D%7BP%28%5Coverrightarrow%7Bx%7D%2CC2%29%7D

(1) 当

equation?tex=a+%5Cge+0%E6%97%B6%2CP%28%5Coverrightarrow%7Bx%7D%2CC1%29+%5Cge+P%28%5Coverrightarrow%7Bx%7D%2CC2%29%2CP%28C1%7C%5Coverrightarrow%7Bx%7D%29%5Cge+%5Cfrac%7B1%7D%7B2%7D 分类结果为C1

(2) 当

equation?tex=a+%3C+0+%E6%97%B6%2CP%28%5Coverrightarrow%7Bx%7D%2CC1%29+%3C+P%28%5Coverrightarrow%7Bx%7D%2CC2%29%2CP%28C1%7C%5Coverrightarrow%7Bx%7D%29%3C%5Cfrac%7B1%7D%7B2%7D 分类结果为C2

结论:logistic回归值表示所属类的后验概率,无论是二分类还是多分类,分类结果都是后验概率最大所对应的类。

logistic的决策边界函数分析

决策边界函数,简而言之,就是函数的两侧是不同的分类结果。

可定性的分析协方差的三种情况与分布图的关系。

(a) 图表示正常的协方差矩阵的高斯分布图。

(b) 图表示协方差矩阵是对角矩阵的高斯分布图。

(c) 图表示协方差矩阵是对角矩阵且对角元素都相等的高斯分布图。

logistic的决策边界函数分析

logistic曲线如下图,红色直线(a=0)表示决策边界函数:

假设类条件概率密度是高斯分布,即P(x|Ck),然后求解后验概率的表达式,即P(Ck|x)。我们知道,logistic回归值就是所求的后验概率。

假设类条件概率密度的协方差相同,类条件概率密度为:

equation?tex=p%28x%7CC_%7Bk%7D%29+%3D+%5Cfrac%7B1%7D%7B%282+%5CPi%29%5E%7B%5Cfrac%7BD%7D%7B2%7D%7D%7D+%5Cfrac%7B1%7D%7B%7C%5Csum%7C%5E%7B%5Cfrac%7B1%7D%7B2%7D%7D%7D+exp%7B+-%5Cfrac%7B1%7D%7B2%7D%28x+-+%5Cmu_%7Bk%7D%29%5E%7BT%7D+%5Csum%5E%7B-1%7D%7D+%28x-%5Cmu_%7Bk%7D%29

由上面的推导公式得后验概率为:

equation?tex=P%28C_%7Bk%7D%7Cx%29+%3D+%5Csigma%28w_%7Bk%7D%5E%7BT%7Dx+%2B+w_%7Bk0%7D%29

其中:

equation?tex=w_%7Bk%7D+%3D+%5Csum%5E%7B-1%7D+%5Cmu_%7Bk%7D

equation?tex=w_%7Bk0%7D+%3D+-%5Cfrac%7B1%7D%7B2%7D%5Cmu_%7Bk%7D%5E%7BT%7D%5Csum%5E%7B-1%7D%5Cmu_%7Bk%7D+%2B+ln+p%28C_%7Bk%7D%29

由后验概率

equation?tex=%28P%28C_%7Bk%7D%7Cx%29%29 的表达式可知,当类条件的协方差矩阵相等时,决策边界函数是随x线性变化的直线。

结论:如下图,若两类的条件概率密度的协方差相同时(如C1和C2的协方差相同),则决策边界函数是直线;若两类的条件概率密度的协方差不相同时(如C1和C3,C2和C3),则决策边界函数是曲线。判断协方差矩阵是否相同可以根据分布图形形状是否相同来判断,如C1和C2的协方差相同,C3和C1、C2的协方差不相同。

假设类条件概率密度符合高斯分布且具有相同的协方差矩阵,则决策边界函数是一条直线;若类条件概率密度符合更一般的指数分布且缩放参数s相同,决策边界函数仍然是一条直线。

logistic模型的参数最优化

logistic模型损失函数

logistic回归模型的含义是后验概率分布,因此可以从概率的角度去设计损失函数。

考虑两分类情况,假设有N个训练样本,logistic模型是

equation?tex=h_%7B%5Ctheta%7D%28x%29%EF%BC%8Ch_%7B%5Ctheta%7D%28x%29 表示后验概率y=1的概率,则

equation?tex=1-h_%7B%5Ctheta%7D%28x%29 表示y=0的概率,变量

equation?tex=y_%7Bi%7D 取值1或0,且分别代表模型

equation?tex=h_%7B%5Ctheta%7D%28x%29%E5%92%8C1-h_%7B%5Ctheta%7D%28x%29

因此,似然函数

equation?tex=L%28%5Ctheta%29%3A

equation?tex=L%28%5Ctheta%29+%3D+%5Cprod_%7Bi%3D1%7D%5E%7BN%7D%28h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29%281-h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29

损失函数

equation?tex=J%28%5Ctheta%29%EF%BC%9A

equation?tex=J%28%5Ctheta%29+%3D+-L%28%5Ctheta%29

equation?tex=J%28%5Ctheta%29+%3D+-%5Cprod_%7Bi%3D1%7D%5E%7BN%7D%28h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29%281-h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29

logistic模型的参数最优化

损失函数最小化等价于模型参数的最优化,如下图:

equation?tex=J%28%5Ctheta%29+%3D+-%5Cprod_%7Bi%3D1%7D%5E%7BN%7D%28h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29%281-h_%7B%5Ctheta%7D%28x%29%5E%7By_%7Bi%7D%7D%29

equation?tex=%28J%28%5Ctheta%29%29min+%3D+ln+%28J%28%5Ctheta%29%29min

equation?tex=ln+%28J%28%5Ctheta%29%29+%3D+-%5Cprod_%7Bi%3D1%7D%5E%7BN%7D+%28y_%7Bi%7Dln+%28h_%7B%5Ctheta%7D%28x%29%29+%2B+%281-y_%7Bi%7D%29ln+%281-h_%7B%5Ctheta%7D%28x%29%29%29

利用梯度下降法求最优解,学习速率

equation?tex=%5Calpha+ :

equation?tex=%5Ctheta+%3D+%5Ctheta+-+%5Calpha+%5Cfrac%7B%5Cpartial%7BJ%28%5Ctheta%29%7D%7D%7B%5Cpartial%7B%5Ctheta%7D%7D

具体求法本文不介绍,只给出算法的思想。

为了避免过拟合问题,则在原来的损失函数增加正则项,然后利用梯度下降法求最优解,这里也不展开。

logistic模型与感知机模型的比较

logistic模型与感知机模型的相同点

由上面的分析可知,假设类条件概率分布的协方差相同,则logistic模型的决策边界函数是随x线性变化的直线,因此,感知机模型与logistic模型的分类策略一样,即决策边界函数是一样的。如下图:

感知机模型:当点落在直线上方,y>0,则分类结果为C1;反之为C2。

logistic模型:当点落在上方,y>0,则后验概率P(C1|X)>0.5,分类结果为C1;反之为C2。

考虑到对输入变量x进行非线性变换

equation?tex=%5Ctheta%28x%29 ,感知机和logistic模型的分类策略仍一样,决策边界函数相同,如下图:

感知机模型:当点落在圆外,y>0,则分类结果为C1;反之为C2。

logistic模型:当点落在圆外,y>0,则后验概率P(C1|X)>0.5,分类结果为C1;反之为C2。

logistic模型与感知机模型的异同点

(1) logistic回归模型限制值的范围在0~1,感知机模型对值范围没有限制,因此logistic模型相比感知机模型,对异常点有更强的鲁棒性。如下图,当有异常数据时,logistic模型要好于感知机模型。

(2) 感知机模型用误分类点到超平面的距离衡量损失函数,而logistic模型则从概率角度去衡量损失函数。

总结

logistic回归的含义是后验概率分布,用概率的角度去设计似然函数,logistic模型相比于感知机模型对异常数据具有更好的鲁棒性。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Li_阴宅/article/detail/989268
推荐阅读
相关标签
  

闽ICP备14008679号