赞
踩
逻辑斯蒂分布假设X是连续随机变量,且分布函数、密度函数如下:
F ( x ) = P ( X ⩽ x ) = 1 1 + exp ( − ( x − μ ) / γ ) f ( x ) = F ′ ( x ) = e − ( x − μ ) / γ γ ( 1 + e − ( x − μ ) / γ ) 2 F(x)=P(X\leqslant x)=\frac{1}{1+\exp(-(x-\mu)/\gamma)} \\ f(x) = F'(x) = \frac{e^{-(x-\mu)/\gamma}}{\gamma(1+e^{-(x-\mu)/\gamma})^2} F(x)=P(X⩽x)=1+exp(−(x−μ)/γ)1f(x)=F′(x)=γ(1+e−(x−μ)/γ)2e−(x−μ)/γ
式子中 μ \mu μ为位置参数, γ > 0 \gamma>0 γ>0为形状参数。图像如下图所示:
上图的右边是分布函数 F ( x ) F(x) F(x),可以看到是S形的曲线,以点 ( μ , 1 2 ) (\mu , \frac{1}{2}) (μ,21)为对称中心,当形状参数 γ \gamma γ的值越小,曲线在对称点附近增长越快。
二项逻辑回归模型是二分类模型,由条件概率P(Y|X)表示,条件概率分布如下:
P ( Y = 1 ∣ x ) = exp ( w ⋅ x + b ) 1 + exp ( w ⋅ x + b ) P ( Y = 0 ∣ x ) = 1 1 + exp ( w ⋅ x + b ) P(Y=1|x)=\frac{\exp(w\cdot x+b)}{1+\exp(w\cdot x+b)} \\ P(Y=0|x)=\frac{1}{1+\exp(w\cdot x+b)} P(Y=1∣x)=1+exp(w⋅x+b)exp(w⋅x+b)P(Y=0∣x)=1+exp(w⋅x+b)1
对于给定的x,可以求得 P ( Y = 1 ∣ x ) P(Y=1|x) P(Y=1∣x)和 P ( Y = 0 ∣ x ) P(Y=0|x) P(Y=0∣x)的概率,哪个概率大,就是哪个类别。为了方便,将全职向量和输入向量扩充,即 w = ( w ( 1 ) , w ( 2 ) , . . . , w ( n ) , b ) , x = ( x ( 1 ) , x ( 2 ) , . . . , x ( n ) , 1 ) w=(w^{(1)}, w^{(2)}, ...,w^{(n)},b), \; x=(x^{(1)}, x^{(2)}, ...,x^{(n)},1) w=(w(1),w(2),...,w(n),b),x=(x(1),x(2),...,x(n),1)。此时逻辑回归模型如下:
P ( Y = 1 ∣ x ) = exp ( w ⋅ x ) 1 + exp ( w ⋅ x ) (1) P(Y=1|x)=\frac{\exp(w\cdot x)}{1+\exp(w\cdot x)} \tag 1 P(Y=1∣x)=1+exp(w⋅x)exp(w⋅x)(1)
P ( Y = 0 ∣ x ) = 1 1 + exp ( w ⋅ x ) (2) P(Y=0|x)=\frac{1}{1+\exp(w\cdot x)} \tag 2 P(Y=0∣x)=1+exp(w⋅x)1(2)
一个事件的几率是该事件发生与不发生的概率比值。即如果发生概率是p,那么该事件的几率为: p 1 − p \frac{p}{1-p} 1−pp,该事件的对数几率或logit函数是:
l o g i t ( p ) = l o g p 1 − p (3) logit(p) = log \frac{p}{1-p} \tag 3 logit(p)=log1−pp(3)
对逻辑斯蒂回归而言,将式子(1)(2)代入(3)得:
l o g P ( Y = 1 ∣ x ) 1 − P ( Y = 1 ∣ x ) = w ⋅ x (4) log \frac{P(Y=1|x)}{1-P(Y=1|x)} = w \cdot x \tag 4 log1−P(Y=1∣x)P(Y=1∣x)=w⋅x(4)
上面的式子表明输出Y=1的对数几率是输入x的线性函数。
由式子(1)知可以将线性函数 w ⋅ x w\cdot x w⋅x转换为概率:
P ( Y = 1 ∣ x ) = e x p ( w ⋅ x ) 1 + e x p ( w ⋅ x ) (5) P(Y=1|x) = \frac{exp(w\cdot x)}{1+exp(w\cdot x)} \tag 5 P(Y=1∣x)=
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。