赞
踩
George Box said: “All models are wrong, some are useful”
作为 GLM 的基础,本节 review 经典的 Linear Regression,并阐述一些基础 term。
我们线性回归的基本如下述公式,本质上是想通过观察
这是我们的预测目标,也称 response variable。这里有一个容易混淆的点,实际上
这是我们的特征,可以包含很多维度,一个特征也称为一个 predictor。
线性模型的假设非常简单,即
深入来看,各个维度特征(predictor)
线性模型有着非常强的局限,即 response variable
所以这时我们使用 Generalized Linear Model 来克服这俩个问题。
一句话定义 GLM 即(from wiki):
In statistics, the generalized linear model (GLM) is a flexible generalization of ordinary linear regression that allows for response variables that have error distribution models other than a normal distribution.
详细来说,我们可以把 GLM 分解为 Random Component、System Component 和 Link Function 三个部分。
An exponential family model for the response
这里是指 response variable 必须服从某一 exponential family distribution 指数族分布,即
例如 linear regression 服从 Gaussian 高斯分布,logistic regression 服从 Bernoulli 伯努利分布。指数族还有很多分布如 多项分布、拉普拉斯分布、泊松分布等等。
另外,这也可以被称为 Error Structure : error distribution model for the response。对于 Gaussian 的 residual 残差
linear predictor
广义线性模型 GLM 本质上还是线性模型,我们推广的只是 response variable
注意,GLM 的一个较强的假设是
A link function connects the mean of the response to the linear predictor
通过上述的 Random Component 和 Systematic Component,我们已经把
link function 建立了response variable 分布均值(实际就是我们的预测目标) 和 linear predictor 的关系(准确来说,这只在
最后要强调的是,link function 的反函数
这里再次强调了他们 linear predictor 的部分是一致的;不过对 response variable 服从分布的假设不一致。Gaussian 的 response function 是
额外强调一个点,无论是 LM 还是 GLM,我们对不同数据
GLM 中我们最常用到的是 Logistic Regression;即假设
所以 log-odds 在 scale 上和 linear predictor 匹配。对于 Logistic Regression,我们通过 link function logit 建立了与简单线性模型的关联。link function 就是把任意 exponential family distribution 的均值
此函数是 Bernoulli 在 GLM 的 response function,即 link function 的反函数。(强调反函数的时候可以使用
此函数在神经网络中也有用作 activate function 来引入非线性(当然现在更常用 rectified linear unit, RELU),其拥有一些特点:
这里展开证明一下求导简单,即
另外,这里先证明一个有趣的特性
logistic/sigmoid 函数还有一些其他的解释,例如生态学模型。
本节详细完成 logistic regression 剩下部分的阐述。假设我们观察到了数据集
其中
这里专门强调一下,有一些论文里面会使用其他形式的等价的 negative binomial log-likelihood:
首先,把原 loss 展开
loss 的 gradient 当然也是完全等价的,这里简单展开部分结果:
这里补充一下 exponential family 的定义,并且给出 Bernoulli 以及 Categorical 对应的 link function 和 response function。
The exponential family of distribution over
常见的 exponential family 有 Bernoulli Distribution, Binomial Poisson Distribution, Negative Binomial Distribution, Categorical Distribution, Multinomial Distribution, Beta Distribution, Dirichlet Distribution, Laplace Distribution, Gamma Distribution, Normal Distribution 等等,所以说 GLM 极大地拓展了 LM 的使用范围。
伯努利分布 的 分布律(相对于 continuous variable 的 概率密度函数) 如下:
作为 Bernoulli 的推广,Categorical 的 link function 和 response function 与前者非常相似。其 response function 是 softmax,所以 logistic/sigmoid 和 softmax 也是一个推广关系。
这里注意一点,Categorical Distribution 即是单次的 Multiple Distribution,后者更常见。(而 Bernoulli Distribution 是单次的 Binomial Distribution)
以下介绍推导过程,分类分布的 分布律,以及 exponential family 形式如下:
所以 natural parameter 正是:
下面推导其 inverse function 即 GLM 使用的 response function,这个过程比 logistic 要复杂很多。首先等价变换 link function:
俩个式子结合则有:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。