二元逻辑回归 · 数学推导过程及代码实现完全解析_二元逻辑回归数学推导

作者：weixin_40725706 | 2024-04-23 20:24:32

踩

二元逻辑回归数学推导

最近修改：2021/6/17

原文《从二元逻辑回归到多元逻辑回归 · 推导过程完全解析》经过多次修改后变得越来越长，因此笔者将其分为两部分：

概述

以下是此篇文章要用的包

# 加载包
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
sns.set_style('darkgrid')
1
2
3
4
5

二元逻辑回归的出发点是sigmoid函数
$\frac{1}{1+e^{-x}}= \frac{e^{x}}{1+e^{x}}$

Sigmoid函数能将实数域的连续数映射到0,1区间，概率的取值范围就在0,1之间，因此可以用来做概率的预测。

以下是Sigmoid函数的代码和图像

x=np.arange(-10,10)
y=1/(1+np.exp(-x))
plt.plot(x,y)
1
2
3

Output:

多元逻辑回归的出发点是softmax函数
$S(x)=\frac{e^{x_i}}{\sum_{j=1}^{k}e^{x_j}}$
Softmax函数也是将实数域的连续数映射到0,1区间，进而可以理解为是概率。

以下是softmax函数的代码和图像

图像的特点：

x=np.arange(0,50)
y=np.exp(x)/np.sum(np.exp(x))
plt.plot(x,y)
print('the sum of y={}'.format(y.sum()))
1
2
3
4

Output:
the sum of y=1.0

我们想处理分类问题，最基本的统计模型便是逻辑回归，之所以使用它，最主要的原因是其输出是在0,1之间。

注意，我们并不是直接输出类别编号，而是一个概率值

然后我们会根据情况的不同来确定一个阈值,通常这个阈值定在0.5。比如，二元模型中(类别0和1)，我的输出是P(Y=1)=0.75(0.75>0.5)，则认为此时Y是属于类别1的。

要解释二元逻辑回归，我们得先来了解下什么是线性模型

首先这个模型建立在两个个假设上

$y$ 和 $X$ 之间的线性关系

$y = X β$

因变量 $y$ 是一个nx1向量

$\left[$

\begin{matrix} y_{1} \\ y_{2} \\ ⋮ \\ y_{n} \end{matrix}

$\begin{matrix} y_1 \\ y_2 \\ \vdots\\ y_n \end{matrix}$ \right]

y = ⎣ ⎢ ⎢ ⎢ ⎡ y_{1} y_{2} ⋮ y_{n} ⎦ ⎥ ⎥ ⎥ ⎤

带截距项的自变量 $X$ 是一个nx(m+1)的矩阵
$\left[$

\begin{matrix} 1 & x_{11} & x_{12} & . . . & x_{1 m} \\ 1 & x_{21} & x_{21} & . . . & x_{2 m} \\ ⋮ & ⋮ & ⋮ \\ 1 & x_{n 1} & x_{n 2} & . . . & x_{n m} \end{matrix}

$\begin{matrix} 1&x_{11}&x_{12}&...&x_{1m}\\ 1&x_{21}&x_{21}&...&x_{2m}\\ \vdots&\vdots&&\vdots\\ 1&x_{n1}&x_{n2}&...&x_{nm} \end{matrix}$ \right]

X = ⎣ ⎢ ⎢ ⎢ ⎡ 11 ⋮ 1 x_{11} x_{21} ⋮ x_{n 1} x_{12} x_{21} x_{n 2} . . . . . . ⋮ . . . x_{1 m} x_{2 m} x_{n m} ⎦ ⎥ ⎥ ⎥ ⎤

带截距项的参数 $β$ 是一个mx1向量
$\left[$

\begin{matrix} β_{0} \\ β_{1} \\ β_{2} \\ ⋮ \\ β_{m} \end{matrix}

$\begin{matrix} β_0 \\ β_1 \\ β_2 \\ \vdots\\ β_m \end{matrix}$ \right]

β = ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎡ β_{0} β_{1} β_{2} ⋮ β_{m} ⎦ ⎥ ⎥ ⎥ ⎥

声明：本文内容由网友自发贡献，转载请注明出处：【wpsshop】