最小二乘法(基础原理+简单推导+python模拟)_最小二乘误差计算 python

作者：小丑西瓜9 | 2024-03-21 07:58:14

踩

最小二乘误差计算 python

最小二乘法通过最小化误差（真实 $y_i$ 与拟合函数生成的 $\hat{y_i}$ 的差）的平方和从而寻找拟合数据最佳的函数。

对于数据 ${(x_1,y_1), (x_2,y_2),...,(x_i,y_i)}(i=1,2,3,..,m)$ ，拟合出函数 $h (x)$ 。一般来讲 $h (x)$ 为n次多项式， $h(x) = w_0+w_1x+w_2x^2+...w_nx^n$ ，其中 $w_0,w_1,...,w_n)$ 是函数的参数。

最小二乘法的目的是找到一组 $w_0,w_1,...,w_n)$ ，使得 $\sum_{i=1}^{n}(h(x_i)-y_i)^2$ 最小。–> $min\sum_{i=1}^{n}(h(x_i)-y_i)^2$

想要求的一组 $w_0,w_1,...,w_n)$ 使得误差 $\sum_{i=1}^{n}(h(x_i)-y_i)^2$ 最小，及求误差函数的极小值点（偏导数为0的点）。

举个例子：
$f(x;w)=w_0+w_1x \\ Loss(y, f(x;w)) = (y-f(x;w))^2 \\ 这里的平方是为了方便求导运算。 \\ J_n(w)=\sum_{i=1}^{n}(y_i-w_0-w_1x_i)^2/2 \\ 为了求极值，则对w_0,w_1分别求偏导。 \\$

{\begin{cases} \frac{\partial}{\partial w_{0}} J_{n} (w) = - \sum_{i = 1}^{n} (y_{i} - w_{0} - w_{1} x_{i}) = 0 \\ \frac{\partial}{\partial w_{1}} J_{n} (w) = - \sum_{i = 1}^{n} (y_{i} - w_{0} - w_{1} x_{i}) x_{i} = 0 \end{cases}

$\begin{cases} \frac{\partial}{\partial w_0}J_n(w)=-\sum_{i=1}^{n}(y_i-w_0-w_1x_i)=0 \\ \frac{\partial}{\partial w_1}J_n(w)=-\sum_{i=1}^{n}(y_i-w_0-w_1x_i)x_i=0 \end{cases}$ \\

{\frac{\partial}{\partial w _{0}} J_{n} (w) = - \sum_{i = 1}^{n} (y_{i} - w_{0} - w_{1} x_{i}) = 0 \frac{\partial}{\partial w _{1}} J_{n} (w) = - \sum_{i = 1}^{n} (y_{i} - w_{0} - w_{1} x_{i}) x_{i} = 0

{\begin{cases} w_{0} (\sum_{i = 1}^{n} 1) + w_{1} (\sum_{i = 1}^{n} x_{i}) = \sum_{i = 1}^{n} y_{i} \\ w_{0} (\sum_{i = 1}^{n} x_{i}) + w_{1} (\sum_{i = 1}^{n} x_{i}^{2}) = \sum_{i = 1}^{n} y_{i} x_{i} \end{cases}

\begin{matrix} \sum_{i = 1}^{n} 1 & \sum_{i = 1}^{n} x_{i} \\ \sum_{i = 1}^{n} x_{i} & \sum_{i = 1}^{n} x_{i}^{2} \end{matrix}

$要求w，及求\phi \cdot \hat{w}=b中的\hat{w}。 \\\hat{w}=\phi^{-1} \cdot b$
矩阵形式：
$J=\frac{1}{2}||Y-Xw||^2= \frac{1}{2} \left| \left| \left[$

\begin{matrix} y_{1} \\ y_{2} \\ . . . \\ y_{n} \end{matrix}

$\begin{matrix} y_1\\ y_2\\ ...\\ y_n \end{matrix}$ \right] - \left[

\begin{matrix} 1 & x_{1} \\ 2 & x_{2} \\ . . . \\ 3 & x_{3} \end{matrix}

$\begin{matrix} 1&x_1\\ 2&x_2\\ ...\\ 3&x_3 \end{matrix}$ \right] \cdot \left[

\begin{matrix} w_{0} \\ w_{1} \end{matrix}

$\begin{matrix} w_0\\ w_1\\ \end{matrix}$ \right] \right|\right|^2 \\ \\

J = \frac{1}{2} ∣∣ Y - Xw ∣ ∣^{2} = \frac{1}{2} ∣ ∣ ∣ ∣ ⎣ ⎡ y_{1} y_{2} ... y_{n} ⎦ ⎤ - ⎣ ⎡ 12 ... 3 x_{1} x_{2} x_{3} ⎦ ⎤ \cdot [w_{0} w_{1}] ∣ ∣ ∣ ∣^{2}

\begin{aligned} | | Y - X w | |^{2} & = (Y - X w)^{T} (Y - X w) \\ = Y^{T} Y - x^{T} X^{T} Y - Y^{T} X w + w^{T} X^{T} X w \\ = Y^{T} Y - 2 w^{T} X^{T} Y + w^{T} X^{T} X w \end{aligned}

\\ \frac{\partial J}{\partial w}=-X^TY+X^TXw=0 \\

w=(X^TX)^{-1}X^TY

python实现最小二乘法

import numpy as np
import scipy as sp
from scipy.optimize import leastsq
import matplotlib.pyplot as plt
%matplotlib inline

# 创建目标函数
def func(x):
    return np.sin(2*np.pi*x)

# 预设一个用于拟合的多项式
def fit_func(p, x):
    f = np.poly1d(p)
    return f(x)

# 定义误差
def error(p, x, y):
    err = fit_func(p, x) - y
    return err

# 十个点
x = np.linspace(0, 1, 10)
x_points = np.linspace(0, 1, 1000)
# 加上正态分布噪音的目标函数的值
y_ = func(x)
y = [np.random.normal(0, 0.1) + y1 for y1 in y_]


def fitting(M=0):
    """
    M    为 多项式的次数
    """
    # 随机初始化多项式参数
    p_init = np.random.rand(M + 1)
    # 最小二乘法
    p_lsq = leastsq(error, p_init, args=(x, y))
    print('Fitting Parameters:', p_lsq[0])

    # 可视化
    plt.plot(x_points, func(x_points), label='real')
    plt.plot(x_points, fit_func(p_lsq[0], x_points), label='fitted curve')
    plt.plot(x, y, 'bo', label='noise')
    plt.legend()
    return p_lsq

# M=3
p_lsq_3 = fitting(M=3)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47

在这里插入图片描述
详细代码文件：python代码文件。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小丑西瓜9/article/detail/279568

最小二乘法(基础原理+简单推导+python模拟)_最小二乘 误差计算 python

python实现最小二乘法

最小二乘法(基础原理+简单推导+python模拟)_最小二乘误差计算 python