当前位置:   article > 正文

ML模型1:线性回归

ml模型


回归在数学上来说是给定一个点集,就能够用一条曲线去拟合之。如果这个曲线是一条直线(超平面),那就被称为线性回归。若不是一条直线则称为非线性回归,常见有多项式回归、逻辑回归等。

线性模型优劣:
优点:结果易于理解,计算上不复杂;
缺点:对非线性的数据拟合不好

1. 线性模型表示

一般线性模型表示:
y ^ = θ 0 + θ 1 x 1 + θ 2 x 2 + ⋯ + θ n x n \hat{y} = \theta_0 + \theta_1x_1 + \theta_2x_2 + \cdots + \theta_nx_n y^=θ0+θ1x1+θ2x2++θnxn
其中 x 1 , x 2 x_1,x_2 x1,x2 等表示不同的特征,
θ 1 , θ 1 \theta_1,\theta_1 θ1,θ1 等表示特征权重

向量形式写成:
y ^ = h θ ( x ) = θ T x \hat{y} = h_\theta(x) = \theta^Tx y^=hθ(x)=θTx

2. 最小二乘法

线性模型用一个直线(平面)拟合数据点,找出一个最好的直线(平面)即要求每个真实点距离平面的距离最近。即使得残差平方和(Residual Sum of Squares, RSS)最小:

R S S ( X , h θ ) = ∑ i = 1 m ( θ T x ( i ) − y ( i ) ) 2 RSS(X, h_\theta) = \sum_{i=1}^m{(\theta^Tx^{(i)}-y^{(i)})^2} RSS(X,hθ)=i=1m(θTx(i)y(i))2

另一种情况下,为消除样本量的差异,也会用最小化均方误差(MSE)拟合(Q1.为什么使用均方误差):
M S E ( X , h θ ) = 1 m ∑ i = 1 m ( θ T x ( i ) − y ( i ) ) 2 MSE(X, h_\theta) = \frac{1}{m}\sum_{i=1}^m{(\theta^Tx^{(i)}-y^{(i)})^2} MSE(X,hθ)=m1i=1m(θTx(i)y(i)<

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号