盐析白兔

这个屌丝很懒，什么也没留下！

热门标签

热门文章

当前位置: article > 正文

支持向量回归（SVR）的详细介绍以及推导算法

作者：盐析白兔 | 2024-03-26 05:09:25

赞

踩

svr

1 SVR背景

2 SVR原理

3 SVR数学模型

SVR的背景
SVR做为SVM的分支从而被提出，一张图介绍SVR与SVM的关系

这里两虚线之间的几何间隔r= $\frac{d}{||W||}$ ,这里的d就为两虚线之间的函数间隔。
（一图读懂函数间隔与几何间隔）

这里的r就是根据两平行线之间的距离公式求解出来的
SVR的原理

SVR与一般线性回归的区别

SVR	一般线性回归
1.数据在间隔带内则不计算损失，当且仅当f(x)与y之间的差距的绝对值大于 $\epsilon$ 才计算损失	1.只要f(x)与y不相等时，就计算损失
2.通过最大化间隔带的宽度与最小化总损失来优化模型	2.通过梯度下降之后求均值来优化模型

在这里插入图片描述

原理：SVR在线性函数两侧制造了一个“间隔带”，间距为 $\epsilon$ (也叫容忍偏差，是一个由人工设定的经验值)，对所有落入到间隔带内的样本不计算损失，也就是只有支持向量才会对其函数模型产生影响，最后通过最小化总损失和最大化间隔来得出优化后的模型。

注：这里介绍一下支持向量的含义：直观解释，支持向量就是对最终w,b的计算起到作用的样本（a>0）

如下图所示， "管道"内样本对应a=0，为非支持向量；
位于“管壁”上的为边界支持向量，0<a< $\epsilon$
位于"管道"之外的为非边界支持向量，a> $\epsilon$ (异常检测时，常从非边界支持向量中挑选异常点)
在这里插入图片描述

SVR的数学模型

3.1线性硬间隔SVR

在这里插入图片描述

3.2线性软间隔SVR
原因：在现实任务中，往往很难直接确定合适的 $\epsilon$ ，确保大部分数据都能在间隔带内，而SVR希望所有训练数据都在间隔带内，所以加入松弛变量 $\xi$ ，从而使函数的间隔要求变的放松，也就是允许一些样本可以不在间隔带内。
在这里插入图片描述

引入松弛变量后，这个时候，所有的样本数据都满足条件:

在这里插入图片描述

这就是映入松弛变量后的限制条件，所以也叫-------软间隔SVR

注：对于任意样本xi,如果它在隔离带里面或者边缘上， $\xi$ 都为0；在隔离带上方则为 $\xi>0,\xi^*=0$
在隔离带下方则为 $\xi^*>0,\xi=0$

在这里插入图片描述

在这里插入图片描述

参数推导：
拉格朗日乘子法（可将约束条件变成无约束的的等式方程）

设 $u_i\geqslant0,u^*_i\geqslant0,a_i\geqslant0,a^*_i\geqslant0$ 为拉格朗日系数
构建拉格朗日函数：
在这里插入图片描述

3.3非线性（映射，核函数）
在这里插入图片描述
启发：提高维度，低维映射到高维（非线性变线性）

之前的SVR低维数据模型是以内积xi*xj的形式出现:
在这里插入图片描述

现定义一个低维到高维的映射 $\varPhi$ ：来替代以前的内积形式:
在这里插入图片描述

在这里插入图片描述
表示映射到高维特征空间之后的内积

映射到高维的问题:
2维可以映射到5维
但当低维是1000映射到超级高的维度时计算机特征的内积
这个时候从低维到高维运算量会爆炸性增长

由于特征空间维数可能很高，甚至是无穷维，因为直接计算 $\varPhi(x_i)^T\varPhi(x_j)$ 通常是困难的，这里就要设计到核函数

在这里插入图片描述

结果表明：核函数在低维计算的结果与映射到高维之后内积的结果是一样的

主要改变：非线性转化，主要通过改变内积空间替换成另外一个核函数空间而从而转化到另外一个线性空间

在这里插入图片描述

核函数的隆重出场：核函数是对向量内积空间的一个扩展，使得非线性回归的问题，在经过核函数的转换后可以变成一个近似线性回归的问题
在这里插入图片描述

在这里插入图片描述

实战案例

代更。。。。。。。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/盐析白兔/article/detail/314834

推荐阅读

相关标签

Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号