当前位置:   article > 正文

支持向量机 算法_支持向量机算法

支持向量机算法

支持向量机 算法

image-20220718154322205

支持向量机概述

  • 在机器学习领域,SVM是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析

  • 全名:Support Vector Machine(支持向量机),支持向量是指和超平面相平行的支持平面相切的向量点,机是指算法

  • SVM就是基于统计学习理论的一种机器学习方法,简单来说就是将数据单元表示在多维空间中,然后对这个空间做划分的算法

  • 支持向量机(Support Vector Machine, SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。

  • SVM使用铰链损失函数计算经验风险并在求解系统中加入了正则化项以优化结构风险,是一个具有稀疏性和稳健性的分类器。

  • SVM可以通过核方法进行非线性分类,是常见的核学习方法之一。


支持向量机应用场景
  • SVM在⼿写识别数字和⼈脸识别中应⽤⼴泛, 在⽂本和超⽂本的分类中举⾜轻重,因为SVM可以⼤量减少标准归纳和转换设 置中对标记训练实例的需求。
  • 同时,SVM也被⽤来执⾏图像的分类,并⽤于 图像分割系统。实验结果表明,在仅仅三到四轮相关反馈之后,SVM就能实现⽐传统的查询细化⽅案⾼出⼀⼤截的搜索精度。
  • 除此之外,⽣物学和许多其他科学都是SVM 的⻘睐者,SVM现在已经⼴泛被⽤于蛋⽩质分类,现在化合物分类的业界平均⽔平可以达到90%以上的 准确率。

支持向量机的作用

SVM用于分类,要求,在数据量增加之后,仍然适用(一般用于二分类)



支持向量机算法原理

分割超平面
  • 设C和D为两个不想交的凸集,则存在超平面P,P可以将C和D分离
image-20220718154745698

任意一个属于C中的数,都很高小于等于b,任意一个属于D中的数,都能大于等于b

  • 两个集合的距离,定义为两个集合间元素的最短距离

  • 做集合C和集合D最短线段的垂直平分线,中间的垂直线就是分类器<

    image-20220718154813881
分割超平面的思考
  • 如何定义两个集合的“最优”分割超平面?

    • 找到集合“边界”上的若干点,以这些点为“基础”计算超平面的方向;以两个集合边界上的这些点的平均作为超平面的“截距”。
    • 支持向量:support vector
  • 若两个集合有部分相交,如何定义超平面,使得两个集合“尽量”分开?

    image-20220718155029560
输入数据
  • 假设给定一个特征空间上的训练数据集
image-20220718155056278
  • Xi为第i个实例(若n>1,Xi为向量 )

  • Yi为Xi的类标记

    • 当Yi=+1时,称Xi为正例
    • 当Yi=-1时,称Xi为负例;
  • (Xi, Yi)称为样本点

  • 给定线性可分训练数据集,通过间隔最大化得到的分离超平面为:

    image-20220718155215169 image-20220718155230610

    如果y(x)算出来是大于0的,就把它当作y=+1类,如果y(x)算出来小于0,就把它当作y=-1类

  • image-20220718155243813是某个确定的特征空间转换函数,它的作用是将X映射到(更高的)维度

​ 最简单直接的:image-20220718155340796

image-20220718155524564
整理的符号(了解)
  • 分割平面
image-20220718155549611
  • 训练集
image-20220718155620478
  • 目标值:
image-20220718155636996
  • 新数据的分类:sign函数是指示函数【当wx+b > 0,f(x) = +1;当wx+b < 0,f(x) =-1】
image-20220718155655751
支持向量机-线性可分(知道)
  • 最优超平面可以定义为:

    声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/喵喵爱编程/article/detail/740657
推荐阅读