赞
踩
在深度学习的唇语识别中,对视频帧图像的CNN空间特征提取和基于RNN的序列特征提取后可以得到视频特征,这些特征为高度抽象的特征序列向量。然后,根据视频特征的差异性与相似性需要进行分类完成唇语识别任务。一般特征分类算法常采用的有:支持向量机算法、K近邻算法SoftmaxOFTMAX等。
SVM模型是通过有监督的方式进行分类与回归,通过学习高维特征而生成空间上分开正负数据样本的超平面。换句话说,SVM算法的本质是求凸二次规划最优解,由SVM完成学习后的超平面可以将正负样本线性分类,平面分割线形式如,它使样本距离平面边界尽可能远,从而提高泛化能力。一般的SVM适用于二元分类,而针对多分类问题可以多次使用SVM进行分类即可,如图所示为SVM的空间超平面图。
在上图中,样本中红色的点表示定义为支持向量机,即满足的样本数据点。针对线性不可分样本集合SVM引入核函数作用于映射样本空间使样本转换为线性可分。核函数的目的是对现有的原始数据进行升维,在更高的维度空间中呈线性可分状态,即存在一个空间超平面使数据样本可以按照正确的类别分割开。与传统的提高维度不同的是,SVM并不会因此而增加模型复杂度,公式表示为:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。