赞
踩
首先特别感谢《Linear Regression for Face Recognition》的作者Imran Naseem,Roberto Togneri对该paper的写著,这里写了一些个人理解的心得,如有不足之处,望海涵,可以私信我,加以更正。
主要内容:用线性回归的方法去人脸识别。LRC算法用最近邻子空间分类法进行分类,解决障碍物问题,提出了一个Modular LRC方法,介绍Distance-based Evidence Fusion(DEF)算法。主要就是解决围巾遮挡问题。
introduction:
高维特征映射到低维特征,主要目的就是找到一个基础的函数去变换,有区分的表示人脸。一般的方法:PCA、LDA、ICA等都是分两类:重构和区分。事实上,特征空间的选择不那么重要,重要的是特征空间的维数和分类器的设计。
定义人脸识别为一个线性回归问题,最小二乘估计参数向量。决策规则:最精确的留下。分类器:Nearest Subspace (NS)方法。下采样,训练得到一个字典矩阵,ill-conditioned problem用稀疏的L1范数最小化去解决。Locally Linear Regression(LLR)解决pose问题,nonfrontal face 和frontal counterpart。线性回归能去预测nonfrontal 相对应的虚拟出来的frontal patch。用小波分解和discriminant analysis(判别式分析) 去设计一个复杂的特征提取。discriminant features 用于develop 特征平面(Nearest Feature Plane分类器)和特征空间(nearest Feature Space分类器)。LRC用下采样图像联合线性回归分类去实现先前的结果。用Modular LRC去解决遮挡问题。DEF算法做最终决策,决定哪部分是好的。
2 LINEAR REGRESSION FOR FACE RECOGNITON
LRC算法:
训练图片N个,a*b这么大,之后下采样为c*d,变成列向量q(矩阵的拉直),归一化处理这些向量,Xi是这q维向量的堆积。一个训练样本下采样拉直是X的一个列。Xi可称为第i类的regressor or predictor,z是无标签的特侧图像,给z分类,y是归一化、灰度处理后的向量,如果y是第i类,则能用Xi线性表示。
LRC的modular方法(分块):
用分块表示法能高效解决识别中的遮挡问题,在modular approach中,我们用连续像素的近邻特性把人脸分为一些子图像。最后决断依赖于所有这些子图像决断信息的融合。投票的缺点是:把噪声和干净的图像同等对待(我觉得应该分开,有用的子图像可以整点权重啥的)。没有障碍分布的先验使得处理这个问题很复杂。本文的做法:用distance classification 去develop a fairly simple ,是一个高效的fusion strategy,遮挡的不那么重要了,提高了分类的精确性。被遮挡的图像分为M块,每一块为vn,n=1,,,M,从第i类中训练图像,下采样、变换为向量,之后同LRC。多了一个决策过程。每一个小块,从第n类里面选个误差最小的,再从这所有块中,选出一个最小的,作为最终决策。
3、 EXPERIMENTAL RESULTS
用5个标准数据库来说明这个算法的高效性。这些数据库混合了一个姿势、光照、障碍、姿态变化等。这个方法对一些姿势变化和连续遮挡能有较好的性能,但是,不意味着对光照和姿势的变化就鲁棒。
3.1AT&T Database
简单介绍:包括40个人,一个人十张图片;混合脸部姿态:笑或者不笑、睁眼睛或者闭眼睛、戴眼镜或者不戴眼镜,同样可以容忍脸部最大20°的偏转。
EP1:前五个作为训练样本、后五个作为测试样本;
EP2:leave one out
下采样一样,都是50D的特征空间,(其实LRC并不是效果那么好,里面明显有比它效果好的,,,,这岂不是不鞥显示LRC的优势,不具有说服力。)
3.2 Georgia Tech (GT) Database
简单介绍:包括50个人,一个人15张图片;可以有pose expression 、clutterd background、illumination的变化。下采样为15*15到225D的特征空间中,八张用来训练,剩下的用来测试(probes),所有实验都在原图上进行,不经过任何处理(cropping、normalization)结果:这次较好,还是没有ERE_S好。
3.3 FERET Database
EP1:简介:最大的公开的数据库,我们选了一个子数据库,包括128个人,每个人至少4个图片。LRC方法用每个人的gallery image去构建一个线性子空间,不需要其他的face space的拓展,但是,LRC要求有多样的gallery image 去构建一个可信的线性子空间。用单人的单个gallery image 不是线性回归的本质,它只是一个简单的regressor或者predictor,导致错误的最小二乘计算。
这次实验,用42D的特征空间,一个图片用来实验,三个图片用来训练,两张是正脸的,很少其他的变化,后两张变化比较多,LRC能很好的处理在pose变化时候面部表情的变化。
EP2:找400个随机选的人。
3.4 Extended Yale B Database
简介:由38个人的2414个图片,光照不同,这个数据库分为五个子数据库,1、每人7个图片,共266张,正常光照条件,用来做gallery,其他的用来做测试(validation);2/3、一个人12张,光照从 slight—moderate变化;4、一个人14张,5、一个人19张,4和5都有severe light variations。
所有图像下采样为20*20,LRC对moderate light variation效果最好100%识别,但对2和3效果不太好(说明对光变化敏感,不具有鲁棒性),对一般性光照变化表现的性能还是可以的,不能够忍受severe luminance alterations。
3.5 AR Database
简介:包含4000多个彩色图片,126个人,70男,56女,不是理想的场景,混合多变的面部表情,光照变化,遮挡(眼睛和围脖)。两个挑战:人脸表情变化和连续的遮挡。
gesture variation
脑袋方向的变化是一个极大的挑战,一些人脸识别和方向正则化算法(这是什么?调整一下脑袋的方向?使其与正常的人的方向一致?之后便于识别?)用在这些面部特征上(眼睛 鼻子 嘴巴)。但是不好用(因为有的眼睛闭着甚至都不能识别),这里,对于每一个给定的人脸识别算法,有两个可能的方法去评估真是的鲁棒性: by implementing an automatic face localization and normalization module before the actual face recognition module or
2) by evaluating the algorithm using the original frame of the face image rather than a manually localized and aligned face. 1、在当前的人脸识别块之前,用一个自动人脸区域,标准化;2、用原始的人脸图像框架去评估算法,而不是用局部的、均衡的人脸。
用AR数据库中125个人,选出100个个体一半男的一般女的,下采样到10*10,用三个不同表情的去训练,一个留作测试,识别的还可以。
contiguous occlusion
连续遮挡是人脸识别的大问题,在遮挡的现状来看,automatic face localization and 弄normalization问题得到了放大(magnified)。在一些裁剪不正的、均衡的图片上实验experiments on manually cropped and aligned databases make an implicit assumption of an evenly cropped and nicely aligned face, which is not available in practice。
LRC对戴眼镜的识别效果很好,SRC都不行,但是围脖,LRC不行,SRC很好。开始讲述modular LRC的高效性。从数据库里面在尺度和方向上有变化的,产生一些裁剪不正和均衡的一些列图片构成100个人,先用眼睛和嘴巴的位置对图像均衡化(aligned),每个图像裁剪为292*240。
所有图像分成四块,标号,LRC方法测试产生较大误差,modular LRC中,有围脖的直接被拒绝,不参与性能评估,不参与最终决策,这个算法的两个优点:一自动忽略没脸的部分;二、有效的、动态的融合利用了充足的脸部子图像的信息去产生一个全局的识别。
4、conclusion
主要讲一个新的分类算法,把人脸识别当做一个线性回归问题。LRC算法处理了面部表情变化和连续遮挡的问题,通过大量实验说明这个事,LRC对没有处理的人脸有较精确的识别能力,在不理想的情况下(有遮挡、光照或者gestures,一些cropped and aligned脸)不可用(对我们的算法影响大不大)。所以,LRC算法对真实的场景,识别性能能得到认可,对有遮挡的人脸识别问题,modular LRC算法用一个高效的有理有据的熔断策略产生了较好的效果。
在人脸识别的例子中,特征选择是一个有争议的话题,类似于下采样或者random projections的非正统特征选择,在传统的意识形态里有分歧,LRC事实上证实了这一新兴的belief,它对分类器选择的挺合适,下采样比传统的方法还产生较好的效果。这回提出的算法的简单框架,在计算上是高效的,因而对人脸识别来说,这是一个不错的候选,其他特征方向包括对光照、随机像素遮挡、姿势变化相关的鲁棒问题。
转载请声明出处,谢谢。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。