赞
踩
上一次介绍了行人检测的基础算法-滑动窗口方法对象检测之行人检测(1)。这一次来介绍其中检测效果较好的聚合通道特征算法,该算法的优点在于行人检测性能好,同时检测速度极快。
聚合通道特征的表示
有了单一类型的通道特征的检测性能(其中通道特征不限于上述几种,还可以进行更广泛的实验,如测试Gabor滤波特征、SIFT特征等)后,可以对几种特征做组合,得到聚合通道特征,在实验中Dollar发现使用LUV颜色通道+梯度幅值通道+梯度方向通道组合后所形成的特征检测效果非常好,因此也是现在聚合通道特征的标准配置。此时在形成某个窗口的特征描述时,需要将各个通道特征罗列在一起,见图5j。
图5 聚合通道特征描述子示意图
窗口中各个通道特征罗列在一起所形成的特征描述,以后则称为聚合通道特征。利用它作为窗口的特征表示,此时就得到了每个窗口统一维度的特征向量了。
特征图像金字塔
还记得在对象检测之行人检测(1)中讲过,要用不同大小的窗口分别扫描图片。其实还有一种办法,就是窗口大小不变,而改变图片的大小,前一种的思路是缩放窗口,后一种方法的思路是缩放图片,效果都差不多。此时就涉及到图像特征金字塔的生成。见图6
图6 特征图像金字塔
对于每个尺度(既不同大小)上的原始图像(示意箭头上方图像),需要计算它所对应的特征图像(箭头下方图像),所形成的整个特征图像集,就称为特征图像在尺度空间中的特征图像金字塔。这个计算过程很耗时,Dollar在做了相应的探究之后发现,其实并不用再每个尺度都做一遍特征计算,而只需要计算其中的少数几个尺度,例如,每隔8个尺度计算一次,其它尺度上的特征图像则通过相邻尺度上特征图像直接做缩放得到。这样,大大缩减了特征的计算时间,同时检测效果还不差。相比起特征计算而言,图像缩放的计算量可以忽略不计,因此加速想过相当明显。
此时,整个检测的过程变成了这样,对于一张输入的图片,先构建该图像的特征图像金字塔(尺度空间的大小依据输入图片大小计算得到,特征则包含LUV颜色通道、梯度幅值通道和梯度方向通道),之后,对于金子塔中的每一层,用一个固定尺寸的窗口对该层做扫描,窗口每过一处,就得到该处如图5所示的聚合通道特征描述子。将该描述子丢到分类器中,判别出当前窗口是否是行人。而分类器则采取级联的形式,加快计算的过程。等到计算完了所用尺度中的所有窗口,则图片中的所有行人就都被标注出来了。
好了,到此就讲完了聚合通道特征相关的东东,下一次我们再来说说检测性能很牛叉的Fast-RCNN是怎么做检测的吧。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。