赞
踩
R-FCN发明比YOLOv1、SSD晚,但创新度上可能不够,只能算是对Faster R-CNN的改进。R-CNN网络证明了CNN提取特征的有效性,SPP解决了如何应对不同尺度特征图的问题,Fast R-CNN通过RoI pooling实现RoI特征图块卷积运算的共享,加快了速度并提升了准确度,而Faster R-CNN进一步加大卷积神经网络的共享,即将产生候选框的过程合并到CNN中,以RPN子网络的形式实现CNN共享。
R-FCN第一版论文提交于2016年5月左右,此时已经有GoogLeNet、ResNet等经典卷积神经网络了,并且这些网络证明了不使用全连接也能获得很好的效果,而且更重要的是可以应对不同尺度的图像。
当目标检测网络架构中将分类网络与检测网络进行卷积共享时,分类任务需要特征具有平移不变性,而检测任务要求对目标的平移做出准确响应,因此R-FCN网络主要解决了“图像分类网络的位置不敏感性”和“目标检测网络的位置敏感性”之间的矛盾。
RoI之前的层是共享卷积运算的,RoI之后一个卷积网络对RoI进行卷积并完成region的提取,另一个网络根据RoI结果进行最终目标的分类和回归任务。因此,为了最大化卷积的共享,作者把所有的卷积都放在了RoI之前。如下表所示:
R-FCN整体架构如下图所示:
如上图所示,一个典型的R-FCN网络由backbone网络(如ResNet101)、一个RPN网络(Faster R-CNN中的RPN层)和一个位置敏感的预测层,以及最后是RoI pooling+投票的决策层组成。对于上图,乍一看与Faster R-CNN网络的结构非常类似,主要区别就在于pooling的地方。
R-FCN网络提出了位置敏感的得分图(position sensitive score map)概念,将目标的位置信息融合到RoI pooing中。
R-FCN在Faster R-CNN网络的基础上进行了一些改进。第一,将baseline从VGG16改成了ResNet101。第二,将所有卷积网络层移到RoI pooling的前面,实现卷积共享最大化。第三,由于RoI pooling后会丢失位置信息,因此在pooling之前保留了位置信息,即指定不同score map负责目标的不同位置,pooling后利用保留的score map组合获得位置信息。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。