赞
踩
目录
(二)RPN网络(Region Proposal Networks)
RCNN、FastRCNN、FasterRCNN比较:
Faster R-CNN可以简单地看做“区域生成网络RPNs + Fast R-CNN”的系统,用区域生成网络RPN代替FastR-CNN中的Selective Search方法。
Faster R-CNN这篇论文着重解决了这个系统中的三个问题:
在FastRCNN的基础上,引入了RPN网络,在feature map上的每个特征点预测多个候选框。
如下图:
模块1:对图像进行卷积特征提取,产生共享卷积feature maps。
模块2:
经典的检测方法生成检测框都非常耗时,如OpenCV adaboost使用滑动窗口+图像金字塔生成检测框;或如R-CNN使用SS(Selective Search)方法生成检测框。
而Faster RCNN则抛弃了传统的滑动窗口和SS方法,直接使用RPN生成检测框,这也是Faster R-CNN的巨大优势,能极大提升检测框的生成速度。
RPN目的:筛选候选框,最后一个目标仅保留最优的候选框。
RPN网络结构:
RPN的全流程:
细节理解:
选取这个小框的中心点为基准,基于这个点想象出K个大小不同的框,这些框就叫做Anchors,利用这些框去寻找这个特征点附近的物体。
所谓的anchor其实就是人为设定的一些大小不同bounding box,也就是这些bounding box有可能和我们要检测的各种目标的大小比较接近。
在文章中作者设置了9种不同的anchor,其长宽比为[1:1, 1:2, 2:1]。
anchor的表示[x1,y1,x2,y2],分别是anchor的左上角坐标[x1,y1],右下角坐标[x2,y2]。
例如:
生成详细代码地址:
https://github.com/rbgirshick/py-faster-rcnn/blob/master/lib/rpn/generate_anchors.py;
论文中特征图尺寸H×W: 16×16;锚点框k=9;
后续处理:
ROI是在FastRCNN中新引入的方法;
每个目标的大小不同,因此映射在feature Map的形状也不同;Faster Rcnn为了使得后续的全连接层能够处理大小不同的特征,就把大小不同的特征统一按长宽方向切成相同个小区域,每个区域中包含若干个像素,每区域进行pooling,最后统一得到7*7的feature map,便于后续处理。
如下:
1、还是无法达到实时检测目标;
2、获取region proposal,再对每个proposal分类计算量还是比较大。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。