赞
踩
论文:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文作者主页:http://www.rossgirshick.info/
源码:https://github.com/rbgirshick/py-faster-rcnn
参考:https://senitco.github.io/2017/09/02/faster-rcnn/ (推荐看原博客,写的特别好,本篇博客主要用来记录学习,如侵权,请联系我)
翻译:http://noahsnail.com/2018/01/03/2018-01-03-Faster R-CNN论文翻译——中英文对照/
下图为Faster R-CNN测试网络结构(网络模型文件为faster_rcnn_test.pt),可以清楚地看到图像在网络中的前向计算过程。对于一幅任意大小
P
×
Q
P×Q
P×Q的图像,首先缩放至固定大小
M
×
N
M×N
M×N(源码中是要求长边不超过1000,短边不超过600),然后将缩放后的图像输入至采用VGG16模型的Conv Layer中,最后一个feature map为conv5-3,特征数(channels)为512。RPN网络在特征图conv5-3上执行3×3卷积操作,后接一个512维的全连接层,全连接层后接两个子连接层,分别用于anchors的分类和回归,再通过计算筛选得到proposals。RoIs Pooling层则利用Proposal从feature maps中提取Proposal feature进行池化操作,送入后续的Fast R-CNN网络做分类和回归。RPN网络和Fast R-CNN网络中均有分类和回归,但两者有所不同,RPN中分类是判断conv5-3中对应的anchors属于目标和背景的概率(score),并通过回归获取anchors的偏移和缩放尺度,根据目标得分值筛选用于后续检测识别的Proposal;Fast R-CNN是对RPN网络提取的Proposal做分类识别,并通过回归参数调整得到目标(Object)的精确位置。具体的训练过程会在后面详述。接下来会重点介绍RPN网络和Fast R-CNN网络这两个模块,包括RPN网络中引入的Anchor机制、训练数据的生成、分类和回归的损失函数(Loss Function)计算以及RoI Pooling等。
…还是查看原博客吧
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。