[目标检测] Faster R-CNN 深入理解 && 改进方法汇总_faster r cnn 提点技巧

作者：羊村懒王 | 2024-03-16 15:20:51

踩

faster r cnn 提点技巧

Faster R-CNN 从2015年底至今已经有接近两年了，但依旧还是Object Detection领域的主流框架之一，虽然推出了后续 R-FCN，Mask R-CNN 等改进框架，但基本结构变化不大。同时不乏有SSD，YOLO等骨骼清奇的新作，但精度上依然以Faster R-CNN为最好。对于一般的通用检测问题（例如行人检测，车辆检测，文字检测），只需在ImageNet pre-train model上进行若干次 fine-tune，就能得到非常好的效果。相比于刷pascal voc，Imagenet，coco 等benchmarks，大多数人感兴趣的可能是如何应用到自己的检测目标上。

PS: 一作任少卿大神人挺帅的，回答问题还很耐心。

Faster R-CNN 主要由三个部分组成：（1）基础特征提取网络（2）RPN (Region Proposal Network) （3）Fast-RCNN 。其中RPN和Fast-RCNN共享特征提取卷积层，思路上依旧延续提取proposal + 分类的思想。后人在此框架上，推出了一些更新，也主要是针对以上三点。

1. 更好的特征网络

（1）ResNet，PVANet

ResNet CVPR2016 oral

paper : https://arxiv.org/abs/1512.03385 code :https://github.com/KaimingHe/deep-residual-networks

ResNet 依然是现在最好的基础网络，ResNeXT可能性能上比他好一点，但不是很主流，通过将Faster-RCNN中的VGG16替换成ResNet可以提高performance，不仅是detection，在segmentation，video analysi

声明：本文内容由网友自发贡献，转载请注明出处：【wpsshop博客】