当前位置:   article > 正文

[目标检测] Faster R-CNN 深入理解 && 改进方法汇总_faster r cnn 提点技巧

faster r cnn 提点技巧

        Faster R-CNN 从2015年底至今已经有接近两年了,但依旧还是Object Detection领域的主流框架之一,虽然推出了后续 R-FCN,Mask R-CNN 等改进框架,但基本结构变化不大。同时不乏有SSD,YOLO等骨骼清奇的新作,但精度上依然以Faster R-CNN为最好。对于一般的通用检测问题(例如行人检测,车辆检测,文字检测),只需在ImageNet pre-train model上进行若干次 fine-tune,就能得到非常好的效果。相比于刷pascal voc,Imagenet,coco 等benchmarks,大多数人感兴趣的可能是如何应用到自己的检测目标上。

        PS: 一作任少卿大神人挺帅的,回答问题还很耐心。

        Faster R-CNN 主要由三个部分组成:(1)基础特征提取网络(2)RPN (Region Proposal Network) (3)Fast-RCNN 。其中RPN和Fast-RCNN共享特征提取卷积层,思路上依旧延续提取proposal + 分类的思想。后人在此框架上,推出了一些更新,也主要是针对以上三点。


1. 更好的特征网络

    (1)ResNet,PVANet

      ResNet CVPR2016 oral 

      paper : https://arxiv.org/abs/1512.03385 code :https://github.com/KaimingHe/deep-residual-networks

      ResNet 依然是现在最好的基础网络,ResNeXT可能性能上比他好一点,但不是很主流,通过将Faster-RCNN中的VGG16替换成ResNet可以提高performance,不仅是detection,在segmentation,video analysi

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号