【目标检测】|Dive Deeper Into Box for Object Detection 基于FCOS新训练方法

作者：菜鸟追梦旅行 | 2024-04-13 02:52:16

踩

dive deeper into box for object detection

ECCV2020论文
论文地址：https://arxiv.org/abs/2007.14350

问题描述

在目标检测领域，虽然无锚框的取得成功，但定位精度不足。

问题原因分析

1 中心关键点与目标的语义不一致。在当前的anchor-free方法中，中心关键点是十分重要的，但如图1所示，目标对应的中心关键点区域更多的是无关的背景，这会不可避免地将噪声像素作为正样本。如果使用这种简单的策略来定义正样本像素，必定会导致明显的语义不一致，造成回归准确率下降。
在这里插入图片描述
2 局部特征的回归有局限性。由于卷积核的大小有限，每个中心关键点对应的有效感受域可能只覆盖了目标的部分信息，仅使用关键点进行bbox回归会造成性能的下降。如图2所示，虚线预测框为中心点预测的结果，每个框都是没有完美地对齐目标。

在这里插入图片描述

该文方法

论文提出了基于FCOS的新的目标检测算法DDBNet，创新点主要在于box分解和重组模块(D&R, decomposition and recombination)和语义一致性模块(semantic consistency)，分别用于解决中心关键点的回归不准问题以及中心关键点与目标的语义不一致问题，结果如图2中的实线框。
D&R模块，分解多个预测框为多个边界，然后组合成新的预测框，这些边界连接在回归分支后面。综合原来的预测框进行准确的训练，这个模块在预测时去掉。在训练阶段，一旦在每个像素处回归边界框预测，D&R模块将每个边界框分解为四个方向边界。然后，根据与地面真实值的实际边界偏差对同类边界进行排序。因此，通过重新组合排名边界，可以预期更准确的框预测，然后通过IoU损失优化框预测【30】。
语义一致性模块，根据像素对应的分类分数以及内在重要性，自适应地将其归为正样本像素和副样本像素。该框架引入了一个新的分支，即估计语义一致性而不是中心度，并在语义一致性模块的监督下进行了优化。该模块利用基于分类和回归分支输出的自适应滤波策略。

主要贡献：

基于anchor-free架构提出新的目标检测算法DDBNet，能够很好地解决中心关键点的回归问题以及中心关键点的语义一致性。
验证了中心关键点和GT的语义一致性，能够帮助提升目标检测网络的收敛性。
DDBNet能够达到SOTA精度(45.5%)，并且能够高效地拓展到其它anchor-free检测器中。

Box Decomposition and Recombination

在这里插入图片描述

semantic consistency module

在这里插入图片描述
REF
https://jishuin.proginn.com/p/763bfbd2df4a

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/414011