当前位置:   article > 正文

特征融合篇 | YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-Time Object Detection

yolo-ms

在这里插入图片描述
我们的目标是为目标检测社区提供一种高效且性能卓越的目标检测器,命名为YOLO-MS。该核心设计基于对不同卷积核尺寸对不同尺度对象检测性能的影响进行的一系列研究。研究结果是一种新策略,能够显著增强实时目标检测器的多尺度特征表示。
为验证我们策略的有效性,我们构建了一个名为YOLO-MS的网络架构。我们从头开始在MS COCO数据集上训练YOLO-MS,而不依赖于任何其他大规模数据集,如ImageNet,或预训练权重。在没有花哨的设计的情况下,我们的YOLO-MS在使用可比较数量的参数和FLOPs时,优于最近的实时目标检测器的最新技术水平,包括YOLO-v7和RTMDet。
以YOLO-MS的XS版本为例,仅具有4.5百万可学习参数和8.7G FLOPs,它在MS COCO上可以达到43%+的AP分数,比具有相同模型大小的RTMDet高出约2%+。此外,我们的工作还可以作为其他YOLO模型的即插即用模块。通常情况下,我们的方法显著提高了YOLOv8的AP分数,从37%+提升到40%+,甚至使用更少的参数和FLOPs。

论文地址:https://arxiv.org/pdf/2308.05480.pdf
代码地址:https://github.com/FishAndWasabi/YOLO-MS


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/692692
推荐阅读
相关标签
  

闽ICP备14008679号