当前位置:   article > 正文

集智书童 | YOLOv9开源 | 架构图&模块改进&正负样本匹配&损失函数解读,5分钟即可理解YOLOv9,建议收藏!_yolo v9网络图

yolo v9网络图

本文来源公众号“集智书童”,仅用于学术分享,侵权删,干货满满。

原文链接:YOLOv9开源 | 架构图&模块改进&正负样本匹配&损失函数解读,5分钟即可理解YOLOv9

1 YOLOv9对比图

YOLOv7原作者出手,YOLOv9的性能依旧时一枝独秀:

2 YOLOv9架构图

YOLOv9的整体架构图如下(根据YOLOv9.yaml绘制):

3 YOLOv9改进点一览

  1. YOLOv9从可逆函数角度理论上分析了现有的CNN架构,基于这种分析,YOLOv9作者还设计了PGI和辅助可逆分支,并取得了优秀的结果;

  2. YOLOv9用到的PGI解决了深度监督只能用于极深的神经网络架构的问题,因此使得新的轻量级架构才更适合落地;

  3. YOLOv9中设计的GELAN仅使用传统卷积,就能实现比基于最先进技术的深度可分卷积设计更高的参数使用率,同时展现出轻量级、快速和精确的巨大优势;

  4. 基于所提出的PGI和GELAN,YOLOv9在MS COCO数据集上的性能在所有方面都大大超过了现有的实时目标检测器。

3.1 PGI(可编程梯度信息)组件

PGI主要包括三个组成部分,即:

  1. 主分支

  2. 辅助可逆分支

  3. 多级辅助信息

从图中可以看出,PGI推理过程仅使用主分支,因此不需要任何额外的推理成本。

3.2 GELAN模块

YOLOv9提出了新网络架构——GELAN。GELAN通过结合两种神经网络架构,即结合用梯度路径规划(CSPNet)和(ELAN)设计了一种广义的高效层聚合网络(GELAN);GELAN综合考虑了轻量级、推理速度和准确度。

GELAN整体架构如上图所示。YOLOv9将ELAN的能力进行了泛化,原始ELAN仅使用卷积层的堆叠,而GELAN可以使用任何计算块作为基础Module。

3.3 损失函数与样本匹配

通过上图代码可以看到,样本匹配依旧使用的是TaskAlign样本匹配。和YOLOv8、YOLOE、YOLOv6等算法保持一致;

  • 分类损失:BCE Loss
  • 回归损失:DFL Loss + CIoU Loss

4 速度&精度对比

可以看出,YOLOv9的性能最为优秀,应该会成为2D检测的新宠

THE END!

文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/710592
推荐阅读
相关标签
  

闽ICP备14008679号