当前位置:   article > 正文

Yolov5通俗易懂网络结构详解_yolov5网络结构详解

yolov5网络结构详解

1、总体结构

  • YOLOV5网络结构可分三层,Backbone、Neck、Head。通常修改网络结构会替换和修改这三个层面。

在这里插入图片描述
在这里插入图片描述

1.1Backbone-CSP基于DenseNet的跳跃融合方式

  • 大家一定知道resnet这个网络,后面从resnet启发下,出现了Desnet。但是不难看出,所做的事情就是把高级特征和低级特征进行融合。这这样可以更好的提取图片特征。

在这里插入图片描述
Backbone-CSP和Densenet的跳跃融合方式是差不多的。
在这里插入图片描述

1.2Neck-PANet(站在巨人肩膀上的PANet)

提取好特征之后需要进一步提取特征。下面是方法的演变过程,由易到难。
1、第一种基础结构就是在最终层进行预测处理,这是最原始的预测方式。
2、第二种是先建立图片金字塔再进行预测处理,主要是为了检测不同尺寸的同种物体(又称尺寸不变形)。
3、第三种是每一层卷积之后都进行预测。
4、将高层特征和低层特征融合后进行预测。
在这里插入图片描述
a、是FPN单向融合金字塔
b、是PANet双向融合金字塔
在这里插入图片描述
看完上面,再看YOLOV5的原来的PANet结构应该很清楚了。
在这里插入图片描述

1.3Head-output

三个输出层对应三个不同的分辨率。高分辨率层可以检测小目标,低分辨率层可以检测大目标。
在这里插入图片描述

2、输出解码

  • YOLOV5输出层为20×20×255,40×40×255,80×80×255的尺寸,分别对应8、16、32倍下采样。
    在这里插入图片描述

  • 每个尺寸对应不同的anchor_box。可看出尺度越小检测目标越大。 ,需要的anchorbox尺度就越大。
    在这里插入图片描述

  • 20×20×255=20×20×3×85
    40×40×255=40×40×3×85
    80×80×255=80×80×3×85
    这里的3代表着三个不同尺度的检测结果,用途是尺寸可变性。(是为了检测同一物体的不同尺寸?)
    在这里插入图片描述
    最终的输出层为[1,25200,85]
    在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/311721
推荐阅读
相关标签
  

闽ICP备14008679号