赞
踩
Backbone-CSP和Densenet的跳跃融合方式是差不多的。
提取好特征之后需要进一步提取特征。下面是方法的演变过程,由易到难。
1、第一种基础结构就是在最终层进行预测处理,这是最原始的预测方式。
2、第二种是先建立图片金字塔再进行预测处理,主要是为了检测不同尺寸的同种物体(又称尺寸不变形)。
3、第三种是每一层卷积之后都进行预测。
4、将高层特征和低层特征融合后进行预测。
a、是FPN单向融合金字塔
b、是PANet双向融合金字塔
看完上面,再看YOLOV5的原来的PANet结构应该很清楚了。
三个输出层对应三个不同的分辨率。高分辨率层可以检测小目标,低分辨率层可以检测大目标。
YOLOV5输出层为20×20×255,40×40×255,80×80×255的尺寸,分别对应8、16、32倍下采样。
每个尺寸对应不同的anchor_box。可看出尺度越小检测目标越大。 ,需要的anchorbox尺度就越大。
20×20×255=20×20×3×85
40×40×255=40×40×3×85
80×80×255=80×80×3×85
这里的3代表着三个不同尺度的检测结果,用途是尺寸可变性。(是为了检测同一物体的不同尺寸?)
最终的输出层为[1,25200,85]
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。