赞
踩
YOLO之前,双阶段(two-stage)的R-CNN系列算法,在目标检测领域独占鳌头。先利用RPN网络进行感兴趣区域的生成,再对该区域进行分类与位置的回归。
R-CNN优缺点:提升了精度,但限制了检测速度。
Alexey Bochkovskiy和Joseph Redmon于2016年提出YOLO(You Only Look Once)算法,YOLO是一种实时目标检测算法,它利用CNN卷积神经网络进行特征提取,并识别种类和位置。
YOLO优缺点:检测速度很快,但精度明显下降。
YOLO的核心思想:把目标检测转变成一个回归问题。将整个图像作为网络的输入,仅仅经过一个神经网络,得到边界框的位置及其所属的类别。
YOLO目前在计算机视觉领域得到了广泛的应用。常用的经典版本,包括YOLOv5, YOLOv7, YOLOv8。
https://docs.ultralytics.com/zh/#_1
目前已经发展到了YOLOv8版本。下面简单介绍一下每个版本的主要特点:
YOLOv8版本 UltralyticsLLC 公司推出的是,利用了与YOLOv5类似的代码,但采用了新的结构,其中使用相同的代码来支持分类、实例分割和对象检测等任务类型。模型仍然使用相同的YOLOv5 YAML格式初始化,数据集格式也保持不变。
YOLOv8目标检测算法相较于前几代YOLO系列算法具有如下的几点优势:
YOLOv7是YOLOv4团队的续作,主要是针对模型结构重参化和动态标签分配问题进行了优化。
YOLOv7检测算法的思路是与YOLOv4、v5类似。
主要改动:
1.提出了计划的模型结构重参化。
2.借鉴了YOLOv5、Scale YOLOv4、YOLOX,“拓展”和“复合缩放”方法,以便高效的利用参数和计算量。
3.提出了一种新的标签分配方法。
YOLOv6检测算法的思路类似YOLOv5(backbone+neck)+YOLOX(head)。
主要改动:
1.骨干网Yo络由CSPDarknet换为了EfficientRep
2.Neck是基于Rep和PAN构建了Rep-PAN
3.检测头部分模仿YOLOX,进行了解耦操作,并进行了少许优化。
YOLOv5版本 UltralyticsLLC 公司推出的,是在YOLOv4的基础上做了少许的修补,由于改进比较小,譬如:
1. 将v4版本骨干网络中的CSP(Channel and Spatial Pyramid)结构拓展到了NECK结构中。
2. 增加了FOCUS操作,但是后续6.1版本中又剔除掉了该操作,使用一个6x6的卷积进行了替代。
3. 使用SPPF结构代替了SPP。
Alexey Bochkovskiy大神对YOLOv3进行了升级改造,核心思想与之前基本一致,不过从数据处理、主干网络、网络训练、激活函数、损失函数等方面对子结构进行了大量的改进。
重要升级举措包括:
1. 将CSP(Channel and Spatial Pyramid)结构融入Darknet53中,生成了新的主干网络CSPDarknet53
2. 采用SPP(Spatial Pyramid Pooling)空间金字塔池化来扩大感受野
3. 在Neck部分引入PAN结构,即FPN+PAN的形式
4.引入Mish激活函数
5. 引入Mosaic数据增强
6.训练时采用CIOU_loss ,同时预测时采用DIOU_nms
针对YOLOv2的问题,吸收当下较好的网络设计思想,引入了残差网络模块。重要深化改革的举措:
1. 在darknet19的基础上推陈出新,引入残差,并加深网络深度,提出了Darknet53;
2. 借鉴了特征金字塔的思想,在三个不同的尺寸上分别进行预测。
相比于YOLOv1,YOLOv2在网络结构上进行了改进,引入了更多的卷积层和池化层,从而提高了检测精度。此外,YOLOv2还对数据集进行了扩充,从而进一步提高了模型的泛化能力。
这是YOLO最早的版本,它的网络结构比较简单,准确率也相对较低。YOLOv1在小目标检测和定位方面存在一定的困难,并且对于密集目标的处理效果不佳。但是,它为后来的YOLO算法奠定了基础。
总之,YOLO作为一种实时目标检测算法,具有速度快、精度高等特点,被广泛应用于计算机视觉领域。不同版本的YOLO在网络结构、训练方法和应用场景等方面都有所不同,用户可以根据自己的需求选择合适的版本。
名声大噪的YOLO迎来YOLOv8,迅速包揽目标检测、实例分割新SOTA
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。