赞
踩
CVPR 2016,提出了一种单阶段(one-stage)的目标检测网络。
核心思想:把目标检测转变成一个回归问题,利用整张图作为网络的输入,仅仅经过一个神经网络,得到bounding box(边界框) 的位置及其所属的类别。
网络结构(能默):
网络输入:448×448×3的彩色图片。
中间层:由若干卷积层和最大池化层组成,用于提取图片的抽象特征。
全连接层:由两个全连接层组成,用来预测目标的位置和类别概率值。
网络输出:7×7×30的预测结果。
yolov2 变化:
重点解决YOLOv1召回率和定位精度方面的不足。
优化点:
YOLOv1是利用全连接层直接预测Bounding Box的坐标;
YOLOv2借鉴了Faster R-CNN的思想,引入Anchor机制;利用K-means聚类的方法在训练集中聚类计算出更好的Anchor模板,大大提高了算法的召回率。同时结合图像细粒度特征,将浅层特征与深层特征相连,有助于对小尺寸目标的检测。
yolov3 变化:
网络结构:相比于 YOLOv2 的 骨干网络,YOLOv3 进行了较大的改进。借助残差网络的思想,YOLOv3 将原来的 darknet-19 改进为darknet-53。
Darknet-53主要由1×1和3×3的卷积层组成,每个卷积层之后包含一个批量归一化层和一个Leaky ReLU,加入这两个部分的目的是为了防止过拟合。
对比darknet-19, darknet-53主要做了如下改进:
yolov4 变化:
YOLOv4在传统的YOLO基础上,加入了这些实用的技巧,实现了检测速度和精度的最佳权衡。
常见的正则化方法有:
DropOut
DropConnect
DropBlock
平衡正负样本的方法有:
Focal loss
OHEM(在线难分样本挖掘)
除此之外,还有回归 损失方面的改进:
GIOU
DIOU
CIoU
注意力机制:
Squeeze-and-Excitation (SE)
Spatial Attention Module (SAM)
特征融合集成:
FPN
SFAM
ASFF
BiFPN (出自于大名鼎鼎的EfficientDet)
更好的激活函数:
ReLU
LReLU
PReLU
ReLU6
SELU
Swish
hard-Swish
后处理非极大值抑制算法:
soft-NMS
DIoU NMS
yolov5 变化:
一共给出了5个版本,分别是 YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l、YOLO5x 五个模型。这些不同的变体使得YOLOv5能很好的在精度和速度中权衡,方便用户选择。
yolov5: 默认640*640
yolov3:默认416*416
yolov1:默认448*448
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。