YOLOv8 | 有效涨点，添加GAM注意力机制，使用Wise-IoU有效提升目标检测效果（附报错解决技巧，全网独家）_yolov8有效涨点

作者：菜鸟追梦旅行 | 2024-05-22 23:58:43

踩

yolov8有效涨点

摘要

摘要

人们已经研究了各种注意力机制来提高各种计算机视觉任务的性能。然而，现有方法忽视了保留通道和空间方面的信息以增强跨维度交互的重要性。因此，我们提出了一种全局注意力机制，通过减少信息减少和放大全局交互表示来提高深度神经网络的性能。引入了具有多层感知器的 3D 排列，用于通道注意以及卷积空间注意子模块。在 CIFAR-100 和 ImageNet-1K 上对所提出的图像分类任务机制的评估表明，我们的方法稳定优于最近使用 ResNet 和轻量级 MobileNet 的几种注意力机制。

基本原理

目标的设计是一种减少信息缩减并放大全局维度交互特征的机制。我们采用 CBAM 的顺序通道空间注意力机制并重新设计子模块。整个过程如图所示。

通道注意力机制

通道注意力子模块使用 3D 排列来保留三个维度的信息。然后，它使用两层 MLP（多层感知器）放大跨维度通道空间依赖性。（MLP是一种编码器-解码器结构，其缩减比为r，与BAM相同。）通道注意子模块如图所示。

空间注意力机制

在空间注意力子模块中，为了关注空间信息，我们使用两个卷积层进行空间信息融合。我们还使用与 BAM 相同的通道注意子模块的缩减率 r。同时，最大池化会减少信息并产生负面影响。我们删除池化以进一步保留特征图。因此，空间注意力模块有时会显着增加参数的数量。为了防止参数显着增加，我们在 ResNet50 中采用带有通道洗牌的组卷积。没有组卷积的空间注意力子模块如图所示。

GAM代码实现


class GAM_Attention(nn.Module):
    def __init__(self, c1, c2, group=True, rate=4):
        super(GAM_Attention, self).__init__()
 
        self.channel_attention = nn.Sequential(
            nn.Linear(c1, int(c1 / rate)),
            nn.ReLU(inplace=True),
            nn.Linear(int(c1 / rate), c1)
        )
 
        self.spatial_attention = nn.Sequential(
 
            nn.Conv2d(c1, c1 // rate, kernel_size=7, padding=3, groups=rate) if group else nn.Conv2d(c1, int(c1 / rate),
                                                                                                     kernel_size=7,
                                                                                                     padding=3),
            nn.BatchNorm2d(int(c1 / rate)),
            nn.ReLU(inplace=True),
            nn.Conv2d(c1 // rate, c2, kernel_size=7, padding=3, groups=rate) if group else nn.Conv2d(int(c1 / rate), c2,
                                                                                                     kernel_size=7,
                                                                                                     padding=3),
            nn.BatchNorm2d(c2)
        )
 
    def forward(self, x):
        b, c, h, w = x.shape
        x_permute = x.permute(0, 2, 3, 1).view(b, -1, c)
        x_att_permute = self.channel_attention(x_permute).view(b, h, w, c)
        x_channel_att = x_att_permute.permute(0, 3, 1, 2)
        # x_channel_att=channel_shuffle(x_channel_att,4) #last shuffle
        x = x * x_channel_att
 
        x_spatial_att = self.spatial_attention(x).sigmoid()
        x_spatial_att = channel_shuffle(x_spatial_att, 4)  # last shuffle
        out = x * x_spatial_att
        # out=channel_shuffle(out,4) #last shuffle
        return out

以上代码添加在 ./ultralytics/nn/modules/conv.py 中

Wise-IoU

Yolov7提出的损失函数是GIoU(Generalized Intersection over Union)，能在更广义的层面上计算IoU(Intersection over Union)，但是当两个预测框完全重合时，不能反映出实际情况，此时GIoU就要退化为IoU，并且GIoU对每个预测框与真实框均要计算最小外接框，故损失函数计算及收敛速度受到限制。
为了弥补这种遗憾，改进的网络中使用了WIoU(Wise-IoU)作为损失函数。WIoU v3作为边界框回归损失，包含一种动态非单调机制，并设计了一种合理的梯度增益分配，该策略减少了极端样本中出现的大梯度或有害梯度。该损失方法计算更多地关注普通质量的样本，进而提高网络模型的泛化能力和整体性能。

虽然几种主流损失函数都采用静态聚焦机制，但WIoU不仅考虑了方位角、质心距离和重叠面积，还引入了动态非单调聚焦机制。 WIoU应用合理的梯度增益分配策略来评估锚框的质量。WIoU有三个版本。 WIoU v1 设计了基于注意力的预测框损失，WIoU v2 和 WIoU v3 添加了聚焦系数。

最小的包围盒（绿色）和中心点的连接（红色），其中并集的面积为 Su = wh + wgthgt − WiHi .

WIoU代码实现


def WIoU(cls, pred, target, self=None):
        self = self if self else cls(pred, target)
        dist = torch.exp(self.l2_center / self.l2_box.detach())
        return self._scaled_loss(dist * self.iou)

下面的代码替换loss.py的class BboxLoss


class BboxLoss(nn.Module):
 
    def __init__(self, reg_max, use_dfl=False):
        """Initialize the BboxLoss module with regularization maximum and DFL settings."""
        super().__init__()
        self.reg_max = reg_max
        self.use_dfl = use_dfl
 
    def forward(self, pred_dist, pred_bboxes, anchor_points, target_bboxes, target_scores, target_scores_sum, fg_mask):
        """IoU loss."""
        weight = target_scores.sum(-1)[fg_mask].unsqueeze(-1)
        loss,iou = bbox_iou(pred_bboxes[fg_mask], target_bboxes[fg_mask], xywh=False,type_='WIoU')
        loss_iou=loss.sum()/target_scores_sum
 
        # DFL loss
        if self.use_dfl:
            target_ltrb = bbox2dist(anchor_points, target_bboxes, self.reg_max)
            loss_dfl = self._df_loss(pred_dist[fg_mask].view(-1, self.reg_max + 1), target_ltrb[fg_mask]) * weight
            loss_dfl = loss_dfl.sum() / target_scores_sum
        else:
            loss_dfl = torch.tensor(0.0).to(pred_dist.device)
 
        return loss_iou, loss_dfl

yaml文件编写


# Ultralytics YOLO 声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/610481
推荐阅读
article2020年 ICLR 国际会议最终接受论文(poster-paper)列表(四)_fundament...
来源：AINLPer微信公众号（点击了解一下吧）编辑: ShuYini校稿: ShuYini时间: 2020-02-21...
                                    赞
踩
article基于深度学习的鱼类分类检测系统（含UI界面、yolov8、Python代码、数据集）_基于深度学习的...
本文将详细介绍如何以官方yolov8为主干，实现对鱼类的检测识别，且利用PyQt5设计了简约的系统UI界面。在界面中，您...
                                    赞
踩
articleWise-IoU: Bounding Box Regression Loss with Dynami...
一个好的损失函数应该在锚盒与目标盒重合良好时弱化几何因素的惩罚，训练中较少的干预会使模型获得更好的泛化能力。一些飞机的标...
                                    赞
踩
articlePYQT6做UI，用YOLOV8检测RTSP视频流_pyqt6 yolov8...
PYQT6制作UI，用YOLOV8模型来检测RTSP视频流。_pyqt6 yolov8pyqt6 yolov8     ...
                                    赞
踩
article【YOLOV8 轻量化改进】 使用高效网络EfficientNetV2替换backbone...
【YOLOV8 轻量化改进】 使用高效网络EfficientNetV2替换backbone_yolov8 轻量化yolo...
                                    赞
踩
articleyolov8 模型架构轻量化 | 极致提速度_yolov8轻量化...
当想要提升模型在通用计算平台上的FPS（每秒帧数或帧率）时，可以从模型架构的三个关键角度出发进行优化：模型的参数数量、浮...
                                    赞
踩
articleyolov8 模型架构轻量化 | 极致降参数量_yolov8轻量化为什么参数了上去了还叫轻量化...
模型轻量化加速是深度学习领域的重要研究方向，旨在减小模型的体积和计算复杂度，从而提高在资源受限设备上的运行效率，模型参数...
                                    赞
踩
article【深度学习目标检测】十二、基于深度学习的钢铁缺陷识别（python，目标检测，yolov8）_yol...
YOLOv8是一种物体检测算法，是YOLO系列算法的最新版本。YOLO（You Only Look Once）是一种实时...
                                    赞
踩
articleYOLOv8 更换骨干网络之 MobileNetV3：轻量级目标检测的新热点_yolov8 mobi...
本文将深入探讨 MobileNetV3 的核心概念，探讨其在 YOLOv8 中的应用，并提供示例代码和实际操作指南，以帮...
                                    赞
踩
articleYOLOV8：FileNotFoundError: train: No labels found i...
YOLOV8：FileNotFoundError: train: No labels found in /home/sm...
                                    赞
踩
articleyolov8 No labels found in /path/train.cache解决_trai...
yolov8训练时出现no labels found in train.cache错误，原因是train2017文件夹为...
                                    赞
踩
articleYOLOV8：FileNotFoundError: train: No labels found i...
其中JPEGImages是你数据集的图片，则可以按照我的方式修改......_yolov8:filenotfounder...
                                    赞
踩
article[ultralytics-yolov8]报错：WARNING ⚠️ No labels found ...
我才发现，原来yolo他自动读数据的路径本身给的和我的文件夹名称不对，所以一直找不到，这个函数应该是在ultralyti...
                                    赞
踩
article【ERROR】YOLOv8:FileNotFoundError: train: No labels ...
转换代码-注意会删除源PNG文件，谨慎操作！【ERROR】YOLOv8:FileNotFoundError: train...
                                    赞
踩
article基于深度学习的目标图像检测【Yolov8】_yolov8目标检测步骤流程图...
通过yolo模型进行图像检测的基础功略，面对本科毕设/报告设计_yolov8目标检测步骤流程图yolov8目标检测步骤流...
                                    赞
踩
article深度学习目标检测】二十、基于深度学习的雾天行人车辆检测系统-含数据集、GUI和源码（python，y...
雾天车辆行人检测在多种场景中扮演着至关重要的角色。总的来说，雾天车辆行人检测技术在提升道路安全、辅助驾驶、提高交通效率以...
                                    赞
踩
相关标签
深度学习
分类
YOLO
鱼类分类
鱼类检测
人工智能
算法
python
目标检测
计算机视觉
视觉检测
pyqt
目标跟踪
yolo学习
yolo进阶
服务器
学习