当前位置:   article > 正文

YoloV8改进---注意力机制:引入瓶颈注意力模块BAM,对标CBAM_改进yolov8

改进yolov8

目录

​编辑

1.BAM介绍

 2.BAM引入到yolov8

2.1 加入modules.py中:

 2.2 加入tasks.py中:

2.3 yolov8_BAM.yaml


1.BAM介绍

 论文:https://arxiv.org/pdf/1807.06514.pdf

        摘要:提出了一种简单有效的注意力模块,称为瓶颈注意力模块(BAM),可以与任何前馈卷积神经网络集成。我们的模块沿着两条独立的路径,通道和空间,推断出一张注意力图。我们将我们的模块放置在模型的每个瓶颈处,在那里会发生特征图的下采样。我们的模块用许多参数在瓶颈处构建了分层注意力,并且它可以以端到端的方式与任何前馈模型联合训练。我们通过在CIFAR-100、ImageNet-1K、VOC 2007和MS COCO基准上进行大量实验来验证我们的BAM。我们的实验表明,各种模型在分类和检测性能上都有持续的改进,证明了BAM的广泛适用性。

        作者将BAM放在了Resnet网络中每个stage之间。有趣的是,通过可视化我们可以看到多层BAMs形成了一个分层的注意力机制,这有点像人类的感知机制。BAM在每个stage之间消除了像背景语义特征这样的低层次特征,然后逐渐聚焦于高级的语义–明确的目标。 

 

 作者提出了新的Attention模型——瓶颈注意模块,通过分离的两个路径channel和spatial得到attention map,减少计算开销和参数开销。

实验 

 BAM可以在大规模数据集中的各种模型上有很好的泛化能力,同时参数和计算的开销可以忽略不计,这表明提出的模块BAM可以有效地提高网络容量。另一个值得注意的是,改进的性能来自于只在网络中放置三个模块。

 BAM提高了所有具有两个骨干网络的强大基线的准确性.BAM的准确率提高是以可忽略不计的参数开销实现的,这表明提高不是由于天真的容量增加,而是由于我们有效的特征细化。

 2.BAM引入到yolov8

2.1 加入modules.py中:

  1. ###################### BAM attention #### START by AI&CV ###############################
  2. import torch
  3. from torch import nn
  4. import torch.nn.functional as F
  5. class ChannelGate(nn.Module):
  6. def __init__(self, channel, reduction=16):
  7. super().__init__()
  8. self.avgpool = nn.AdaptiveAvgPool2d(1)
  9. self.mlp = nn.Sequential(
  10. nn.Linear(channel, channel // reduction),
  11. nn.ReLU(inplace=True),
  12. nn.Linear(channel // reduction, channel)
  13. )
  14. self.bn = nn.BatchNorm1d(channel)
  15. def forward(self, x):
  16. b, c, h, w = x.shape
  17. y = self.avgpool(x).view(b, c)
  18. y = self.mlp(y)
  19. y = self.bn(y).view(b, c, 1, 1)
  20. return y.expand_as(x)
  21. class SpatialGate(nn.Module):
  22. def __init__(self, channel, reduction=16, kernel_size=3, dilation_val=4):
  23. super().__init__()
  24. self.conv1 = nn.Conv2d(channel, channel // reduction, kernel_size=1)
  25. self.conv2 = nn.Sequential(
  26. nn.Conv2d(channel // reduction, channel // reduction, kernel_size, padding=dilation_val,
  27. dilation=dilation_val),
  28. nn.BatchNorm2d(channel // reduction),
  29. nn.ReLU(inplace=True),
  30. nn.Conv2d(channel // reduction, channel // reduction, kernel_size, padding=dilation_val,
  31. dilation=dilation_val),
  32. nn.BatchNorm2d(channel // reduction),
  33. nn.ReLU(inplace=True)
  34. )
  35. self.conv3 = nn.Conv2d(channel // reduction, 1, kernel_size=1)
  36. self.bn = nn.BatchNorm2d(1)
  37. def forward(self, x):
  38. b, c, h, w = x.shape
  39. y = self.conv1(x)
  40. y = self.conv2(y)
  41. y = self.conv3(y)
  42. y = self.bn(y)
  43. return y.expand_as(x)
  44. class BAM(nn.Module):
  45. def __init__(self, channel):
  46. super(BAM, self).__init__()
  47. self.channel_attn = ChannelGate(channel)
  48. self.spatial_attn = SpatialGate(channel)
  49. def forward(self, x):
  50. attn = F.sigmoid(self.channel_attn(x) + self.spatial_attn(x))
  51. return x + x * attn
  52. ###################### BAM attention #### END by AI&CV ###############################

 2.2 加入tasks.py中:

def parse_model(d, ch, verbose=True):  # model_dict, input_channels(3)

添加以下内容 

  1. elif m is BAM:
  2. c1, c2 = ch[f], args[0]
  3. if c2 != nc:
  4. c2 = make_divisible(min(c2, max_channels) * width, 8)
  5. args = [c1, *args[1:]]

2.3 yolov8_BAM.yaml

仅供参考,加入网络位置不同在不同数据集表现不一致是正常现场

  1. # Ultralytics YOLO 声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/AllinToyou/article/detail/698072
    推荐阅读
    相关标签