YOLOv5、YOLOv8改进：gnconv 门控递归卷积

作者：小小林熬夜学编程 | 2024-02-16 13:54:40

踩

gnconv

1.简介

论文地址：https://arxiv.org/abs/2207.14284
代码地址：https://github.com/raoyongming/HorNet

视觉Transformer的最新进展表明，在基于点积自注意力的新空间建模机制驱动的各种任务中取得了巨大成功。在本文中，作者证明了视觉Transformer背后的关键成分，即输入自适应、长程和高阶空间交互，也可以通过基于卷积的框架有效实现。作者提出了递归门卷积（g n Conv），它用门卷积和递归设计进行高阶空间交互。新操作具有高度灵活性和可定制性，与卷积的各种变体兼容，并将自注意力中的二阶交互扩展到任意阶，而不引入显著的额外计算。g nConv可以作为一个即插即用模块来改进各种视觉Transformer和基于卷积的模型。基于该操作，作者构建了一个新的通用视觉主干族，名为HorNet。在ImageNet分类、COCO对象检测和ADE20K语义分割方面的大量实验表明，HorNet在总体架构和训练配置相似的情况下，优于Swin Transformers和ConvNeXt。HorNet还显示出良好的可扩展性，以获得更多的训练数据和更大的模型尺寸。除了在视觉编码器中的有效性外，作者还表明g n Conv可以应用于任务特定的解码器，并以较少的计算量持续提高密集预测性能。本文的结果表明，g n Conv可以作为一个新的视觉建模基本模块，有效地结合了视觉Transformer和CNN的优点。

(a)标准卷积运算没有明确考虑空间交互。

●
(b) 动态卷积 [27, 4] 和 SE [25] 引入了动态权重，以通过额外的空间交互来提高卷积的建模能力。

(d) gnConv 使用具有门控卷积和递归设计的高效实现来实现任意阶空间交互。在本文中，作者总结了视觉Transformers成功背后的关键因素是通过自注意力操作实现输入自适应、远程和高阶空间交互的空间建模新方法。虽然之前的工作已经成功地将元架构、输入自适应权重生成策略和视觉Transformers的大范围建模能力迁移到CNN模型，但尚未研究高阶空间交互机制。作者表明，使用基于卷积的框架可以有效地实现所有三个关键要素。作者提出了递归门卷积（g nConv），它与门卷积和递归设计进行高阶空间交互。与简单地模仿自注意力中的成功设计不同，g n Conv有几个额外的优点：1）**效率。**基于卷积的实现避免了自注意力的二次复杂度。在执行空间交互期间逐步增加通道宽度的设计也使能够实现具有有限复杂性的高阶交互；2）可扩展。将自注意力中的二阶交互扩展到任意阶，以进一步提高建模能力。由于没有对空间卷积的类型进行假设，g n Conv与各种核大小和空间混合策略兼容；3）平移等变性。g n Conv完全继承了标准卷积的平移等变性，这为主要视觉引入了有益的归纳偏置。

基于g n Conv，作者构建了一个新的通用视觉主干族，名为HorNet。作者在ImageNet分类、COCO对象检测和ADE20K语义分割上进行了大量实验，以验证本文模型的有效性。凭借相同的7×7卷积核/窗口和类似的整体架构和训练配置，HorNet优于Swin和ConvNeXt在不同复杂度的所有任务上都有很大的优势。通过使用全局卷积核大小，可以进一步扩大差距。HorNet还显示出良好的可扩展性，可以扩展到更多的训练数据和更大的模型尺寸，在ImageNet上达到87.7%的top-1精度，在ADE20K val上达到54.6%的mIoU，在COCO val上通过ImageNet-22K预训练达到55.8%的边界框AP。除了在视觉编码器中应用g n Conv外，作者还进一步测试了在任务特定解码器上设计的通用性。通过将g n Conv添加到广泛使用的特征融合模型FPN，作者开发了HorFPN来建模不同层次特征的高阶空间关系。作者观察到，HorFPN还可以以较低的计算成本持续改进各种密集预测模型。结果表明，g n Conv是一种很有前景的视觉建模方法，可以有效地结合视觉Transofrmer和CNN的优点。

2.YOLOv5代码修改

2.1 修改yaml文件

我这边只是提供参考，你可以修改任意位置


# YOLOAir 声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/93971
推荐阅读
articleC# Onnx yolov8 仪表指针检测...
C# Onnx yolov8 仪表指针检测C# Onnx yolov8 仪表指针检测             目录 效果...
                                    赞
踩
articleyoloV5 增加小目标检测层_yolov5增加检测头...
原始网络有三个检测头： 分别是 80x80 （小目标） 40x40（中目标） 160x160(小目标)，现在要增加小目标...
                                    赞
踩
articleyolov5-6.0网络添加小目标检测头 TensorRT部署...
yolov5-6.0网络添加小目标检测头 TensorRT部署_小目标检测头小目标检测头             小目标...
                                    赞
踩
articleYolov5、rtsp-server、ffmpeg、vlc，实现实时检测视频推拉流_qgc 验证无人...
1.yolov5源码；2.rtsp-server、ffmpeg、vlc，现在即相关配置。具体配置可自行搜索；3.效果展示...
                                    赞
踩
articleyolov8实战第五天——yolov8+ffmpeg实时视频流检测并进行实时推流——（推流，保姆教学...
YOLOv8是YOLO目标检测算法的一个变种。它在YOLOv4的基础上进行了一些改进，如使用更大的图像尺寸、更深的网络结...
                                    赞
踩
articleYolov5-deepsort人车流统计RTMP推流直播_deepstream rtmp...
Yolov5-deepsort人车流统计RTMP推流直播整体框架分为三个部分：（1）目标检测追踪代码（需要英伟达显卡）。...
                                    赞
踩
articleffmpeg+nginx+python完成视频流的推送与接收（Windows向Ubuntu推送视频流...
使用场景：我现在只有一台电脑，安装了虚拟机，虚拟机里面是Ubuntu系统，我准备把插在Windows本机上的视频流推给虚...
                                    赞
踩
article使用 YOLOv8 和 Streamlit 构建实时对象检测和跟踪应用程序：第 1 部分-介绍和设置...
一步一步介绍如何使用 YOLOv8 和 Streamlit 构建实时对象检测和跟踪应用程序_yolov8实时视频流检测y...
                                    赞
踩
articleYOLOv8 onnx 文件推理多线程加速视频流_onnx加速...
【代码】YOLOv8 onnx 文件推理多线程加速视频流。_onnx加速onnx加速              运行环境...
                                    赞
踩
articleopencv-yolov8-目标检测_yolov8视频流目标检测...
【代码】opencv-yolov8-目标检测。_yolov8视频流目标检测yolov8视频流目标检测          ...
                                    赞
踩
articleYOLOv8-第Y7周：训练自己的数据集_yolov8参数mask_ratio作用...
安装环境依赖包,请进入项目文件在文件地址栏中直接输入cmd,打开cmd后输入。最后输入以下命令即可开始训练（参数很多可以...
                                    赞
踩
article使用 TensorRT 对 YOLOv8 模型进行 int8 量化_yolov8 int8量化...
对 YOLOv8 模型进行 int8 量化，主要用到 Python 版的 TensorRT。_yolov8 int8量化...
                                    赞
踩
article目标检测与跟踪 （3）- TensorRT&YOLO V8性能优化与部署测试_tensorrtx 转...
YOLOv8 算法的核心特性和改动可以归结为如下：1. 提供了一个全新的 SOTA 模型，包括 P5 640 和 P6 ...
                                    赞
踩
articleOpenCV4.x图像处理实例-YOLO v8检测与识别物体_opencv yolov8...
本文将详细介绍通过OpenCV的DNN模块，使用YOLO V8模型进行对静态图像、视频流和摄像头进行物体检测与识别。_o...
                                    赞
踩
articlewindows下配置pytorch + yolov8+vscode，并自定义数据进行训练、摄像头实时...
window下使用yolo训练自己的数据，并通过摄像头实时图像检测_pytorch vscodepytorch vsco...
                                    赞
踩
article【YOLOv8】实战一：手把手教你使用YOLOv8实现实时目标检测...
YOLOv8导出为onnx模型，YOLOv8在LabVIEW中的部署，实现实时目标检测！在CPU和GPU上实现加速_yo...
                                    赞
踩
articleyolov8-opencv-ffmpeg-mediamtx实现视频中实时检测安全帽_yolov8头盔...
yolov8-opencv-ffmpeg-mediamtx实现视频中实时检测安全帽。_yolov8头盔yolov8头盔 ...
                                    赞
踩
article【基于Ubuntu下Yolov5的目标识别】保姆级教程 | 虚拟机安装 - Ubuntu安装 - 环...
【基于Ubuntu下Yolov5的目标识别】保姆级教程 | 虚拟机安装 - Ubuntu安装 - 环境配置(Anacon...
                                    赞
踩
articleYOLOv8 从环境搭建到推理训练_yolov8n.pt下载...
yolov8从环境搭建到推理训练（超级详细）_yolov8n.pt下载yolov8n.pt下载             ...
                                    赞
踩
article明火烟雾目标检测项目部署（YoloV5+Flask）_yolov5 flask...
明火烟雾目标检测系统，可在不同设备上自适应。_yolov5 flaskyolov5 flask             ...
                                    赞
踩
相关标签
c#
YOLO
开发语言
目标检测
计算机视觉
c++
Tensorrt
python
pycharm
opencv
深度学习
nginx
ffmpeg
目标跟踪
人工智能
机器学习