当前位置:   article > 正文

YOLOv8最新改进系列:YOLOv8融合BoTNet模块,融合CNN+自然语言处理技术的优势,有效提升检测效果!_yolov8 加入bot

yolov8 加入bot

YOLOv8最新改进系列:YOLOv8融合BoTNet模块

YOLOv8主干特征提取网络为卷积神经网络,卷积神经网络具有平移不变性和局部性,缺乏全局建模长距离建模的能力,引入自然语言处理任务中的Transformer可以形成CNN+TransFormer架构,充分融合两者的优点,提高目标检测效果。


AI学术叫叫兽er在这!家人们,给我遥遥领先!!!


一、 BoTNet简介

论文地址:https://arxiv.org/abs/2101.11605

BoTNet是一种简单但功能强大的主干网络,该架构将注意力模块纳入了包括图像分类,目标检测,实例分割等多种计算机视觉任务。通过仅将ResNet的最后三个的卷积层替换成MHSA层,并不进行其他改变,在墓边检测方面显著改善了极限,同时减少了参数两,从而使得延迟最小化。
Transformer中的MHSA和BoTNet中的MHSA的区别:

归一化,Transformer使用 Layer Normalization,而BoTNet使用 Batch Normalization。
非线性激活,Transformer仅仅使用一个非线性激活在FPN block模块中,BoTNet使用了3个非线性激活。
输出投影,Transformer中的MHSA包含一个输出投影,BoTNet则没有。
优化器,Transformer使用Adam优化器训练,BoTNet使用sgd+ momentum

二、改进方法

2.1 修改YAML(不知道在哪改动的,见我博客之前的文章,均有详细介绍!)

# Ultralytics YOLO 
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/424647
推荐阅读
相关标签