YOLOv8改进 | 添加注意力篇 | 结合Mamba注意力机制MLLA助力YOLOv8有效涨点（全网独家首发）

作者：从前慢现在也慢 | 2024-08-03 01:14:19

踩

mlla

一、本文介绍

本文给大家带来的改进机制是结合号称超越Transformer架构的Mamba架构的最新注意力机制MLLA，本文将其和我们YOLOv8进行结合，MLLA（Mamba-Like Linear Attention）的原理是通过将Mamba模型的一些核心设计融入线性注意力机制，从而提升模型的性能。具体来说，MLLA主要整合了Mamba中的“忘记门”（forget gate）和模块设计（block design）这两个关键因素，同时MLLA通过使用位置编码（RoPE）来替代忘记门，从而在保持并行计算和快速推理速度的同时，提供必要的位置信息。这使得MLLA在处理非自回归的视觉任务时更加有效，本文内容为我独家整理全网首发。

专栏目录：YOLOv8改进有效系列目录 | 包含卷积、主干、检测头、注意力机制、Neck上百种创新机制

4.1 修改一

4.2 修改二

4.3 修改三

4.4 修改四

五、MLLA的yaml文件和运行记录

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/从前慢现在也慢/article/detail/920815