赞
踩
Transformer之MQA:多查询注意力(Multi-Query Attention,MQA)的概述(论文+原理等)、代码实现、案例应用之详细攻略
目录
相关论文
《Fast Transformer Decoding: One Write-Head is All You Need》翻译与解读
Abstract
MQA技术的概述