NLP中的Attention总结_nlp 文本翻译 attention key是什么

作者：IT小白 | 2024-06-24 15:20:06

踩

nlp 文本翻译 attention key是什么

Attention是模拟人脑的注意力机制。人在看到一些东西，往往只关注重要的信息，而忽略其他信息。自然语言处理中的attention是对文本分配注意力权重，Attention的本质就是从关注全部变为关注重点。

在这里插入图片描述
Attention的计算过程：

在这里插入图片描述

如上图，按不同的方式，可将attention分为不同类型。

在这里插入图片描述

attention通俗来讲是用两个向量(query,key)计算得到一个得分score。从数学角度看，就是两个向量得到一个数值。一般有以下计算方式：

（1）点乘： $s(q,k)=q\cdot k$

（2）余弦相似度： $s(q,k)=\frac{q\cdot k}{|q||k|}$

还有引入学习参数的方式

（3）矩阵相乘： $s(q,k)=q^TWk$

（4）小网络学习（多层感知机）：输入两个向量，输出一个数值

如篇章级别的任务，这类型任务输入的信息过多，使用attention捕获关键信息。

可能需要对两端内容进行对齐，如机器翻译，翻译时当前词与原文的信息对齐。阅读理解，问题与原文信息的对齐。

某些任务只依赖与部分强特征词。

引用自：

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/753120