赞
踩
Attention机制可以描述为将一个query和一组key-value对映射到一个输出,其中query,keys,values和输出均是向量。输出是values的加权求和,其中每个value的权重 通过query与相应key的兼容函数来计算。
那么Query,Key,Value是什么意思呢?它们在Attention的计算中扮演着什么角色呢?先看一下Attention的计算方法,整个过程分成7步:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。