赞
踩
a new store opened beside the new mall
中store
和mall
两个词意思相似,但是它们在句子中扮演不同句子成分。Table 1
比较不同模型在GLUE dev上的结果
Table 2
比较在MNLI in/out-domain等上的结果
table 3
table 4
DeBERTa上的Ablation study
SuperGLUE上的测试集结果
对于在位置 i i i的token,使用 H i {H_i} Hi和 P i ∣ j {P_{i|j}} Pi∣j分别表示内容和相对位置, j j j是是一个token的位置
计算
t
o
k
e
n
i
token_i
tokeni和
t
o
k
e
n
j
token_j
tokenj注意力分数公式如下:
A
i
,
j
=
{
H
i
,
P
i
∣
j
}
×
{
H
j
,
P
j
∣
i
}
T
=
H
i
H
j
T
+
H
i
P
j
∣
i
T
+
P
i
∣
j
H
j
T
+
P
i
∣
j
P
j
∣
i
T
单头的注意力机制
Q
=
H
W
q
,
K
=
H
W
k
,
V
=
H
W
v
,
A
=
Q
K
T
d
H
o
=
s
o
f
t
m
a
x
(
A
)
V
H
∈
R
N
×
d
,
表
示
输
入
的
隐
藏
层
矩
阵
H
o
∈
R
N
×
d
,
表
示
自
注
意
力
层
的
输
出
W
q
,
W
k
,
W
v
∈
R
d
×
d
,
表
示
投
影
矩
阵
A
∈
R
N
×
N
,
表
示
注
意
力
分
数
矩
阵
N
表
示
序
列
长
度
,
d
表
示
隐
藏
层
维
度
Q = HW_q,K = HW_k, V=HW_v,A=\frac{QK^T}{\sqrt{d}} \\ H_o = softmax(A)V \\ H \in R^{N \times d},表示输入的隐藏层矩阵 \\ H_o \in R^{N \times d},表示自注意力层的输出 \\ W_q,W_k,W_v \in R^{d \times d},表示投影矩阵 \\ A \in R^{N \times N},表示注意力分数矩阵 \\ N表示序列长度,d表示隐藏层维度
Q=HWq,K=HWk,V=HWv,A=d
QKTHo=softmax(A)VH∈RN×d,表示输入的隐藏层矩阵Ho∈RN×d,表示自注意力层的输出Wq,Wk,Wv∈Rd×d,表示投影矩阵A∈RN×N,表示注意力分数矩阵N表示序列长度,d表示隐藏层维度
k
k
k表示最大的相对距离,
δ
(
i
,
j
)
∈
[
0
,
2
k
)
\delta(i,j) \in [0,2k)
δ(i,j)∈[0,2k)表示从
t
o
k
e
n
i
token_i
tokeni到
t
o
k
e
n
j
token_j
tokenj的相对距离
d
e
l
t
a
(
i
,
j
)
=
{
0
f
o
r
i
−
j
≤
−
k
2
f
o
r
i
−
j
≥
k
i
−
j
+
k
o
t
h
e
r
.
delta(i,j) = \left \{
基于相对位置编码的分离注意力机制
Q
c
=
H
W
q
,
c
,
K
c
=
H
W
k
,
c
,
V
c
=
H
W
v
,
c
,
Q
r
=
P
W
q
,
r
,
K
r
=
P
W
k
,
r
A
~
i
,
j
=
Q
i
c
K
j
c
⊤
⏟
(a) content-to-content
+
Q
i
c
K
δ
(
i
,
j
)
r
⊤
⏟
(b) content-to-position
+
K
j
c
Q
δ
(
j
,
i
)
r
⊤
⏟
(c) position-to-content
H
o
=
softmax
(
A
~
3
d
)
V
c
Q
c
,
K
c
,
V
c
投
影
后
的
内
容
向
量
W
q
,
c
,
W
k
,
c
,
W
v
,
c
∈
R
d
×
d
P
∈
R
2
k
×
d
不
变
的
Q
r
和
K
r
表
示
投
影
后
的
相
对
位
置
向
量
W
q
,
r
,
W
k
,
r
∈
R
d
×
d
A
~
i
,
j
表
示
从
t
o
k
e
n
i
到
t
o
k
e
n
j
的
注
意
力
分
数
算法过程
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iHyZFV1j-1637646395985)(C:\Users\nabai\Documents\markdown图片\image-20211122145941077.png)]
将扰动应用于正则化的词嵌入
见Table1,Table2
结果表明:这三个部分都会对最终结果有影响
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。