赞
踩
模型结构
Word Embeddings
BiLSTM
Attention
Classifying
使用一个softmax分类器来预测标签
y
^
\hat{y}
y^,该分类器将上一层得到的隐状态作为输入:
p
^
(
y
∣
S
)
=
s
o
f
t
m
a
x
(
W
(
S
)
h
∗
+
b
(
S
)
)
\hat{p}(y|S) = softmax(W^{(S)}h^* + b^{(S)})
p^(y∣S)=softmax(W(S)h∗+b(S))
y
^
=
a
r
g
m
a
x
y
p
^
(
y
∣
S
)
\hat{y} = \underset{y}{argmax}\hat{p}(y|S)
y^=yargmaxp^(y∣S)
成本函数采用正样本的负对数似然:
J
(
θ
)
=
−
1
m
∑
i
=
1
m
t
i
l
o
g
(
y
i
)
+
λ
∣
∣
θ
∣
∣
F
2
J(θ)=−\frac{1}{m}\sum\limits_{i=1}^{m}t_ilog(y_i)+λ||θ||{^2_F}
J(θ)=−m1i=1∑mtilog(yi)+λ∣∣θ∣∣F2
参数说明
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。