赞
踩
在情感分类任务中,人们关注的往往是一句话中所表露出情感的“最重要”的一部分,比如在美团上经常会有这种评价:“这家店的菜做的不错,但是服务特别差!”,而对于餐厅管理者来说,这条评论他们最关注的是“这家店服务特别差”这个部分,即整个句子对他们餐厅所表现出来的情感是“不满意”的,“这家店菜做的不错”就成了做情感分类任务中的“噪声”,会影响到算法判断出句子真正想要表现的情感,而以往的采用双向LSTM加上attention的做法不能很好的区分这种“噪声”,于是本文提出了一种新型的解决方案,来解决这个问题。
假设咱们有一个句子
情感分类任务具体而言就是给定一个输入句子,判断它所包含的情感是“积极的”,还是“消极的”,还是“中立的”,本质上其实就是一个三分类任务,于是我们可以针对每一个句子标记一个label,即
本文提出一种称为Tnet的模型,如下图所示:
图中最底层(红色部分)是一个双向LSTM,得到输入的词序列
中间层包含
CPT结构如图所示:
如图所示,它包含TST和LF/AS两个子结构:
我们先说TST
其最底层是一个双向LSTM,输入是
在来看LF/AS
由于在TST中我们的
Lossless Forwarding
具体而言,就是将第
这样一层层传递下去,我们的每一层都会包含之前所有层的信息,如下图公式所示:
Adaptive Scaling
具体而言,就是借鉴LSTM的思想,训练一个门结构,用来判断有哪些信息会传递到下一层,哪些可以丢弃。如下所示:
其中
得到了最后一层CPT的输出之后,我们将其送入一个卷积核大小为1的卷积层,然后再用max pool的方法提取特征,最后再接一个softmax层就得到了我们最终的输出了。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。