赞
踩
「论文访谈间」是由 PaperWeekly 和中国中文信息学会社会媒体处理专委会(SMP)联合发起的论文报道栏目,旨在让国内优质论文得到更多关注和认可。
背景介绍
文本情感分析旨在自动地从非结构化的评论文本中抽取有用的观点信息 [1,2] 。早先的文本情感分析工作主要关注文档级别的情感分析和句子级别的情感分析,采用各种方法来分析评论文档或句子整体的情感极性(如正面、负面、中性)。
不同于文档 / 句子级情感分析,细粒度情感分析(Aspect-Based Sentiment Analysis,ABSA)的目的在于分析评论文本中商品 / 服务的具体方面(aspect)的情感 [3] 。
举个例子,用户在某条餐厅评论中 “waiters are unfriendly but the pasta is out of this world.”,对 “waiters” 和 “pasta” 两个方面分别表达了负面的情感和正面的情感。普通的文档 / 句子级情感分析并不能完成这种细粒度的分析任务,ABSA 也因此成为近些年情感分析的热点研究问题。
典型的 ABSA 能够帮助分析评论文本中具体方面的情感极性(正面、负面、中性),但无法提供用户在每个方面的具体观点,如上例中 “waiters” 是 “unfriendly” 的,“pasta” 是 “out of this world” 的。显然,这些观点词解释了用户对某些方面产生相应情感的原因。
为此,我们提出了一个新的细粒度情感分析子任务——面向目标的观点词抽取(Target-oriented Opinion Words Extraction,TOWE),旨在从评论文本中抽取出给定目标(target)对应的观点词(opinion words)。
在 TOWE 任务中,目标对象(target)是提前给定的,和 aspect 表达了相同的含义,都是指评论文本中商品/服务的具体方面 / 属性。以上面的句子为例,当给定目标是“waiters”时,TOWE 需要抽取 “unfriendly” 作为 “waiters” 的观点词;当给定目标为 “pasta”,TOWE 则会抽取观点词 “out of this world”。
这个任务有很多潜在的应用,如给出每个方面具体的观点信息从而帮助商家提升相应的服务、自动从评论中生成成对的观点摘要、帮助我们理解评论中用户情感的来源和提升 aspect-level sentiment classification 的性能。
在接下来的章节中,我们首先给出 TOWE 任务的形式化定义以及我们构造的 benchmark 数据集,然后介绍我们在 NAACL19 和 AAAI20 上的两项工作。
NAACL19 “Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling” [4] 这篇工作定义了 TOWE 任务,并且给出一个鲁棒的融合目标信息的神经序列化标注模型。
论文标题:Target-oriented Opinion Words Extraction with Target-fused Neural Sequence Labeling
论文来源:NAACL 2019
论文链接:https://www.aclweb.org/anthology/N19-1259
代码链接:https://github.com/NJUNLP/TOWE
考虑到标注大量细粒度情感分析数据是耗时且困难的,AAAI20 中的工作 “Latent Opinions Transfer Network for Target-Oriented Opinion Words Extraction” [5] 从迁移学习的角度出发,提出潜在观点迁移网络,从资源丰富的评论情感分类数据中迁移潜在观点知识来辅助提升 TOWE。
论文标题:Latent Opinions Transfer Network for Target-Oriented Opinion Words Extraction
论文来源:AAAI 2020
论文链接:https://arxiv.org/abs/2001.01989
代码链接:https://github.com/NJUNLP/TOWE
任务定义 & 数据集
在评论文本中,一个目标对象可能有多个观点词
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。