赞
踩
情感分析主要研究观点挖掘、倾向性分析等。
文本信息主要包括两类:
但是已有的文本分析方法主要侧重在客观性文本内容的分析和挖掘。
观点挖掘与倾向性分析就是从海量数据中挖掘观点信息,并分析观点信息的倾向性。
观点挖掘与倾向性分析的主要任务有:
从内容上可分为:
从粒度等级上可分为:
根据用户的查询从文档中找出对于主题信息发表了观点的文档,主题相关并且具有主观倾向性。
(1)词级别
任务:识别词语的情感倾向性,构建词典资源。
基本思路:利用词之间的相似度进行扩展。
方法:基于词典的方法或者基于语料库的方法。
(2)句子级别
任务:识别句子的情感倾向性。
关键问题:如何进行特征表示。
分类:基于语料库的方法、基于词典的方法和融合方法。
与传统的基于话题的文本分类侧重于主题词特征相比,情感识别中表示倾向性的词语更加重要。
基于语料库的方法的步骤:
(3)文档级别
任务:识别篇章整体观点倾向性。
绝大多数方法与句子级别方法类似:特征+分类器。
关键问题:多观点倾向性,即一篇商品评论中可能包含对于商品多方面的观点,每个观点的倾向性也可能不同,如何识别篇章整体的观点倾向性。
基于句子的划分的方法,因为篇章中的客观句对于篇章的整体观点倾向性没有意义,所以可以:
然后考虑篇章中每个句子对于篇章整体倾向性的贡献:
当然也可以使用基于深度学习的方法:
主要问题:多观点混合问题,即篇章中局部观点与整体观点不一致。
(4)其他
(1)观点对象抽取
任务:抽取观点评价的对象。
方法:利用属性词与评价词之间的依存句法关系。
(2)观点持有者抽取
基本思路:
任务:从海量文本中根据查询找到观点信息。
根据主题相关度与观点倾向性对于结果进行重排序。
关键问题:找到主题相关度得分与观点倾向性得分的折中。
基于句子的观点检索:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。