赞
踩
作者:禅与计算机程序设计艺术
情感分析(Sentiment Analysis)是NLP(Natural Language Processing)领域的一个重要任务。随着电子商务、网络社交、微博客等新兴互联网应用的流行,用户在产生的文本信息中包含情绪信息,如正面或负面、积极或消极,并且通过对这种情绪信息进行分析和处理,可以帮助企业提升产品和服务的质量,改善客户体验,增强忠诚度。虽然现有的情感分析工具如基于规则的、基于神经网络的、基于统计方法的都可以实现不同程度的情感分析,但本文将主要侧重于深度学习的方法,来解决当前最为复杂、难度较高的情感分析任务。
情感分析模型由两大组件组成,一是特征抽取器,用于抽取输入文本中的情感相关特征;二是分类器,根据抽取到的特征,利用机器学习算法训练出一个分类器,根据输入的文本判断其情感倾向。在实际构建情感分析模型时,往往还会加入其他模块,如情感 lexicon 模块、情感词典模块等。
文本分类是一种自然语言处理(NLP)的任务,目的是对一段文本按照一定标准进行自动分类。常用的文本分类方法有贝叶斯、支持向量机、逻辑回归等。文本分类的目标就是将文本映射到预先定义好的类别或者标签上。通常情况下,文本分类的类别数量一般都比较多,例如,垃圾邮件分为“正常”、“病毒”、“钓鱼”、“诈骗”等七种类别。这些类别也称作标记(Label),标记的数量决定了文本的分类范围。 情感分析模型也是文本分类的一个子集。根据特征抽取器所提取出的特征,机器学习算法训练出来的分类器可以输出对应输入文本的情感倾向类别。</
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。