赞
踩
在本系列文章中,我将尝试回答过去受到我的一位数据科学同事启发的问题:情感分析的最佳模型是什么?对于这个比较测试,我选择了 13 个流行的模型,这些模型经过预先训练用于情感分析,并且可以开源。在第 1 部分中,您将找到 4 个字典模型(3 个用于 Python,1 个用于 R),在第 2 部分中,我另外回顾了 9 个神经网络模型。
但首先,什么是情绪分析以及为什么它很重要?
情感分析是确定自然语言背后的观点、判断或情感的过程
情绪分析是一种非常强大的技术,可以用来分析客户反馈、监控社交媒体,甚至预测股票价格!然而,这是一项相当复杂的任务,因为它处理非结构化文本数据以及语言的细微差别。老实说,即使是人类也不能总是正确地表达情绪,例如,在处理讽刺时。
情感分析最常见的指标是极性,我将在本文中使用它。然而,在文献中,您还可以找到其他指标,例如主观性(如果您想分析偏见)、情感(如果您想检测仇恨言论)等。
极性通常在 [-1, 1] 范围内测量,其中 -1 对应于强烈的负面情绪,0 对应于中性情绪,+1 对应于强烈的正面情绪。拥有极性值非常有用,因为它允许定义您自己的极性阈值t,将中性类别与负/正类别分开(参见下图)。
某些模型不输出极性值,
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。