当前位置:   article > 正文

用于情感分析的最佳开源模型 — 第 1 部分:字典模型 字典模式确实很快,但代价是精度较低_java 情感分析 开源

java 情感分析 开源

介绍

在本系列文章中,我将尝试回答过去受到我的一位数据科学同事启发的问题:情感分析的最佳模型是什么?对于这个比较测试,我选择了 13 个流行的模型,这些模型经过预先训练用于情感分析,并且可以开源。在第 1 部分中,您将找到 4 个字典模型(3 个用于 Python,1 个用于 R),在第 2 部分中,我另外回顾了 9 个神经网络模型。

但首先,什么是情绪分析以及为什么它很重要?

情感分析是确定自然语言背后的观点、判断或情感的过程

情绪分析是一种非常强大的技术,可以用来分析客户反馈、监控社交媒体,甚至预测股票价格!然而,这是一项相当复杂的任务,因为它处理非结构化文本数据以及语言的细微差别。老实说,即使是人类也不能总是正确地表达情绪,例如,在处理讽刺时。

指标

情感分析最常见的指标是极性,我将在本文中使用它。然而,在文献中,您还可以找到其他指标,例如主观性(如果您想分析偏见)、情感(如果您想检测仇恨言论)等。

极性通常在 [-1, 1] 范围内测量,其中 -1 对应于强烈的负面情绪,0 对应于中性情绪,+1 对应于强烈的正面情绪。拥有极性值非常有用,因为它允许定义您自己的极性阈值t,将中性类别与负/正类别分开(参见下图)。

在这里插入图片描述
某些模型不输出极性值,

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/701069
推荐阅读
相关标签
  

闽ICP备14008679号