赞
踩
在之前的文章中我已经将商品评论中的评价实体,也就是特征(feature)给挖掘出来了,我看了一下,挖掘的效果还是不错的。原文链接:http://blog.csdn.net/chixujohnny/article/details/52794685
下面一步要做的是施加情感因子,也就是说,要将人们评论时候所连带的感情程度施加一下。这项任务的归类应该是情感分析技术。
目前该类问题的情感分析技术做的最稳定的还是基于情感词典的情感因子施加方法,因为不是做这个的,我问了一下做NLP的室友目前最好的好像能用神经网络去做,不过初期效果很差,一般要做一年时间才能做的比较好,我没这个时间所以还是算了。
如果用情感词典进行评价实体情感分析的话思路上就比较简单了,大致如下:
1.首先下载情感词典,情感词典现在非常多,百度一下到处都是,我选择的是《知网情感分析用词语集》,中英文都有,百度一下就能下载。
2.词语集到手以后,首先要做一下基本的预处理工作,包括将情感词分类等等(这个类他给你分好了,预处理一下就行)。
3.使用合适的方法施加评价实体的情感因子。这一步是比较关键的一步,并且有两个可以调节的参数。
下面就可以干活了:
1. 我之所以用《知网情感分析用词语集》是因为中英文的情感词都有,目前实验都是英文的,万一以后有中文的使用起来也会公平一点。这一步就不细说了。
2. 数据预处理首先是把情感词按照程度分个类,我分成了一下几类:极其/最、很、比较、稍、欠佳/欠妥、超。一共六类程度依次下降。把文本格式搞一下就可以写代码读文
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。