赞
踩
导读
本次分享的是关于文本分析中的情感预测分析和主题分析的一个小科研项目,数据爬取自Twitter,主要内容分为3部分:
1.情感预测机器学习模型选择及建立
2.情感预测深度学习模型LSTM的介绍和建立
3.主题分析模型简介
01
# 情感预测机器学习模型选择及建立
情感预测分析主要内容是爬取Twitter用户在election2016这个话题下对Trump和Hillary的讨论,通过人工标注一部分推文的情感标签(即对某位候选人持支持、中立或不支持态度),并将其作为训练数据,用不同算法模型来学习并预测其余未标注推文数据集的标签。
最终情感预测的结果可以用来展示和预测不同地区的选民对某位候选人的情感偏向,也可以用来在未来大选期间通过选民推文内容预测某位候选人情感偏向。
1.数据说明及处理
首先通过一些文本处理清洗操作,包括选取重要的数据项、去掉不必要的标点符号、数字和停词以及词根处理等,将每条Twitter数据处理为这条Twitter中对情感预测重要的词汇集合。下图为一部分数据处理操作。
数据整理结束后,用词云可视化展示了在这两个数据集中词频较高的词汇。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。