当前位置:   article > 正文

NLP推特情感分析模型

情感分析模型

本文主要介绍Sentiment analysis: build your NLP project的思路和补充一些相关知识。

介绍

给定Twitter数据集(包含140万条已标记的tweet,单条长度在1到100之间),需要构建一个情感分析模型,使其能够提取推文中反映情绪的词语,然后将推文根据积极、消极或中性分类。这里使用的是keras + GRU。

建立语料库

原始数据集的序列需要经过处理才能应用到模型中,处理包括:

  1. 去掉标点符号和“@xxx"
  2. 文本序列化
  3. 统一序列长度

去掉标点符号和“@xxx"

去掉推文里面与情感无关的因素,比如标点符号和提及的对象。

# 制作翻译表,所有标点符号对应翻译是空格
tweet = text.maketrans(string.punctuation, '
  • 1
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Gausst松鼠会/article/detail/682129
推荐阅读
相关标签
  

闽ICP备14008679号