赞
踩
本文主要介绍Sentiment analysis: build your NLP project的思路和补充一些相关知识。
给定Twitter数据集(包含140万条已标记的tweet,单条长度在1到100之间),需要构建一个情感分析模型,使其能够提取推文中反映情绪的词语,然后将推文根据积极、消极或中性分类。这里使用的是keras + GRU。
原始数据集的序列需要经过处理才能应用到模型中,处理包括:
去掉推文里面与情感无关的因素,比如标点符号和提及的对象。
# 制作翻译表,所有标点符号对应翻译是空格
tweet = text.maketrans(string.punctuation, '
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。