当前位置:   article > 正文

NRC词典应用实例——英文文本情感分析_nrc-emotion-lexicon-v0.92-in105languages-nov2017tr

nrc-emotion-lexicon-v0.92-in105languages-nov2017translations

本文在基于NRC词典的情感分析(含多种离散情绪)——python基础上创作,原文章对中文文本进行结巴分词,然后与词典进行匹配。在作者实际使用过程中,由于需要使用到英文的原始数据,因此,将中文文本预处理部分和后续处理部分进行更改完善,以适应英文文本。

情绪和情感词典 是由加拿大国家研究委员会(简称NRC)的专家创建,因此也称为NRC词典。该词典具有广泛的应用程序开发,可以在多种环境中使用,例如情绪分析,产品营销,消费者行为,甚至是政治活动分析。
词典中包含了多种语言的词汇情感值,其中就包括英文和中文,本文将使用英文进行实例应用。

先来看一下有哪些可用的参数:

import pandas as pd
lexion_df = pd.read_excel('F:/NRC-Emotion-Lexicon/NRC-Emotion-Lexicon-v0.92/NRC-Emotion-Lexicon-v0.92-In105Languages-Nov2017Translations.xlsx')
# 读取列标题
lexion_df.columns.tolist()
#选出我们要使用的列并查看
english_df = lexion_df[['English (en)','Positive', 'Negative','Anger','Anticipation', 'Disgust', 'Fear','Joy', 'Sadness', 'Surprise', 'Trust']]
english_df.head()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

在这里插入图片描述
然后构建每种情绪对应的词典表:

#构建每种情绪的词语列表
Positive, Negative, Anger, Anticipation, Disgust, Fear, Joy, Sadness, Surprise, Trust = [[]for i in range(10)]
for idx, row in english_df.iterrows():
    if row['Positive']==1:
        Positive.append(row['English (en)'])
    if row['Negative']==1:
        Negative.append(row[
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/465315
推荐阅读
相关标签
  

闽ICP备14008679号