中文自然语言处理--基于玻森情感词典自定义计算中文文本情感值

作者：我家小花儿 | 2024-03-31 23:50:42

踩

玻森情感词典

使用玻森情感词典，来自定义计算一句话、或者一段文字的情感值。

BosonNLP_sentiment_score.txt下载链接：
https://download.csdn.net/download/fgg1234567890/16167065

import pandas as pd
import jieba

# 使用一个行业标准的情感词典——玻森情感词典，来自定义计算一句话、或者一段文字的情感值。
# 整个过程如下：
#   加载玻森情感词典；
#   jieba 分词；
#   获取句子得分。

# 加载情感词典
df = pd.read_table("./数据集/BosonNLP_sentiment_score.txt", sep= " ", names=['key','score'])
print(df.head())

# 将词 key 和对应得分 score 转成2个 list 列表，目的是找到词 key 的时候，能对应获取到 score 值
key = df['key'].values.tolist()
score = df['score'].values.tolist()

# 定义分词和统计得分函数
def getscore(line):
    segs = jieba.lcut(line)  #分词
    score_list  = [score[key.index(x)] for x in segs if(x in key)]
    return  sum(score_list)  #计算得分


line = "今天天气很好，我很开心"
print(round(getscore(line), 2))

line = "今天下雨，心情也受到影响。"
print(round(getscore(line), 2))

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

原文：
https://soyoger.blog.csdn.net/article/details/108729401

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/我家小花儿/article/detail/346431