赞
踩
SnowNLP 是一个专门用于处理中文文本的 Python库。功能包括:
snownlp==0.12.3
测试环境:Python3.10.9
中文分词(Character-Based Generative Model)
from snownlp import SnowNLP
text = "有勇气的牛排是编程领域的博主"
s = SnowNLP(text)
print(s.words)
尚未测出该功能
from snownlp import SnowNLP
text = "有勇气的牛排写的文章通俗易懂,爱了爱了"
s = SnowNLP(text)
print(s.keywords(3))
from snownlp import SnowNLP
text = "有勇气的牛排写的文章通俗易懂,爱了爱了"
s = SnowNLP(text)
print(s.summary(3))
原创:有勇气的牛排
https://www.couragesteak.com/article/456
from snownlp import SnowNLP
text = "有勇气的牛排"
s = SnowNLP(text)
print(s.pinyin)
文本分类使用的是 SnowNLP 的情感分析模型
from snownlp import SnowNLP
text = "有勇气的牛排写的文章通俗易懂,爱了爱了"
s = SnowNLP(text)
print(s.sentiments)
pos.txt (正面情绪的文本)
这家餐厅的菜很好吃
我非常喜欢这本书
这个产品质量非常好
neg.txt (负面情绪的句子)
这家餐厅的服务很差
我不喜欢这部电影
这个产品质量很差
main.py
from snownlp import sentiment
# 训练模型
sentiment.train('neg.txt', 'pos.txt')
# 保存模型
sentiment.save('sentiment.marshal')
from snownlp import sentiment
from snownlp import SnowNLP
# 加载训练好的模型
sentiment.load('sentiment.marshal')
# 使用训练好的模型
text = "这个产品很糟糕,我很不满意。"
s = SnowNLP(text)
print(s.sentiments) # 输出情感分析结果
如果不加载前面我们训练的模型,分析结果为 0.669,十分不精确。
from snownlp import SnowNLP
sentence_fan = "知識改變世界"
jian_ti = SnowNLP(sentence_fan)
print(jian_ti.han)
from snownlp import SnowNLP
text = "有勇气的牛排是编程领域的博主"
s = SnowNLP(text)
print(len(s.words), s.words)
print(len(s.sim("的牛排")), s.sim("的牛排"))
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。