赞
踩
SnowNLP是国人开发的python类库,能够方便的处理中文文本内容,是受到了TextBlob的启发而写的,因为如今大部分的天然语言处理库基本都是针对英文的,因而写了一个方便处理中文的类库,而且和TextBlob不一样的是,这里没有用NLTK,全部的算法都是本身实现的,而且自带了一些训练好的字典。注意本程序都是处理的unicode编码,因此使用时请自行decode成unicode。MIT许可下发行。
其 github 主页
我本身修改了上文连接中的python代码并加入些许注释,以方便你的理解:html
from snownlp importSnowNLP#SnowNLP库:#words:分词#tags:关键词#sentiments:情感度#pinyin:拼音#keywords(limit):关键词#summary:关键句子#sentences:语序#tf:tf值#idf:idf值
s = SnowNLP(u'这个东西真心很赞')#s.words # [u'这个', u'东西', u'真心', u'很', u'赞']
print(s.words)
s.tags#[(u'这个', u'r'), (u'东西', u'n'), (u'真心', u'd')#, (u'很', u'd'), (u'赞', u'Vg')]
print(s.sentiments)#s.sentiments # 0.9769663402895832 positive的几率#s.piny
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。