赞
踩
感谢关注天善智能,走好数据之路↑↑↑
欢迎关注天善智能,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习,问答、求职一站式搞定!
前言
最近学习NLP,还在初级阶段,上次jieba分词那篇写完,还在学习哈工大的pyltp。
发现一个比较有趣的中文类库:snownlp
SnowNLP是一个Python写的类库,可以方便的处理中文文本内容。
使用环境
Python3
Features
中文分词(Character-Based Generative Model)
词性标准(TnT 3-gram 隐马)
情感分析(现在训练数据主要是买卖东西时的评价,所以对其他的一些可能效果不是很好,待解决)
文本分类(Naive Bayes)
转换成拼音
繁体转简体
提取文本关键词(TextRank算法)
提取文本摘要(TextRank算法)
tf,idf
Tokenization(分割成句子)
文本相似(BM25)
支持python3
安装snownlp
在cmd下输入:pip3 install snownlp
(ps:为什么用pip3而不用pip,在之前的文章中已经说过原因)
如图,我之前已经安装过
snownlp分词
from snownlp import SnowNLP
s = SnowNLP(u'一次满意的购物')
s.words
['一', '次', '满意&#
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。