当前位置:   article > 正文

snownlp库各功能及用法

snownlp库

目录

1 中文分词

2 词性标注

3 情感分数

4 转换拼音

5 前n个关键词

6 前n个关键(中心)句

7 TF值

8 IDF值

9 繁简体转换


首先导入库

  1. from snownlp import SnowNLP
  2. s = SnowNLP('字太小,而且纸张也不好,有点黑,不过内容应该还不错。和预想的还是有点距离的...')

1 中文分词

print(s.words)

2 词性标注

print(list(s.tags))

3 情感分数

print(s.sentiments)

4 转换拼音

print(s.pinyin)

5 前n个关键词

print(s.keywords(4))

6 前n个关键(中心)句

print(s.summary(1))

7 TF值

print(s.tf)

8 IDF

print(s.idf)

9 繁简体转换

print(s.han)

10 分割句子

print(s.sentences)

只能利用非英文语句分割符来将语句分割开,中英文分隔符混用时效果不好=^=

可以用re模块一次指定多个中英文分隔符

  1. import re
  2. t = '字太小,而且纸张也不好,有点黑,不过内容应该还不错。和预想的还是有点距离的...'
  3. t_list = re.split('[,.;!,。;!]', t)
  4. for i in range(t_list.count('')): #去除空字符串元素
  5. t_list.remove('')
  6. print(t_list)

 


 

Flag:我要成为一个日更选手:)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/371674?site
推荐阅读
相关标签
  

闽ICP备14008679号