赞
踩
1、支持三种分词模式
精确模式,试图将句子最精确的切开;
全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;
搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
2、支持繁体分词
3、支持自定义词典
4、MIT授权协议
代码对Python 2/3 均兼容
相关函数原型:
- def cut(self, sentence, cut_all=False, HMM=True):
- '''
- The main function that segments an entire sentence that contains
- Chinese characters into seperated wo
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。