赞
踩
只对长词起作用
对如果定义的词比jieba自己分的短,则没有用
下面是三种分词方式的影响
- #encoding=utf-8
- import jieba
- import os
- import sys
- test_text="电话号码查询"
- #精确模式
- seg_list = jieba.cut(test_text,cut_all=False)
- seg_list = " ".join(seg_list)
- print "cut_all=False: "+seg_list
- #全模式
- seg_list2 = jieba.cut(test_text,cut_all=True)
- seg_list2 = " ".join(seg_list2)
- print "cut_all=True: "+seg_list2
- # 搜索引擎模式
- seg_list3 = jieba.cut_for_search(test_text)
- seg_list3 = " ".join(seg_list3)
- print "cut_for_search: "+seg_list3

输出:
- cut_all=False: 电话号码 查询
- cut_all=True: 电话 电话号码 号码 查询
- cut_for_search: 电话 号码 电话号码 查询
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。