当前位置:   article > 正文

jieba 分词自定义词典问题_jieba增加或删除词时,只对长词起作用,对于比结巴自己分的还短的词不起作用。 a、

jieba增加或删除词时,只对长词起作用,对于比结巴自己分的还短的词不起作用。 a、

只对长词起作用

对如果定义的词比jieba自己分的短,则没有用

下面是三种分词方式的影响

原始:

  1. #encoding=utf-8
  2. import jieba
  3. import os
  4. import sys
  5. test_text="电话号码查询"
  6. #精确模式
  7. seg_list = jieba.cut(test_text,cut_all=False)
  8. seg_list = " ".join(seg_list)
  9. print "cut_all=False: "+seg_list
  10. #全模式
  11. seg_list2 = jieba.cut(test_text,cut_all=True)
  12. seg_list2 = " ".join(seg_list2)
  13. print "cut_all=True: "+seg_list2
  14. # 搜索引擎模式
  15. seg_list3 = jieba.cut_for_search(test_text)
  16. seg_list3 = " ".join(seg_list3)
  17. print "cut_for_search: "+seg_list3

 


输出:

 

 

 

 

 

 

  1. cut_all=False: 电话号码 查询
  2. cut_all=True: 电话 电话号码 号码 查询
  3. cut_for_search: 电话 号码 电话号码 查询

 

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/不正经/article/detail/243359
推荐阅读
相关标签
  

闽ICP备14008679号