当前位置:   article > 正文

完整实用篇:Java分布式中文分词组件-word分词器_java word分词器

java word分词器

这次分享一个实用过的分词器--word分词器,详细信息可以点我看看

没有废话直接上代码,代码通俗易懂,如果实在还是有问题可以留言讨论;

1.引入pom信息
  1. <dependency>
  2. <groupId>org.apdplat</groupId>
  3. <artifactId>word</artifactId>
  4. <version>1.3</version>
  5. </dependency>

2.代码部分

  1. public static void test1() {
  2. //根据词库进行分词(没有词库就不用设置)
  3. WordConfTools.set("dic.path", "D:\\wdd\\file\\bacco_dict.txt");
  4. // 更改词典路径之后,重新加载词典
  5. DictionaryFactory.reload();
  6. //关闭默认配置监控目录功能(如果不关闭的话程序不会自动停止...)
  7. WordConfTools.set("auto.detect", "false");
  8. //分词mode
  9. List<Word> words = WordSegmenter.seg("烟草混合物及其制备方法", SegmentationAlgorithm.MinimalWordCount);
  10. for (Word w : words) {
  11. //分词后的结果
  12. System.out.println(w.getText());
  13. }
  14. }

 3.结果

这样就完成了分词操作 。

如果是springboot项目集成这个功能的话,可能会出现一个报错,如下图,如果没有报错就忽略。。。

出现这个问题是因为日志的jar冲突了,所以需要排除解决,只需要把pom改为下面这样既可

  1. <dependency>
  2. <groupId>org.apdplat</groupId>
  3. <artifactId>word</artifactId>
  4. <version>1.3</version>
  5. <exclusions>
  6. <exclusion>
  7. <groupId>org.slf4j</groupId>
  8. <artifactId>slf4j-api</artifactId>
  9. </exclusion>
  10. <exclusion>
  11. <groupId>ch.qos.logback</groupId>
  12. <artifactId>logback-classic</artifactId>
  13. </exclusion>
  14. </exclusions>
  15. </dependency>

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/610009
推荐阅读
相关标签
  

闽ICP备14008679号