当前位置:   article > 正文

java中文分词_java 汉字分词

java 汉字分词

最近由于工作原因,接触到了JAVA的中文分词, 现在来讲讲具体操作.

 

java的分词器都是基于 lucene 核心的.

我选择的是

ikanalyzer2.0.2的最新版本

 

具体调用过程如下:

 

需要 的JAR如下:

lucene-analyzers-2.4.1.jar

lucene-core-2.4.1.jar

当然少不了

IKAnalyzer2.0.2OBF.jar

 

 

在UNIX下使用的话,注意对中文的编码问题.

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/609973
推荐阅读
相关标签
  

闽ICP备14008679号