赞
踩
废话不多说,直接上代码。
<dependency>
<groupId>com.janeluo</groupId>
<artifactId>ikanalyzer</artifactId>
<version>2012_u6</version>
</dependency>
IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">local.dic;</entry>
<!--用户可以在这里配置自己的扩展停止词字典 -->
<entry key="ext_stopwords">stop.dic;</entry>
</properties>
local.dic
中国太平
中国太平洋
stop.dic
的
好
了
package com.example.ik; import org.wltea.analyzer.core.IKSegmenter; import org.wltea.analyzer.core.Lexeme; import java.io.IOException; import java.io.StringReader; import java.util.ArrayList; import java.util.List; public class IKAnalyzerUtil { public static List<String> cut(String msg) throws IOException { StringReader sr=new StringReader(msg); IKSegmenter ik=new IKSegmenter(sr, true); Lexeme lex=null; List<String> list=new ArrayList<>(); while((lex=ik.next())!=null){ list.add(lex.getLexemeText()); } return list; } public static void main(String[] args) throws IOException { String text="中国太平成立九十周年了!"; List<String> list=IKAnalyzerUtil.cut(text); System.out.println(list); } }
执行结果
加载扩展词典:local.dic
加载扩展停止词典:stop.dic
[中国太平, 成立, 九十周年]
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。