赞
踩
哈尔滨工业大学的社会计算与信息检索研究中心研发的“语言技术平台(Language Technology Platform, LTP)”是一个全套的中文自然语言处理系统。
这里主要介绍LTP的使用配置。
LTP采用C++开发,这里简单记录以下使用LTP开发的过程(Windows系统)。
下载源代码,自行编译,具体步骤可以参考LTP的在线文档;另外下载数据文件。
值得注意的问题:使用CMake工具共建VC项目,点击Configure,需要正确选择是64位还是32位版本的Visual Studio。
Visual Studio编译是最好选择Release。
bin\Release\ltp_test.exe
,提示出错,缺少ner.dll,需要复制lib\Release\ner.dll
到bin\Release
目录中。测试2:新建VC++ Win32 Console Application,测试代码使用LTP源代码中的example目录中的,构建项目需要设置为编译LTP的方式,保证库的平台一致,如Release x64。参考文档中的步骤,添加头文件和库。
获取静态库文件名,命令行
dir /b your-lpt-dir\lib\Release\*.lib > libfielist.txt
example中文件的问题:The file contains a character that cannot be represented int the current page code(936)
,新建cpp文件,复制代码(主要是文件编码不是GBK)。或者【File】->【Advanced Save Options】,选择Encoding为“Unicode - Codepage 1200”
参照文档:pip install pyltp
(使用管理员权限)
问题:缺少Visual C++相关库,下载VCForPython27.msi.
使用ltp4j。
0. 编译LTP源文件;
1. 下载ltp4j源文件,ant编译获得jar包(在output目录中);
2. CMake构建VC++项目,需要修改CMakeLists.txt中的LTP_HOME
为LTP源代码目录,另外建议修改link_directoris (${LTP_HOME}/lib/Debug
为link_directoris (${LTP_HOME}/lib/Debug
,因为LTP源代码使用Release编译。
3. 测试:建立java项目,添加jar文件到Build Path,ltp4j\libs\Release
中6个_jni.dll
文件和ltp\lib\Release
中对应的6个dll
复制到项目根目录(即Eclipse中Java Project中src
目录的上一级,与.classpath
和.project
文件同一级)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。