当前位置:   article > 正文

hanlp安装

hanlp安装

HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点;提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。

参考了网上的好多资源写了此博文

如果你的pytorch版本和GPU是对应的兼容版本,重要提示不要直接pip install pyhanlp  或者pip install hanlp ,它会让你的pytorch自动更新升级。pytorch自动更新升级的还有torchtext。安装的时候需要注意。安装torchtext需要

conda install -c pytorch torchtext

(安装的时候观察一下,如果出现torch的更新,立马关掉命令)

下面我们开始安装hanlp,首先需要你电脑上配有Visual C++我的是

然后就是java中的JDK,一般电脑上安装过neo4j或者Navicat premium过的都会有JDK的插件(这3个软件我安装太久了,忘记了,大家自行搜搜吧)

打开cmd 先执行pip install jpype1(这里是jpype1有一个数字1)

测试jpype是否成功

  1. >>> from jpype import *
  2. >>> startJVM(getDefaultJVMPath(), "-ea")
  3. >>> java.lang.System.out.println("月亮就是被人偷走的")
  4. 月亮就是被人偷走的
  5. >>> shutdownJVM()
  6. >>>

这是成功了,我的python是3.9的,在具体哪个网站找到这两个文件的我也忘记了,只记得找了好久(因为自己太菜了)现在分享给有需要的人,在我的主页里面的资源里面hanlp的压缩包。下载保存到你的文件夹,需要注意的就是hanlp文件夹里面的hanlp.properties的文件用记事本打开修改root,root=你保存此文件的路径。我的保存为D盘下的ok文件夹下HANLP的文件夹下了

 修改之后,在pycharm里面运行测试

  1. from jpype import *
  2. startJVM(getDefaultJVMPath(), "-Djava.class.path=D:\ok\HANLP\hanlp\hanlp-1.8.3.jar;D:\ok\HANLP\hanlp",
  3. "-Xms1g",
  4. "-Xmx1g") # 启动JVM,Linux需替换分号;为冒号:
  5. print("=" * 30 + "HanLP分词" + "=" * 30)
  6. HanLP = JClass('com.hankcs.hanlp.HanLP')
  7. # 中文分词
  8. print(HanLP.segment('月球持续偷走地球的能量,渐渐对地球造成打击,地球将无四季之分'))
  9. print("-" * 70)
  10. shutdownJVM()

结果为

  1. ==============================HanLP分词==============================
  2. [月球/n, 持续/vd, 偷走/v, 地球/ns, 的/ude1, 能量/n, ,/w, 渐渐/d, 对/p, 地球/ns, 造成/v, 打击/v, ,/w, 地球/ns, 将/d, 无/v, 四季/n, 之/uzhi, 分/qt]
  3. ----------------------------------------------------------------------

具体详细内容访问https://zhuanlan.zhihu.com/p/62766818?utm_source=wechat_session

这个就是可以完整下来hanlp的步骤,其他方法对于我来说都不行。

如有侵权,立即删除

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/空白诗007/article/detail/812595
推荐阅读
  

闽ICP备14008679号