当前位置:   article > 正文

小白NLP入门,pyhanlp安装以及初步调试_pyhanlp miniconda 安装pyhanlp

pyhanlp miniconda 安装pyhanlp

pyhanlp的安装

在命令行中输入指令:

pip install pyhanlp
  • 1

成功后可直接开始调试。

如果windows报错,多半需要安装Visual C++或者更轻量的Miniconda,报错时会同时提供下载地址,下载并安装。
输入指令:

conda install -c conda -forge jpype1
pip install pyhanlp
  • 1
  • 2

问题得解。

hanlp安装

命令行输入指令:

hanlp
  • 1

坐等下载安装即可,下面是我安装完成后的信息:

usage: hanlp [-h] [-v] {segment,parse,serve,update} ...

HanLP: Han Language Processing v1.7.8

positional arguments:
  {segment,parse,serve,update}
                        which task to perform?
    segment             word segmentation
    parse               dependency parsing
    serve               start http server
    update              update jar and data of HanLP

optional arguments:
  -h, --help            show this help message and exit
  -v, --version         show installed versions of HanLP
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

命令行测试

输入指令:

hanlp segment
  • 1

这是分词功能,接下来你只需要输入一段你想测试的语句即可

'接下来我给大家打一个五连鞭'
  • 1

得到结果:

'/nx 接下来/vl 我/rr 给/p 大家/rr 打/v 一个/mq 五连/nz 鞭/ng '/nx
  • 1

在pycharm中测试

输入代码:

from pyhanlp import *
  • 1

初次运行会显示错误,在pyhanlp下按下A/T+Enter下载***data.zip***并等待其解压完成。
接下来是测试代码:

from pyhanlp import *

# 新闻摘自中国新闻网
document = "11月3日电 据中央气象台网站消息,受冷空气和“天鹅”的共同影响"\
		   "3日08时至4日08时,东海南部、台湾海峡、台湾以东洋面、巴士海峡、北部湾、南海大部、中沙群岛、"\
           "西沙群岛以及浙江沿海、福建沿海、广东沿海、海南岛东部沿海将有6-7级大风。"\
           "未来三天,受高原槽影响,青藏高原东部有雨雪天气,其中青海东南部和川西高原北部部分地区有中到大雪。"\
           "云南、西藏东南部等地有小到中雨,局地大雨。"

# 提取document的两个关键词
print(HanLP.extractKeyword(document, 2))

# 提取ducument中的3个关键句作为摘要
print(HanLP.extractSummary(document, 3))

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

得到结果:

[影响, 高原]
[受高原槽影响, 其中青海东南部和川西高原北部部分地区有中到大雪, 青藏高原东部有雨雪天气]
  • 1
  • 2

大家可以看到,得到的结果并不是很精准。对不同的语句进行分析会得到不同的结果,其精准度也有不同。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小蓝xlanll/article/detail/357539
推荐阅读
  

闽ICP备14008679号