赞
踩
在命令行中输入指令:
pip install pyhanlp
成功后可直接开始调试。
如果windows报错,多半需要安装Visual C++或者更轻量的Miniconda,报错时会同时提供下载地址,下载并安装。
输入指令:
conda install -c conda -forge jpype1
pip install pyhanlp
问题得解。
命令行输入指令:
hanlp
坐等下载安装即可,下面是我安装完成后的信息:
usage: hanlp [-h] [-v] {segment,parse,serve,update} ...
HanLP: Han Language Processing v1.7.8
positional arguments:
{segment,parse,serve,update}
which task to perform?
segment word segmentation
parse dependency parsing
serve start http server
update update jar and data of HanLP
optional arguments:
-h, --help show this help message and exit
-v, --version show installed versions of HanLP
输入指令:
hanlp segment
这是分词功能,接下来你只需要输入一段你想测试的语句即可
'接下来我给大家打一个五连鞭'
得到结果:
'/nx 接下来/vl 我/rr 给/p 大家/rr 打/v 一个/mq 五连/nz 鞭/ng '/nx
输入代码:
from pyhanlp import *
初次运行会显示错误,在pyhanlp下按下A/T+Enter下载***data.zip***并等待其解压完成。
接下来是测试代码:
from pyhanlp import *
# 新闻摘自中国新闻网
document = "11月3日电 据中央气象台网站消息,受冷空气和“天鹅”的共同影响"\
"3日08时至4日08时,东海南部、台湾海峡、台湾以东洋面、巴士海峡、北部湾、南海大部、中沙群岛、"\
"西沙群岛以及浙江沿海、福建沿海、广东沿海、海南岛东部沿海将有6-7级大风。"\
"未来三天,受高原槽影响,青藏高原东部有雨雪天气,其中青海东南部和川西高原北部部分地区有中到大雪。"\
"云南、西藏东南部等地有小到中雨,局地大雨。"
# 提取document的两个关键词
print(HanLP.extractKeyword(document, 2))
# 提取ducument中的3个关键句作为摘要
print(HanLP.extractSummary(document, 3))
得到结果:
[影响, 高原]
[受高原槽影响, 其中青海东南部和川西高原北部部分地区有中到大雪, 青藏高原东部有雨雪天气]
大家可以看到,得到的结果并不是很精准。对不同的语句进行分析会得到不同的结果,其精准度也有不同。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。