赞
踩
以下为2021版原文~~~~
在NLP的发展过程中,人们也开发了很多非常实用的工具,这些工具可以帮助开发人员快速地实现自然语言相关的基础处理,从而可以更好地将精力用在高层次的语义分析任务中下面详细介绍该领域中比较优秀的工具。
spacy是一个具有工业级强度的PythonNLP工具包,它可以用来对文本进行断词、短句、词干化、标注词性、命名实体识别、名词短语提取、基于词向量计算词间相似度等处理。
spaCy库里大量使用了Cython来提高相关模块的性能,因此在业界应用中很有实际价值。
- pip install spacy
-
- # 查看安装的spacy版本
-
- python -m spacy info
-
- # 显示
- Location /usr/local/lib/python3.5/dist-packages/spacy
- Platform Linux-4.15.0-45-generic-x86_64-with-Ubuntu-16.04-xenial
- Installed models en_core_web_md, en
- Python version 3.5.2
- spaCy version 1.8.0
注意下载与自己spacy对应版本的en_core_web_sm:
https://github.com/explosion/spacy-models/tags
https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.2.0/en_core_web_sm-3.2.0.tar.gz
- pip install en_core_web_sm-3.2.0.tar.gz
- # en_core_web_xx,xx代表模型大小{sm:小型,md:中型…}
python -m spacy download en
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。