当前位置:   article > 正文

基于spacy的实体抽取工具_zh_core_web_sm

zh_core_web_sm

环境要求

1.安装spacy

pip install spacy -i https://pypi.tuna.tsinghua.edu.cn/simple

2.安装spacy模型

中文模型比如:zh_core_web_sm

如果采用命令行python -m spacy download zh_core_web_sm进行安装,会因为连接问题下载失败,建议利用zh_core_web_sm-3.3.0.tar.gz解压后的文件夹进行本地安装

在文件目录下打开虚拟环境,运行命令python setup.py install进行本地安装

spacy实体抽取demo

  1. import spacy
  2. model = spacy.load('zh_core_web_sm') # 加载模型
  3. entities = []
  4. doc = model('【郑渝高铁首发,南阳日报社记者带你沿线游】#郑渝高铁 现代化“副中心”建设新支撑# #郑渝高铁全线贯通# #郑渝高铁开通首发# 6月20日上午的在郑渝高铁首发车上,省人大代表马金霞接受南阳日报社记者采访。')
  5. for entity in doc.ents:
  6. entities.append(str(entity) + ':' + str(entity.label_))
  7. print(entities)
  8. # 实体抽取结果:['南阳日报社:ORG', '高铁:ORG', '6月20日上午:TIME', '郑渝高铁:FAC', '省人大:ORG', '马金霞:PERSON', '南阳日报社:ORG']

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/350988
推荐阅读
相关标签
  

闽ICP备14008679号