当前位置:   article > 正文

给定一篇文本(新闻),确定其归属地(地名)的python工具_jionlp地址标准化

jionlp地址标准化

简介

⭐戳这里在线使用 => 地址抽取

有时候需要确定一篇新闻文本的地名,比如

上海市实施了垃圾分类...
  • 1

其地名,即归属地是上海,本工具就是实现这个功能的。

给定一篇文章,可包含标题和正文(或仅标题,仅正文),确定其归属地(地名)。

  • 结果标准:
    • 区分国内国外,
    • 国外到国家名一级
    • 国内到省市一级

安装

  • 使用 python3
$ git clone https://github.com/dongrixinyu/location_detect.git
$ cd location_detect
$ pip install .
  • 1
  • 2
  • 3

使用方法

样例1

import loc_reg
title = '湖南2018年度企业环境信用评价公示 39家企业拟被评“不良”'
passage = '今天,记者从湖南省生态环境厅获悉,我省2018年度企业环境信用评价拟定结果正在长沙市进行公示,拟评定环境诚信企业31家、环境合格企业1247家、环境风险企业121家、环境不良企业39家。'
print(loc_reg.predict(title, passage))
  • 1
  • 2
  • 3
  • 4

结果为:

{'国内': [{'省': '湖南', '市': '长沙'}]}
  • 1

样例2

passage = '近日,布鲁塞尔爆发了大规模罢工游行,城市服务、商店、餐饮店均受到影响,原因和欧盟税收等政策有关。'
print(loc_reg.predict(passage))
  • 1
  • 2

结果为:

{'国外': ['比利时']}
  • 1

说明

  • 从舆情新闻数据中随机抽取 100 篇自测,正确率 93%。其他类型文本未测试,效果待定。

如果觉得好用,请 follow 我一下 https://github.com/dongrixinyu

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/171912
推荐阅读
相关标签
  

闽ICP备14008679号