当前位置:   article > 正文

命名实体识别(NER)综述【人名、地名、组织机构名、时间、日期、货币、百分比、专有名词】【标注体系:BIO(标注时用)、BIOES(训练时将BIO转为BIOES)】_中文命名实体识别工具,识别时间、地点、机构、人名、货币、百分比和日期

中文命名实体识别工具,识别时间、地点、机构、人名、货币、百分比和日期

确切来说命名实体识别是分词的子任务。

由于命名实体数量不断动态增加,通常不可能在词典中穷尽列出,且其构成方法具有各自的一些规律性,因而,通常把对这些词的识别从分词任务中独立处理,称为命名实体识别。

一、命名实体识别(Named Entity Recognition)概述

1、命名实体识别(Named Entity Recognition)

命名实体识别(Named Entity Recognition)是自然语言处理中的一项基础任务,应用范围非常广泛。

  • 命名实体一般指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等。
  • NER系统就是从非结构化的输入文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体,比如产品名称、型号、价格等。
  • 在学术上NER所涉及的命名实体一般包括3大类(实体类,时间类,数字类)7小类(人名、地名、组织机构名、时间、日期、货币、百分比)
  • 同时NER也是关系抽取、事件抽取、知识图谱、机器翻译、问答系统等诸多NLP任务的基础。

2、NER在中文中的挑战

汉语作为象形文字,相比于英文等拼音文字来说,针对中文的NER任务来说往往要更有挑战性,下面列举几点:

  • (1) 中文文本里不像英文
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小桥流水78/article/detail/930570
推荐阅读
相关标签
  

闽ICP备14008679号