当前位置:   article > 正文

【NLP】一种基于联合方式的三元组抽取模型——CasRel_casrel 训练中文模型

casrel 训练中文模型

前言

关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。这些任务也都可看成三元组抽取,即(subject,predicate,object)。常见的抽取范式包含:

  1. 基于pipeline的分布抽取方式,在已知两个实体subject和object,去预测predicate。
  2. 联合抽取方式,一个模型同时将subject,predicate和object抽取出来。

现实的场景中还存在重叠关系情况,那么针对这种情况该如何解决呢?,ACL2020有一篇论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction介绍了如何一种级联的并解决嵌套的实体的三元组(文中介绍的是关系抽取)抽取模型。下面我们来看看这篇论文介绍的内容。

背景

早期基于pipeline的方法首先识别出语句中的所有实体,然后在对所有的实体对分类。这种方式的一个缺点是:实体识别过程中的误差会被引入到关系抽取的环节中,如下图中的Normal情况。

现有的联合抽取模型中不能够有效地解决:一个句子包含多个相互重叠的关系三元组。如下图中的EPO和SEO。

在这里插入图片描述
EPO(Entity Pair Overlap&#

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/581820
推荐阅读
相关标签
  

闽ICP备14008679号