赞
踩
《原始论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction》
在百度“2019语言与智能技术竞赛”(下称LIC2019)中,作者提出了一个新的关系抽取模型(参考《基于DGCNN和概率图的轻量级信息抽取模型》),后被进一步发表和命名为“CasRel”,算是当时关系抽取的SOTA。
GitHub:CasRel
GitHub:CasRel-pytorch-reimplement
GitHub:kg-2019-final
GitHub:kg-baseline-pytorch
根据不同的重叠情况将句子划分 为三种类型。
以往的方法大多将关系建模为实体对上的一个离散的标签
缺点
1 .很少的研究工作解决三元组重叠的问题。
2 . pipline的流程可能造成实体的识别错误,也就造成关系构建的错误
1 .很少研究关注三元组重叠问题
2 .为三元组重叠提出一种新的关系抽取框架
3 .实验结果表明该方法是有效的,在NYT和WebNLG数据集上取得较好的效果
提出一个全新的框架:CasRel
优点:
缺点:
BERT Encoder
Cascade Decoder
对于给定的句子x,提取三元组(s,r,o)
根据贝叶斯公式进行分解
头尾指针标识subject的位置,使用 1进行标注,其他位置使用0
subject标注损失函数使用最大似然函数
头尾指针标识object的位置,使用1 进行标注,其他位置使用0
加入上层的subject编码信息,多个subject时取平均值
Object损失同样适用最大似然函数
最终损失函数使用log函数,实际实现过程也就是2*(subject+object)损失函数之和
1 .训练时随机选择一个subject进行训练
2 .训练时直接使用输入的subject而不是预测的subject
3 .subject object的获取就近原贝
不同模型对于不同类型三元组的表现,CasRel表现良好
对于同一个句子含有多个三元组的情况,数据显示CasRel表 现较好
新的标注策略
新的模型框架
三元组重叠
引入指针标注
级联式联合抽取
将离散的label识别问题转化为subject,(relation,object)。
Instead of treating relations as discrete labels as in previous works, our new framework models relations as functions that map subjects to objects in a sentence, which naturally handles the overlapping problem.
参考资料:
一文详解关系抽取模型 CasRel
ACL2020-关系抽取 CASREL
Casrel,TPlinker,PRGC三者模型比较
基于DGCNN和概率图的轻量级信息抽取模型
GPLinker:基于GlobalPointer的实体关系联合抽取
关系抽取模型
NLP之关系抽取(信息抽取、三元组抽取)(附pytorch代码)
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。