赞
踩
公众号 系统之神与我同在
本文包括四个部分:
1、任务简介
2、实体关系联合抽取
3、文档级关系抽取
4、总结与展望
实体关系抽取任务介绍
关系定义为两个或多个实体的某种联系
实体关系抽取是自动识别出实体间是否存在某种关系
复杂语境
实体关系联合抽取
·序列标注
·表填充
·序列到序列
联合抽取:序列标注(NovelTagging)
·对每个关系,将其与(Begin,Inside,End,Single)以及头实体和尾实体的序号(1,2)组合
·额外考虑一个Other标签,表示不属于任何一个关系
·如果总共有| |个关系,那么一共有2∗4∗| |+1个标签
实验结果
数据
·使用弱监督的NYT数据集,看做监督数据。
·训练集包括353k个三元组
·测试集包括3880个三元组
·一共24种关系
实验结果
联合抽取:NovelTagging缺陷
联合抽取:序列标注(HTB)
联合抽取:表填充
联合抽取:表填充(多头选择)
联合抽取:序列到序列(CopyRE)
联合抽取:序列到序列(CopyMTL)
联合抽取:序列到序列(Seq2UMTree)
文档级关系抽取
如何有效的学习实体的多粒度表示?
·实体在多个句子提及
·实体指代
如何建模文档内的复杂语义信息?
·逻辑推理、指代推理和常识推理
文档级关系抽取:GCNN
使用图神经网络建模文档 (Word本身作为节点)
·Syntactic dependency edge:句法依赖,也就是使用每一个sentence中的word之间的句法关系建立edge;
·Coreference edge:指代,对于表示同一个含义的phrase,进行连接;
·Adjacent sentence edge:将sentence的根结点鱼上下文sentence的根结点进行连接;
·Adjacent word edge:对于同一个sentence,我们去连接当前word的前后节点;
·self node edge:word与本身进行连接;
在构建好doucment graph的基础上,使 用 GCNN 来计算得到每一个 node representation
多示例学习关系分类
·聚合target entity所有的mention
文档级关系抽取:GCNN实验结果
文档级关系抽取:EOG
Motivation
·现有的方法使用基于图的模型,以实体作为节点,根据两个目标节点来确定实体间的关系。然而,实体关系 可以通过节点间路径形成的唯一的边表示来更好地表达。
·EoG在不同种类节点之间,建立不同类型的边来决定信息流入节点的多少,可以更好的拟合文档之间异构的 交互关系。
EOG实验结果
文档级关系抽取:LSR
Motivation
以往的工作大都通过启发式的方法建立 文档图。
该文提出的模型将图结构视为一个潜在 变量,并以端到端的方式对其进行归纳推理。
LSR实验结果
Double Graph
Double Graph实验结果
总结与展望
联合抽取
序列到序列方法 =》 序列到集合
文档级别抽取
·Mention、实体、句子级别的信息传递=》实体对级别信息
·GNN过平滑、异构图
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。