赞
踩
本本主要详细解读关系抽取SOTA论文Two are Better than One:Joint Entity and Relation Extraction with Table-Sequence Encoders, 顺带简要介绍关系抽取的背景方便完全不了解童鞋~
我们说的信息抽取一般是指从文本数据中抽取特定数据结构信息的一种手段。对于不同结构形式的数据如结构化文本,半结构化文本,自由文本,有各自对应的方案,其中从自由文本中抽取难度最大。总之,我们的目的是希望在海量文本中,快速抽出我们关注的事实。
三元组: 大部分情况下,我们喜欢用三元组的数据结构来描述抽取到的信息
Schema:
当我们拿到一个信息抽取的任务,需要明确我们抽取的是什么,”今天天气真冷“,我们要抽的天气的状态天气-状态-冷,而非 今天-气候-冷(虽然也可以这样抽),因此一般会首先定义好我们要抽取的数据结构模式shcema, 会确定谓词以及主语并与的类型
- Subject_type: 主语类型
- Predicate: 谓词
- Object_type: 宾语类型
- 对应
- Subject_type: 人物
- Predicate: 出生地
- Object_type: 地点
目前主流关系抽取一般两种解决方法
RE with Table Sequence
终于来到本篇的主题啦,为了解决一般filled table的问题, 作者提出table-sequence encoder的方法,分别对table和sequence做表征,本文的最大贡献在于
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。