当前位置:   article > 正文

基于bert预训练模型和半指针半标注结构的三元组抽取_半指针-半标注

半指针-半标注
任务介绍:

该任务来源于2019年百度举办的一个竞赛"2019语言与智能技术竞赛",其实它是一个信息抽取的任务,更精确地说是“三元组”抽取任务,示例数据如下:

{
   
        "text": "杜秉离 男,1948年8月生,河南商水县巴村镇娄庄人",
        "spo_list": [
            [
                "杜秉离",
                "出生日期",
                "1948年8月"
            ],
            [
                "杜秉离",
                "出生地",
                "河南商水县巴村镇娄庄"
            ]
        ]
    }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16

就是输入一句话,输出这句话所包含的所有三元组。所谓三元组即(s, p, o)形式,s指的是subject,即主实体, 是输入句子的一个片段,o指的是object,即客实体, 也是输入句子的一个片段, p指的是predicate, 表示主实体与客实体之间的关系。在该数据集中,p是给定的,一共50种, 比如实例中的"出生日期","出生地"等等。

样本特点

通过肉眼观察,数据样本有以下特点:
(1)单个subject对应多个predicate-object(当然,单个subject对应单个predicate-object也包含在其中),比如:


                
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/768261
推荐阅读
相关标签
  

闽ICP备14008679号