赞
踩
关系级别假阴性:抽取到的关系,在预定义的关系集中不存在
实体级别假阴性:S4、S5表示实体级别假阴性
阶级分布不平衡:负标签的数量远远大于正面标签的数量
由百度百科标记的NYT数据集中的三元组为88253,由Wikidata标记的为58135。可以看到,由于知识库的不完备性,只用一个KB来标记,就会存在大量的FN,特别是当多个关系出现在一句中时,即使是人工标注。
采用先抽取关系,再抽取主体和客体的范式
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。