当前位置:   article > 正文

开源开放 | 一个用于知识驱动的零样本学习研究的开源数据集KZSL(CCKS2021)

语义知识驱动

OpenKG地址:http://openkg.cn/dataset/k-zsl

GitHub地址:https://github.com/China-UK-ZSL/Resources_for_KZSL

开放许可协议:CC BY-SA 4.0 (署名相似共享)

贡献者:浙江大学(耿玉霞、陈卓、陈华钧),牛津大学(陈矫彦),爱丁堡大学(Jeff Z. Pan),华为(苑宗港)


摘要

本开放资源由浙江大学知识引擎实验室以及牛津大学的陈矫彦研究员和爱丁堡大学的Jeff Z. Pan教授联合贡献。在此开放资源中,我们为零样本学习相关技术贡献了类别语义知识图谱,图谱囊括了类别的属性信息和文本信息、结构化知识信息,以及语义更丰富的逻辑约束信息等,包含了比以往工作更丰富的类别语义知识,为推动知识驱动的零样本学习研究提供数据支撑。

1. 前言:知识驱动的零样本学习

近年来,深度学习技术依托强大的计算资源、复杂的神经网络和大规模的标注数据集在视觉、语言、医学、金融等广泛的研究领域取得了显著的成就。然而,在现实应用场景中,尤其是在开放世界的背景假设下,随时会有一些新的概念/对象出现,持续地为这些新概念/对象收集样本并进行标注是极为不现实的。因此,研究人员提出了零样本学习(Zero-shot Learning, ZSL)的概念,用于处理没有标注样本的情况下概念/对象的预测问题,以解决现有的深度学习模型尤其是有监督学习模型对大量标注数据(即训练样本)的依赖。

借助一个直观的例子,我们首先对ZSL的工作原理做一个简单的介绍:某动物园内,小明在爸爸的带领下先后认识了马、老虎和熊猫三种动物,随后爸爸让小明在动物园里找一种之前从未见过的动物——斑马,并告诉了小明关于斑马的信息:“斑马的体型很像马,它身上还有像老虎一样的条纹,而且它像熊猫一样是黑色色的”。最后,小明根据爸爸的提示,在动物园里找到了斑马。

上述例子描述了一个典型的人类推理的过程——利用常识或者某个领域的专业知识(马、老虎、熊猫和斑马的描述),在脑海里推理出新对象的具体形态,从而对新对象进行辨认。ZSL所做的正是模仿人的这种推理能力,依赖对象间的语义联系,将模型在有标注样本的

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/黑客灵魂/article/detail/1001230
推荐阅读
相关标签
  

闽ICP备14008679号