赞
踩
我们提出了一个概念上简单、灵活且通用的少镜头学习框架,其中分类器必须学习识别每个只给出少量示例的新类。我们的方法称为关系网络(RN),从头到尾进行训练。在元学习过程中,它学习学习一个深度距离度量来比较插曲中的少量图像,每个图像都被设计用来模拟少数镜头设置。经过训练后,RN能够通过计算查询图像与每个新类的少数示例之间的关系分数来对新类的图像进行分类,而无需进一步更新网络。除了在少镜头学习上提供更好的性能外,我们的框架很容易扩展到零镜头学习。在五个基准上进行的大量实验表明,我们的简单方法为这两项任务提供了统一而有效的方法。
具体来说,我们提出了一个双分支关系网络(RN),通过学习比较查询图像和少数镜头标记的样本图像来执行少数镜头识别。首先,嵌入模块生成查询和训练图像的表示。然后,这些嵌入由一个关系模块进行比较,该模块确定它们是否来自匹配的类别。定义一个受[39,36]启发的基于情节的策略,嵌入和关系模块是端到端的元学习,以支持少量学习。这可以看作是扩展了[39,36]的策略,包括一个可学习的非线性比较器,而不是一个固定的线性比较器。我们的方法优于先前的方法,同时更简单(没有rnn[39,32,29])和更快(没有微调[29,10])。我们提出的策略也直接推广到零次学习。在这种情况下,样本分支嵌入一个单镜头类别描述,而不是单个示例训练图像,关系模块学习比较查询图像和类别描述嵌入。
总的来说,我们的贡献是提供一个干净的框架,优雅地包含少量和零次学习。我们对四个基准的评估表明,它提供了令人信服的性能,同时比替代方案更简单、更快。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。