赞
踩
文 / 学生研究员 Eleni Triantafillou 和高级研究员 Vincent Dumoulin,Google Research
最近,深度学习在一系列颇具挑战性的难题上取得了突出成果,但其成功往往依赖于大量手动标注的训练数据。这一限制激发了研究人员的兴趣,即从较少样本中学习。其中一个很好的示例是小样本图像分类,即从少量代表性图像中学习新的分类。
手动标注的训练数据
https://ai.googleblog.com/2019/05/announcing-open-images-v5-and-iccv-2019.html
由于人类对有限信息的学习能力明显不及深度学习算法,所以从科学角度而言,小样本分类是个很有趣的问题。而从实际的角度来看,这也是非常重要的问题。
大型标注数据集通常无法用于兴趣类任务,因此解决此类问题将带来诸多益处(如,让模型可根据用户需求进行快速定制),从而让越来越多的人能够使用机器学习技术。不可否认的是,研究人员近期开展了许多工作,想要解决小样本分类问题,但由于先前的基准无法可靠评估各种所提出模型的优缺点,拖慢了研究进度。
在《Meta-Dataset:为小样本学习而构建的数据集》(Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples)(已在 ICLR 2020 上发表)一文中,我们提出了一种大型多元化基准,用于在现实且具有挑战性的小样本情境中衡量各种图像分类模型。该基准也提供了一个框架,供学者研究小样本分类中的重要方面。
Meta-Dataset:为小样本学习而构建的数据集
https://openreview.net/forum?id=rkgAGAVKPr
本数据集由 10 个公开的自然图像数据集(包括 ImageNet、CUB-200-2011、Fungi 等)、手写字符以及涂鸦数据集组成。我们已向研究社区公布了代码,以及如何在 TensorFlow 和 PyTorch 中使用 Meta-Dataset 的 Notebook 演示。在本文中,我们将介绍在 Meta-Dataset 初期研究中取得的一些成果与重要研究方向。
代码
https://
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。