IT小白

这个屌丝很懒，什么也没留下！

热门标签

【计算机视觉 | 图像分类】图像分类常用数据集及其介绍（四）_图像数据集

作者：IT小白 | 2024-08-08 12:30:22

踩

图像数据集

文章目录

一、JFT-300M

JFT-300M 是用于训练图像分类模型的内部 Google 数据集。图像使用一种算法进行标记，该算法使用原始网络信号、网页之间的连接和用户反馈的复杂混合。这会导致 3 亿张图像产生超过 10 亿个标签（单个图像可以有多个标签）。在十亿个图像标签中，大约有 3.75 亿个是通过算法选择的，该算法旨在最大限度地提高所选图像的标签精度。

在这里插入图片描述

二、VGG-Sound

包含 310 个音频类别的超过 21 万个视频。

在这里插入图片描述

三、ObjectNet

ObjectNet 是使用众包直接收集的图像测试集。 ObjectNet 的独特之处在于，对象是在杂乱的自然场景中以不寻常的姿势捕获的，这会严重降低识别性能。测试集中有 50,000 张图像，控制旋转、背景和视点。 ImageNet 有 313 个对象类，其中 113 个重叠。

在这里插入图片描述

四、Meta-Dataset

元数据集基准是一个大型的少样本学习基准，由不同数据分布的多个数据集组成。它不限制小镜头任务有固定的方式和镜头，从而表现出更真实的场景。它由来自不同领域的 10 个数据集组成：

ILSVRC-2012（ImageNet 数据集，由 1000 个类别的自然图像组成）
Omniglot（手写字符，1623 个类别）
飞机（飞机图像数据集，100 个类别）
CUB-200-2011（鸟类数据集，200 个类别）
可描述纹理（43类不同种类的纹理图像）
Quick Draw（345种不同类别的黑白草图）
Fungi（包含 1500 个类别的大型蘑菇数据集）
VGG Flower（102类花卉图像数据集），
交通标志（德国交通标志图像，共 43 类）
MSCOCO（从 Flickr 收集的图像，80 个类别）。
除交通标志和 MSCOCO 之外的所有数据集都有训练、验证和测试部分（大致比例为 70%、15%、15%）。数据集 Traffic Signs 和 MSCOCO 仅供测试之用。

在这里插入图片描述

五、smallNORB

SmallNORB 数据集是用于根据形状识别 3D 对象的数据集。它包含 50 个玩具的图像，属于 5 个通用类别：四足动物、人物、飞机、卡车和汽车。这些物体由两台摄像机在 6 种照明条件、9 个仰角（每 5 度 30 到 70 度）和 18 个方位角（每 20 度 0 到 340 度）下成像。训练集由每个类别的 5 个实例（实例 4、6、7、8 和 9）组成，测试集由其余 5 个实例（实例 0、1、2、3 和 5）组成。

在这里插入图片描述

六、Tiny Images

【该数据集已被撤回，不应使用】

图像数据集TinyImages包含从互联网收集的8000万张大小为32×32的图像，爬取WordNet中的单词。

作者决定撤回它，因为它包含攻击性内容，并要求社区停止使用它。

七、ImageNet-32

Imagenet32 是一个由小图像组成的巨大数据集，称为 Imagenet 的下采样版本。 Imagenet32由1,281,167个训练数据和50,000个带有1,000个标签的测试数据组成。

在这里插入图片描述

八、Stylized ImageNet

Stylized-ImageNet 数据集是通过删除 ImageNet 中的局部纹理线索创建的，同时通过 AdaIN 样式传输保留自然图像的全局形状信息。这促使 CNN 更多地了解形状，而不是了解局部纹理。

在这里插入图片描述

九、RVL-CDIP

RVL-CDIP数据集由属于信件、表格、电子邮件、简历、备忘录等16类的扫描文档图像组成。该数据集包含320,000张训练图像、40,000张验证图像和40,000张测试图像。这些图像的特点是质量低、噪声大、分辨率低（通常为 100 dpi）。

在这里插入图片描述

十、fMoW (Functional Map of the World)

世界功能地图 (fMoW) 是一个数据集，旨在激发机器学习模型的开发，该模型能够根据卫星图像的时间序列和丰富的元数据特征来预测建筑物和土地使用的功能用途。

在这里插入图片描述

十一、RESISC45

RESISC45数据集是遥感图像场景分类（RESISC）的数据集。它包含 31,500 个大小为 256×256 的 RGB 图像，分为 45 个场景类，每个类包含 700 个图像。 RESISC45 的显着特点包括从 20cm 到超过 30m/px 的不同空间分辨率。

在这里插入图片描述

十二、ChestX-ray8

ChestX-ray8 是一个医学成像数据集，其中包含 32,717 名（从 1992 年至 2015 年收集的）独特患者的 108,948 张正面 X 射线图像，以及通过 NLP 从文本放射学报告中挖掘的文本挖掘的八种常见疾病标签技术。

在这里插入图片描述

十三、Kuzushiji-MNIST

Kuzushiji-MNIST 是 MNIST 数据集（28x28 灰度，70,000 张图像）的直接替代品。由于 MNIST 将我们限制为 10 个类别，因此作者在创建 Kuzushiji-MNIST 时选择了一个字符来代表 10 行平假名中的每一行。草书是一种日本草书书写风格。

在这里插入图片描述

十四、AbstractReasoning

AbstractReasoning 是用于抽象推理的数据集，其目标是基于抽象推理从上下文面板中推断出正确的答案。

在这里插入图片描述

十五、N-Caltech 101 (Neuromorphic-Caltech101)

Neuromorphic-Caltech101 (N-Caltech101) 数据集是基于原始帧的 Caltech101 数据集的尖峰版本。原始数据集包含“Faces”和“Faces Easy”类，每个类都包含相同图像的不同版本。为了避免混淆，“Faces”类已从 N-Caltech101 中删除，留下 100 个对象类和一个背景类。 N-Caltech101 数据集是通过将 ATIS 传感器安装在电动云台装置上并让传感器在 LCD 监视器上查看 Caltech101 示例时移动来捕获的，如下面的视频所示。数据集及其创建方式的完整描述可以在下面的论文中找到。如果您使用该数据集，请引用本文。

在这里插入图片描述

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/IT小白/article/detail/948219