赞
踩
MNIST数据集官网
入门级的数据集,相信很多学习AI的人使用的第一个数据集就是MNIST。
NIST的全称是National Institute of Standards and Technology Special Database 19(美国标准与数据研究院),即 NIST Handprinted Forms and Characters Database, MNIST是其子集,即 miniNIST,其仅仅包含10个阿拉伯数字(即十类对象),每类对象含6000张训练图片,1000张测试图片,因此训练集共有60000张图片,测试集10000张图片。图片的大小为28x28的灰度图片(官网上说原始的图片是20x20的,但是图片中心化后放到了28x28的方格里)。
网站详细介绍了MNIST数据集的来源和数据格式,直接下载使用时需要根据官网给出的数据格式来进行预处理。
如果觉得MNIST的数据过于简单,想尝试更复杂的模型,可以使用NIST数据集,NIST的数据集有5中数据组织方式
hsf_page:包含了未经处理的整页的手写笔记
By write: 根据手写人来组织数据(可以用于笔迹辨认)
By field: 根据图片大类类组织,大类有:数字(digits),upper(大写),lower(小写),const(包括upper和lower)
By class:根据
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。