赞
踩
今天买的书到了,开始接触卷积神经网络,展示书中内容~
在机器学习中,一般将数据集划分为两大部分:一部分用于模型训练,称作训练集(Train Set);另一部分用于模型泛化能力评估,称作测试集(Test Set)。在模型训练阶段会将训练集再次划分为两部分,一部分用于模型的训练,而另外一部分用于交叉验证,称作验证集(Validation Set)。如图所示。
Matlab 2022b自带手写数据集,其中包含0~9十种手写数字,分别以数字0 ~ 9命名的文件夹中,每个文件夹中有1000幅图像。保存路径如图所示。(版本不同,路径可能有所不同,也可在网上下载数据集。)
名称 | 含义 |
---|---|
IncludeSubfolders | 子文件夹包含标志位。指定true表示可包含每个文件夹中的所有文件和子文件夹,指定 false则表示仅包含每个文件夹中的文件 |
LabelSource | 提供标签数据的源。如果指定为’none’,则Labels属性为空;如果指定了’foldernames’, 将根据文件夹名称分配标签并存储在Labels属性中 |
filename='D:\Program Files\MATLAB\R2022b\toolbox\nnet\nndemos\nndatasets\DigitDataset';
imds=imageDatastore(filename,...
"IncludeSubfolders",true,...%包括路径下的所有文件和子文件
"LabelSource","foldernames");%将文件夹的名称作为标签
perm=randperm(10000,16);
for i=1:16
subplot(4,4,i);
imshow(imds.Files{perm(i)});
title(imds.Labels(perm(i)));
end
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。