赞
踩
小白最近在学栈式降噪自编码(SDAE),过程有三部分:自编码器(AE)的无监督训练、有监督微调、最终正确率的验证。因此需要三部分数据:无标签数据集、少部分有标签的数据集用来微调、大量有标签的数据集用来验证正确率。
一些博客及课本中用的数据集是mnist数据集,但刚才查了下mnist数据集总体上分为两部分:Training set(Training set images+Training set labels)和Test set(Test set images+Test set labels),也就是说SDAE的前两部分用的同一个数据集,初学者有点头大~~
在SDAE中:
训练集:完成对模型参数的训练
验证集:有监督微调(就是把模型从输入到最终输出串起来整体进行训练,得到最终想要的输出数据形式(标签类型的)),其实也就是进阶版的训练
测试集:确定训练好的模型的正确率
数据集的分类主要看算法吧,有监督的算法(比如CNN),分为两部分就好啦(训练+测试),像SDAE这种无监督的算法就需要三部分数据集
小白的第一篇博客,主要是给自己做的笔记,有问题的话随便指出哈,反正我是不会改的哈哈哈哈哈~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。