2018/12/27
无论看到论文也好,文章也好,都提到了深度学习是一种无特征的学习方法。因为大部分情况下,他们的范例都是以图像为基础的,所以我并不是非常理解。
不过今天看了kaggle上的一个教程[1],文章中并没有直接说明,但看的过程中,有点明白。
无特征的意义, 是指他将原始数据直接输入到算法中,让算法(或模型)根据标记好的数据,来实现相应的权值的选择。如果可以这样理解的话,这就是一种特征学习的过程。因为它忽略了人为参与的步骤,它将这部分工作自己完成,然后输入到最后的一个逻辑回归单元中,也就是最后的输出层,当然,可能最后的激活函数并不是这个,这里只是一个比喻。
比如说,前两年开始学sklearn的时候,它的一个例子我还记得很清楚。就是“数字照片”,他当时的照片还比较小,然后直接利用了SVM类的分类器进行分类[2]。他的的操作就是将所有的像素点上的值当作了特征输入。我当时甚至现在都很不理解,为什么要这么做,为什么不做一些处理,在进行输入。
不过,如果从反向的角度,顺着它这样做由道理的角度出发。利用机器学习来完成相应的特征选择,有些特征不重要的,自然自己也就凋落了。
同样的,深度学习也一样,他将相应的内容提取出啦,然后再用类似逻辑回归的函数达到相应的分类效果。Bingo。
*这里仅仅是以一个初学者的角度来理解无特征学习的意义,后续有了新的理解,再更新。
参考文献
[1]深度学习入门手册
[2][识别图片中的数字-sklearn范例](https://scikit-learn.org/stable/auto_examples/classification/plot_digits_classification.html#sphx-glr-auto-examples-classification-plot-digits-classification-py)