赞
踩
卷积神经网络(CNN)是在图像、视频识别处理领域应用最多的深度学习方法。这次就来学习下卷积神经网络的基础知识。这里只简单介绍下卷积神经网络的入门知识,想再深入学习可以看下吴恩达、李宏毅老师的CNN课程。
如果我们采用传统神经网络来处理图像,由于图像分别率很高的原因导致输入数据的维度特别高,所以神经网络中的参数数量会太大。针对这个问题,CNN就被提出了。在卷积神经网络中,第一个卷积层会直接接受图像像素级的输入,每一层卷积都会提取数据中最有效的特征。
我们以人眼识别物体来类比卷积层,人眼识别物体是从点和线开始的,每个视觉神经元只接受一个区域信号。并提取出点和边的特征,然后将点和边的信号传递给后面一层的神经元,再接着组合成高阶特征,比如三角形、正方形、拐角等,再继续抽象组合,得到眼睛、鼻子和嘴等五官,最后再将无关组合成一张脸,完成识别。
只要我们提供的卷积核足够多,就能提取出各种方向的边和各种形态的点,就可以让卷积层抽象出有效而丰富的高阶特征,每一个卷积核滤波得到的图像就是一类特征,也叫Feature Map。
卷积的好处: 不管图像尺寸如何,我们需要训练的权重参数只跟卷积核大小、数量有关,因此我们可以使用非常少的参数量处理任意大小的图片。
常见的卷积神经网络结构包括:卷积层、池化层、全连接层。其中卷积层和池化层可以重复多次,如下图所示:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。