赞
踩
卷积神经网络(CNN)也是一种网络结构的数学模型,擅长于于图像处理,并且默认的输入是图像。
其特点有:
能够有效提取图像特征——卷积操作
能够将大数量级的图像降维为小数量级——池化操作
卷积神经网络的结构为:输入层(Input)、卷积层(Conv)、池化层(Pool)、全连接层(FC)、输出层(Output)
输入层通常为图片。
卷积层对图片进行特征提取。
池化层对数据进行降维。
全连接层就是隐藏层。
输入层、隐藏层、输出层是神经网络的通用结构。
FC到Output的过程同神经网络的隐藏层和输出层——通过对数据进行权重矩阵相乘(还有偏移量的相加)最后经由输出层最终计算得出结果。
卷积层是卷积核对原图像进行卷积操作的一层结构。
卷积操作:设定一个卷积核(矩阵),然后对原图像的像素矩阵进行运算。
在这里,卷积核(也叫过滤器filter) 被设置为3*3的矩阵,将filter与原图像的像素点进行相乘,这里选择与蓝色区域进行相乘,但是相乘的操作不是一般的矩阵相乘形式,而是向量的形式来进行,所得结果如图所示。而左右边的方格中的-5是卷积核对输入图像左上角的3*3矩阵相乘的结果。
以上只是卷积操作中的一环
卷积操作的全过程如下图所示:(对一张图像的所有像素矩阵用卷积核进行遍历,然后输出结果,这里步长设置为1)
卷积操作的目的是特征提取。
不同的卷积核,对图像的影响是不同的:
去噪:
这里我们使用的卷积核对图像进行卷积操作之后可以使得原图像更加的平滑。——这里就相当于对3*3矩阵的像素做一个平均值处理,将这个矩阵的颜色变为9个像素点(3*3矩阵)的均值μ,然后μ就为原像素图像那9个像素点的值。
挑出垂直边界或水平边界 :
不同卷积操作就是对原图像进行不同特征的提取/输出。
具体什么样的卷积操作能对应什么样的特征提取一般是通过尝试所了解,也可以根据别人的经验来参考。
池化操作:
具体作用:
上图中,虽然写了三个卷积核,但是其实是一个卷积核的三个通道(RGB),这里要十分注意,
卷积核的个数和特征种类是一一对应的,而不是图片的通道数。
三个通道的的特征最后要汇总,还是归为一个特征。
通过卷积核来进行各个通道的特征提取,然后根据池化层进行最大池化操作获得的特征汇总——一定程度上减少了数据维度。
[1] CNN卷积神经网络(图解CNN)_WGS.的博客-CSDN博客_cnn卷积神经网络
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。