赞
踩
ImageNet大规模视觉识别挑战赛(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)
AlexNet:2012年ImageNet大规模视觉识别挑战赛冠军,精度提升超过10个百分点。
AlexNet验证了深度卷积神经网络的高效性。
主要贡献:
AlexNet共8层,5个卷积层和3个全连接层
96个11x11卷积核(卷积核的深度由输入图片的深度决定),步长为4,没有零填充。
问题:输入227x227x3大小的图像,输出特征图个数及尺寸为多少?
计算方法见博客
尺寸:(227-11)/4+1=55
个数:96
问题:这层有多少个参数?
参数:(11x11x3+1)x96=35k
窗口大小为3x3,步长为2(重叠有助于对抗过拟合)
作用:降低特征图尺寸,对抗轻微的目标偏移带来的影响。
输出尺寸:(55-3)/2+1=27
特征图个数:96
参数个数:0
作用:
256个5x5卷积核,步长为1,使用零填充p=2
问题:输入27x27x96大小的特征图组,输出特征图个数及尺寸为多少?
尺寸:(27-5+2x2)/1+1=27
个数:256
384个3x3卷积核,步长为1,使用零填充p=1
问题:CONV3输入13x13x256大小的特征图组,输出特征图个数及尺寸为多少?
尺寸:(13-3+2x1)/1+1=13
个数:384
256个3x3卷积核,步长为1,使用零填充p=1
MAX POOL3的输出为6x6x256的特征响应图组
全连接神经网络分类器
FC6期望输入:向量(将6x6x256的特征响应图展开成为列向量9216x1)
重要说明:
在AlexNet的结构上没有做多大改进。
AlexNet和ZFNet在进入第一层卷积时进行去均值操作:将样本所有图像的均值计算出来的均值向量作为均值
VGG16
残差网络和Inception V4是公认的推广性能最好的两个分类模型。
特殊应用环境下的模型:面向有限存储资源的SqueezeNet以及面向有限计算资源的MobileNet和ShuffleNet。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。