当前位置:   article > 正文

深度学习:AlexNet网络_r-alexnet算法准确率忽高忽地

r-alexnet算法准确率忽高忽地

1 AlexNet介绍

AlexNet是2012年ISLVRC 2012(ImageNet Large Scale Visual Recognition Challenge)竞赛的冠军网络,分类准确率由传统的70%+提升到80%+。
AlexNet由Hinton和它的学生Alex Krizhevsky设计的。也是在那年之后,深度学习开始迅速发展。

ISLVRC 2012
训练集:1281167张已标注图片
验证集:50000张已标注图片
测试集:100000张未标注图片
在这里插入图片描述

该网络分为上下两部分,因为当时作者使用了两块GPU进行并行运算。上下两部分一模一样,只需分析其中一部分即可。

该网络的亮点在于:

  1. 首次利用GPU进行网络加速训练。
  2. 使用了ReLU激活函数,而不是传统的Sigmoid激活函数以及Tanh激活函数。
  3. 使用了IRN局部响应归一化。
  4. 在全连接层的前两层中使用了Dropout随机失活神经元操作,以减少过拟合。

过拟合:根本原因是特征维度过多,模型假设过于复杂,参数过多,训练数据过少,噪声过多,导致拟合的函数完美的预测训练集,但对新数据的测试集预测结果差。过度的拟合了训练数据,而没有考虑到泛化能力。
使用Dropout的方式在网络正向传播过程中随机失活一部分神经元。
在这里插入图片描述

2 AlexNet过程

在卷积操作过程中,矩阵经卷积操作后的尺寸由以下几个因数决定:

输入图像大小:W * W
Filter大小:F * F
步长:S
padding的像素数:P
经卷积后的矩阵尺寸大小计算公式为:
N=(W-F+2P)/S+1
注:padding为当滑动窗口滑动到最右边列数不够,补零。一般上下左右对称补零。

2.1 Conv1

在这里插入图片描述
原始图像:2242243的彩色图像
卷积核大小(kernel_size):11 * 11
卷积核步距(stride):4
卷积核个数(kernels):48*2(其中一部分为48,上下两部分共96)
padding:[1,2](在特征矩阵的左边加入一列0,在右边加入两列0)
输出计算
inout_size:[224,224,3]
N=(W-F+2P)/S+1=[224-11+(1+2)]/4+1=55
output_size:[55,55,96]

2.2 Maxpool1

在这里插入图片描述
kernel_size:3
padding:0
stride:2
输出计算
input_size:[55,55,96]
N=(W-F+2P)/S+1=(55-3)/2+1=27
output_size:[27,27,96]

2.3 Conv2

在这里插入图片描述
kernels:128*2=256
kernel_size:5
padding:[2,2]
stride:1
输出计算
input_size:[27,27,96]
N=(W-F+2P)/S+1=(27-5+4)/1+1=27
output_size:[27,27,256]

2.4 Maxpool2

在这里插入图片描述
kernel_size:3
padding:0
stride:2
输出计算
input_size:[27,27,256]
N=(W-F+2P)/S+1=(27-3)/2+1=13
output_size:[13,13,256]

2.5 Conv3

在这里插入图片描述
kernels:192 * 2=384
kernel_size:3
padding:[1,1]
stride:1
输出计算
input_size:[13,13,256]
N=(W-F+2P)/S+1=(13-3+2)/1+1=13
output_size:[13,13,384]

2.6 Conv4

在这里插入图片描述
kernels:192*2=384
kernel_size:3
padding:[1,1]
stride:1
输出计算
input_size:[13,13,384]
N=(W-F+2P)/S+1=(13-3+2)/1+1=13
output_size:[13,13,384]

2.7 Conv5

在这里插入图片描述
kernels:128 * 2=256
kernel_size:3
padding:[1,1]
stride:1
输出计算
input_size:[13,13,384]
N=(W-F+2P)/S+1=(13-3+2)/1+1=13
output_size:[13,13,256]

2.8 Maxpool3

在这里插入图片描述
kernel_size:3
padding:0
stride:2
输出计算
input_size:[13,13,256]
N=(W-F+2P)/S+1=(13-3)/2+1=6
output_size:[6,6,256]

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/繁依Fanyi0/article/detail/92589
推荐阅读
相关标签
  

闽ICP备14008679号