赞
踩
目录:
参考资料:
https://www.bilibili.com/video/BV1z7411T7ie
https://blog.csdn.net/qq_37555071/article/details/108214680
GoogLeNet 在2014年由Google团队提出,获得2014年ImageNet中Classification任务第一名,下为它的原论文https://arxiv.org/pdf/1409.4842.pdf
GoogLeNet主要具有以下四个方面的创新:
Inception结构的核心思想是将输入特征矩阵进行卷积,使得多个输出特征矩阵的高和宽相同,再将多个输出特征矩阵在深度方向进行拼接。而如图b则是引入了1x1卷积核进行降维(为了减少训练所需参数)的Inception结构。
使用1x1的卷积核能够有效地降低训练所需要的参数,下图中,上面是不适用卷积核进行降维的操作,我们需要parameters位819k+,而下面是降维后所需参数,我们需要的parameters为50k+,如下:
根据实验数据,发现神经网络的中间层也具有很强的识别能力,为了利用中间层抽象的特征,在某些中间层中添加含有多层的分类器。如下图所示,红色边框内部代表添加的辅助分类器。GoogLeNet中共增加了两个辅助的softmax分支,作用有两点,一是为了避免梯度消失,用于向前传导梯度。反向传播时如果有一层求导为0,链式求导结果则为0。二是将中间某一层输出用作分类,起到模型融合作用。最后的 l o s s = l o s s 2 + 0.3 ∗ l o s s 1 + 0.3 ∗ l o s s 0 loss=loss_2 + 0.3 * loss_1 + 0.3 * loss_0 loss=loss2+0.3∗loss1+0.3∗loss0。实际测试时,这两个辅助softmax分支会被去掉。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。