赞
踩
假设前一层的输出为W*H*C:C个W*H
那么全连接的任务就是:
通过设置卷积核的参数,给这C个W*H分配L组c层的权重系数,使得最后能得到一组长为L的特征向量,这个特征向量最终被用于分类或数值预测。
全连接可以被视为是一种极端情况的卷积层,为了使每个W*H最后的输出是1*1,这个每个卷积核的尺寸也要是输入矩阵尺寸(W*H)。
对每个通道都要设置不同的参数,且输出通道数为多少就要设置多少组大小为W*H*C的卷积核。由此可以看出,假设输出通道数为L,则全连接的参数量为L*C*W*H。
参数量大,且容易导致过拟合。
假设前一层的输出为W*H*C (C个尺寸为W*H的特征图Feature Maps) ,那么全局平均池化GAP做的事情就是,把这C个W*H分别取平均,得到了C个平均值,即一个长度为C的特征向量Feature Vector。
优点就是,解决了卷积过程中位置对特征识别的要求,特征的分布不再局限于某一位置。通过前层控制通道数C,可以有C个特征来指向学习结果。
GAP的意义是:对整个网路在结构上做正则化防止过拟合。其直接剔除了全连接层中黑箱的特征,直接赋予了每个channel实际的内别意义。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。