当前位置:   article > 正文

Squeeze-and-Excitation Networks(SE network)阅读笔记_squeeze-and-extraction

squeeze-and-extraction

SE Block详解

  • SE Block通过学习通道之间的关系,调节特征图通道之间的权重,从而达到attention集中的目的,改善网络的表达能力。
  • SE Block可以替代任意的卷积操作。

在这里插入图片描述
上图为SE Block描述图。可以看到,通过SE Block以后特征图的维度不会发生改变。SE模块有些像res,最大的不同在于将最后的加改成了乘。SE Block有两条数据流。上边的数据流首先对原图进行一个Squeeze操作(即对U进行global average pooling,输出为1*1 *C )。经过Squeeze操作之后,再对输出进行一个Excitation操作,此操作意在捕捉通道之间的关系吗。Excitation操作首先对Squeeze操作的输出进行降维(r为放缩因子),然后进行ReLU激活,最后再放大维度变回原来的通道数C。之所以采用这种bottleneck的结构,原文解释为降低模型的复杂度以及提高模型的泛化能力。经过Squeeze和Excitation之后,学习到了channel attention,将Excitation的输出与原特征图U逐个通道相乘(即scale操作),相当于改变了各个特征图的权重,从而使模型将attention集中在更有意义的特征图上。
SE Block公式化为:

  • squeeze(global average pooling)在这里插入图片描述
  • excitation(降维,ReLU,升维)在这里插入图片描述
  • scale操作(原特征图U与excitation输出相乘)在这里插入图片描述

关于SE Block的examples

  • 用在Inception network
    在这里插入图片描述
  • 用在ResNet在这里插入图片描述
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/580641
推荐阅读
相关标签
  

闽ICP备14008679号