赞
踩
个人理解,如有偏差,欢迎指出。
深度学习特征融合的方式
参考:特征融合
线性相加:像ResNet或RIR中上下层采用的特征融合方式就是逐像素相加。 相加不改变梯度的变化。操作也比较简单快速。限制:首先,两个输入x1和x2, 应该是有相同含义或者相似含义的,或者说输入和输出之间是对应的。在ResNet中,就假设其中一个输入可能为0,而输入可能就是其中一个输出。直接相加也意味着两个输入需要有同样的范围,而且重要性是相等的。y = f(x1, x2) = x1 + x2
非线性相加:可以用注意力学习到相加的两者具有不同的重要性,如下图,两个不同感受野的特征图,通过学习得到不同的权重,最后实现权重非线性相加的结果。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。