赞
踩
在看了一些对于FPN的讲解后的小笔记
(a)中先是将输入图片缩放成各个比例大小的图片,再将每张图片进行特征提取。缺点:计算量非常大
(b)直接将图片进行卷积操作,最后再进行预测。因为深层的网络会更加关注语义信息,浅层网络关注细节信息,所以对于图像中的小目标的检测效果不会太好
(c)在每一层都进行图像的预测特征提取。但是这样得到的特征很多都是弱特征(浅层网络提取到的特征),也就导致特征不鲁棒
(d)在c的基础上,对每一层提取到的特征进行融合,再进行图像的预测。
其中1*1的conv是为了保证他们的channel是一样的,从而可以进行不同特征层之间的融合,其中的上采样是为了,深层网络的特征图大小,能够通过upsampling增大特征图,以便深层特征图向底层特征图进行融合。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。