赞
踩
论文:Path Aggregation Network for Instance Segmentation
代码:https://github.com/ShuLiu1993/PANet
出处:CVPR2018 | 香港大学 北大 商汤 腾讯优图
PANet 的动机:
PANet 做了什么(前两点也适用于目标检测):
高层的特征包含全局特征,低层的特征包含细节定位特征,所以 FPN 中的自顶向下的信息传输方式能够给低层特征引入全局信息,利于分类能力的提升。
PANet 认为如果使用从下到上的传输路径,则能够将底层的细节定位纹理信息传递到高层,所以,其建立了两个非常“干净”的旁侧路径:
PANet 具体是怎么强化自己的特征传输的?
以使用 ResNet 为例,并且使用 FPN 输出的 P 2 P_2 P2 到 P 5 P_5 P5 层特征,PANet 在 FPN 的后面(图 1 中展示为右侧)增加了一个特征路径:
FPN 中,根据 proposal 大小的不同,会被分配到不同分辨率的特征上去,这就导致小 proposal 被分配到低层去预测,大 proposal 被分配到高层去预测,但这并非最优的,假设两个 proposal 相差 10-pixel,就可以能被分配到不同吃的的特征图上去,但这两个目标可能非常相近。
此外,高层特征是由很大的感受野的,能够捕捉到更多的上下文信息,如果小 proposal 能够接收到这些信息的话,会有利于预测。低层特征会蕴含很多细节和定位特征,让大 proposal 接收到这些信息的话,也会有利于预测。
所以,PANet 中,将每个 proposal都提取了 pooling 特征,然后将他们聚合起来,这个过程称为 adaptive feature pooling。
怎么聚合呢?—— max 聚合,也就是在每个点上选择最大值
下图 3 中 level 1-4 表示 low-to-high levels:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。