当前位置:   article > 正文

CVPR 2021 Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition

patch-netvlad: multi-scale fusion of locally-global descriptors for place re

在这里插入图片描述

视觉场景识别对机器人和自主系统来说是一项具有挑战性的任务,它必须在一个不断变化的世界中解决因外观、照明以及视点变化所产生的问题。

本论文提出了一种新的条件和视点不变的视觉场景识别系统(Patch-NetVLAD)(如下图所示),它从每幅图像的特征空间的一组小块中提取局部-全局特征,通过局部-全局特征的穷举匹配获得空间得分,以获得两幅图像之间的相似度,从而测量这些图像之间的空间和外观一致性。局部-全局特征是在特征空间中使用一种vpr优化的聚合技术(论文采用NetVLAD)对密集采样的局部小块提取得到,产生一对图像之间的相似性得分,测量这些图像之间的空间和外观一致性。

首先采用原始NetVLAD特征,检索给定查询图像的top-k(在实验中使用k=100)最有可能匹配的匹配项。然后使用NetVLAD中VLAD层的替代方法计算出一种新的patch特征以用于局部匹配,以重新排序初始匹配列表,并改进最终的图像检索。这种组合方法在保证最终图像检索阶段的召回性能的基础上,最大限度地减少了交叉匹配patch特征所带来的额外的总体计算成本。通过引入一个完整的特征空间,推导出一个融合多个patch大小的多尺度方法,用来生成并组合这些不同大小的混合特征,以提高单一尺度方法的性能。与现有局部关键特征的固定空间邻域机制不同(NetVLAD仅将整个特征空间聚合为一个全局特征),该方法将特征空间网格上

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/711126
推荐阅读
相关标签
  

闽ICP备14008679号