当前位置:   article > 正文

SSD-6D: Making RGB-Based 3D Detection and 6D Pose Estimation Great Again—2017(笔记)_ssd-6姿态检测

ssd-6姿态检测

SSD-6D: Making RGB-Based 3D Detection and 6D Pose Estimation Great Again—2017(笔记)

SSD-6D让RGB图像的3D检测和6D姿态估计更出色—2017(笔记)

文章以单帧RGB图像为输入,基于扩展的SSD范式,采用InceptionV4深度网络,预测目标2D bounding box以及目标种类、离散视点和面内旋转在每个特征图位置的得分,通过射影几何特性构建目标的6D姿态池,最终通过姿态池优化ICP得到精确结果。

通过单位球面等距采样获得目标的离散6D姿态空间,供深度网络完成训练

摘要

  1. 我们提出了一种新颖的方法来检测3D模型实例并从单次拍摄中的RGB数据估计其6D姿态。
  2. 为此,我们扩展了流行的SSD范例以覆盖整个6D姿态空间,并仅在合成模型数据进行训练
  3. 我们的方法可以与现有的方法相媲美或超越,后者可以在多个具有挑战性的数据集上利用RGBD数据。
  4. 此外,我们的方法在10Hz左右产生这些结果,比相关方法快许多倍。为了重现性,我们将经过培训的网络和检测代码公开发布。

引言

  1. 大多数性能最好的3D检测器都遵循基于视图的范例,其中会生成一组离散的对象视图,并用于后续的特征计算[31、14]。
  2. 在测试过程中,在离散位置对场景进行采样,计算特征,然后将其与对象数据库进行匹配,以在训练视图和场景位置之间建立对应关系。
  3. 特征可以是图像属性(颜色渐变,深度值,法线方向)的编码[12、16、18],也可以是最近的学习结果[4、29、5、6、17]。
  4. 无论哪种情况,检测和姿态估计的准确性都取决于三个方面:(1)6D姿态空间在视点和尺度方面的覆盖范围,(2)区分对象和视图的特征的辨别力;(3)匹配对杂波,光照和遮挡的鲁棒性。
  5. 基于CNN的类别检测器,例如YOLO [25]或SSD [22],已在大规模2D数据集上显示了出色的结果。他们的想法是反转采样策略,以使场景采样不再是导致连续输出的一组离散输入点。取而代之的是,输入空间在整个图像上都很密集,而输出空间则离散化为许多形状和大小都不同的重叠边
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/658085
推荐阅读
相关标签
  

闽ICP备14008679号