鲁棒，抗遮挡的对柔性手抓取的物体6D姿态估计

作者：码创造者 | 2024-07-24 05:36:31

踩

机械手6d位姿

点击上方“3D视觉工坊”，选择“星标”

干货第一时间送达

标题：Robust, Occlusion-aware Pose Estimation for Objects Grasped by Adaptive Hands

作者: Bowen Wen, Chaitanya Mitash, Sruthi Soorian, Andrew Kimmel, Avishai Sintov and Kostas E. Bekris

机构：Rutgers University

来源：ICRA 2020

编译 : Bill

审核：管培育

摘要

大家好，今天为大家带来的文章是Robust, Occlusion-aware Pose Estimation for Objects Grasped by Adaptive Hands

许多机械臂的操纵任务，比如放置，手中灵巧操纵需要估计物体姿态。物体被机械手的严重遮挡给物体姿态估计带来更多挑战。此外，对于柔性手，手的状态更难得到。对此本文提出了一个基于深度图的方法，目标是鲁棒和快速地估计出手中物体的姿态。首先我们通过并行搜索并根据观测点云和柔性手的模型快速估计出柔性手的姿态，以便将柔性手相关的点云从场景点云中去除。然后，全局匹配算法根据剩余点云产生多个物体姿态假设并将他们聚类。基于物理推理，错误的物体姿态被排除。剩余候选姿态中得分最高的被选为最终的姿态估计输出。大量的合成和真实数据集上的实验表明了此方法在挑战性的场景和被用于多种物体时的高精度，计算高效性和鲁棒性。代码和原文中的数据集均已开源: https://github.com/wenbowen123/icra20-hand-object-pose

背景与贡献

物体姿态估计

随着近年来6D物体姿态估计的发展，对于放置在桌上的物体姿态估计取得了良好效果。然而机械臂抓取和操作的流程中，从桌上抓取物体只是第一步，抓取后物体姿态的估计影响了后续的精准操纵和放置。

我们提出的框架具有以下特点：

1. 高精度: 即使在ADD-S 5mm的界限下，也取得了高准确率。

2. 高效性: 它能在0.5-0.7秒内同时估计出柔性手和物体的姿态。柔性手的姿态估计也能用于闭环控制。

3. 鲁棒性: 它能应用于多种物体，包括缺乏纹理，有混淆背景的场景下。

由于此前没有抓取中物体姿态估计的数据集，我们还发布了模拟和真实世界采集的两个大型数据集，每张图片的物体姿态都附带标注，以供相关工作的表现评估。

算法流程

1.整体结构

这项工作中，我们的目的是通过相机拍到的深度图和被操纵物体的CAD模型，求出被操纵物体的姿态。关于操纵过程中用到的机械手，本文考虑更具挑战性的柔性手。因为对于此类柔性手，手的姿态无法通过机器人的前向动力学直接得到。需要高效并行的蚁群搜索算法求解机械手的姿态。之后手的姿态有三个用途: 1) 移除机械手相关的点云，得到物体相关的感兴趣区域；2) 通过手的姿态和手的模型建立概率模型，启发式搜索和3D全局配准产生备选物体姿态；3)借助机械手的姿态和物理先验，消除严重遮挡条件下物体姿态的含糊性，筛选并得到最佳的物体姿态。

图1 本文提出的框架首先根据输入的RGBD点云和柔性手的模型计算出手的姿态。此后手部相关的点云从场景中去除以得到不完美的物体部分点云。物体和CAD模型的全局匹配算法，产生多个物体姿态候选。后续的筛选过程输出最佳的物体姿态。

2. 方法

2.1 柔性手的姿态估计

图2 本文考虑的Yale T42柔性手的自由度

根据前向动力学，我们可以得到手腕的姿态。本文所考虑的柔性手不能直接得到手指的姿态。因此我们首先需要求解柔性手各个手指的姿态。根据柔性手的运动约束和碰撞约束，我们采用高度并行化的蚁群粒子算法搜索求解手指的姿态。我们将手指可活动域进行离散化，每个粒子代表了一种手指姿态的可能性。每次进化迭代时，鼓励新的粒子会在上一轮得分高的区域附近采样。其中手指姿态得分的目标函数在下面描述。

算法1 PSO目标函数的计算

2.2 备选物体姿态假设的产生

柔性手的整体姿态确定后，我们可以移除机械手部分的点云. 由于深度图存在噪声，我们还建立带符号的距离函数场SDF并以此建立指数分布概率模型，表明任意一点属于物体部分的概率，来进行软分割。对于全局3D配准我们基于Super4PCS算法，找出观测点云和物体CAD模型中匹配的共面4点组。并根据匹配点对求解物体姿态。为了使算法更高效我们还做了部分改进。在共面4点基采样过程中，采样过程服从前面建立的概率分布，鼓励从较可能为物体点的区域采样。另一方面，我们对CAD模型构建八叉树以便快速寻找完全匹配的全等4点组。4点组和4点基需要满足全等对角线长度和夹角，同时两两点对需要满足PPF特征匹配以更好地剔除离群匹配。通过不同的采样我们可以得到多个可能的物体姿态估计放入备选列表并聚类。

图3 通过一对观测点云中物体上采样的共面4点基和CAD模型上找到的全等共面4点组, 可以求解得到一个物体姿态转换假设

2.4 备选物体姿态的筛选

物理推理被用来排除不符合物理规律的备选物体姿态。首先我们进行碰撞和触摸检测，如果物体通过假设姿态转换后的模型和姿态估计转换后手的模型有渗透关系或者距离太大而悬空，则该备选姿态被排除。这部分可以通过SDF高效实现。第二，我们进行Z-Buffer视线遮挡检测。由于深度图是通过锥头相机拍到，每个像素点的深度点到相机原点的射线之间在一定噪声下不应该存在其他点。如果用备选姿态转换后的物体3D点云不满足这样的分布，那么它也被排除.。经过物理排除后，剩下的备选姿态具有最高LCP得分的作为最佳姿态输出。

主要结果