搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
2023面试高手
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
用多模态信息做 prompt,解锁 GPT 新玩法
2
C++之正则表达式_c++ 正则表达式
3
图系列|7篇动态时空图网络学习必读的顶会论文
4
Python中的Assert语句简明教程_python中assert
5
mysql 添加索引,ALTER TABLE和CREATE INDEX的区别
6
Flink CDC 3.0 详解_flinkcdc 3.0.1
7
使用sk-learn库实现k-means算法对iris数据分类_使用sklearn中的kmeans算法对iris数据集进行聚类分析
8
PostgreSQL技术大讲堂 - 第30讲:多表连接方式_pgsql 关联查询多张表
9
RC滤波器(高通/低通)
10
本周重要AI资讯_kimi用的国外开源
当前位置:
article
> 正文
机器人识别抓取笔记(基于视觉的机器人抓取——从物体定位、物体姿态估计到平行抓取器抓取估计:综述)_rl抓取估计
作者:2023面试高手 | 2024-04-28 12:44:36
赞
踩
rl抓取估计
Real-Time Deep Learning Approach to Visual Servo Control and Grasp Detection for Autonomous Robotic Manipulation
(基于视觉的机器人抓取——从物体定位、物体姿态估计到平行抓取器抓取估计:综述)
1 引言
找到
理想抓取配置
的
抓取假设
的
子集
包括:
机器人将执行的任务类型、目标物体的特征、关于物体的先验知识类型、机械爪类型,以及最后的抓取合成
。
注:
从本文中可以学习到
视觉伺服
的相关内容,用于对
动态目标
的
跟踪抓取
或
自动调整观察姿态
,因为观察的角度不同,预测的抓取框位置也不同,抓取物品离相机位置
越近
,抓取预测
越准
。
1.1 抓取综合方法
抓取综合方法
是机器人抓取问题的
核心
,因为它涉及到在物体中寻找
最佳抓取点
的任务。这些是夹持器必须与物体接触的点,以确保外力的作用不会导致物体不稳定,并满足一组抓取任务的相关标准。
抓取综合方法
通常可分为
分析法
和
基于数据的方法
。
分析法
是指使用具有特定动力学行为的灵巧且稳定的多指手构造力闭合
基于数据的方法
建立在按某种标准的条件下,
对抓取候选对象的搜索
和
对象分类
的基础上。(这一过程往往需要一些先验经验)
1.2 基于视觉的机器人抓取系统
基于视觉的机器人抓取系统
一般由四个主要步骤组成,即
目标物体定位、物体姿态估计、抓取检测(合成)和抓取规划
。
一个
基于卷积神经网络的系统
,一般可以
同时执行前三个步骤
,该系统接收
对象的图像
作为
输入
,并预测
抓取矩形
作为
输出
。
而
抓取规划阶段
,即机械手找到目标的最佳路径。它应该能够适应工作空间的变化,并考虑动态对象,使用视觉反馈。
目前大多数机器人抓取任务的方法执行
一次性抓取检测
,无法响应环境的变化。因此,在抓取系统中
插入视觉反馈
是可取的,因为它使抓取系统对感知噪声、物体运动和运动学误差具有鲁棒性。
2 抓取检测、视觉伺服和动态抓取
抓取计划分两步
执行。
首先
作为一个
视觉伺服控制器
,以反应性地适应对象姿势的变化。
其次
,作为
机器人逆运动学的一个内部问题
,除了与奇异性相关的限制外,机器人对物体的运动没有任何限制。
2.1抓取检测
早期的抓取检测方法一般为
分析法
,依赖于被抓取物体的几何结构,在执行时间和力估计方面存在许多问题。此外,它们在许多方面都不同于
基于数据的方法
基于数据的方法
Jiang、Moseson和Saxena等人仅使用图像,从五个维度提出了机器人抓取器闭合前的位置和方向表示,
如下图
,该五维表示足以对抓取姿势的七维表示进行编码[16],因为假定图像平面的法线近似,因此三维方向仅由θ给出。
本文的工作重点是开发一种
简单高效的CNN
,用于
预测抓取矩形
。在训练和测试步骤中,所提出的网络足够轻,
可以联合应用第二个CNN,解决视觉伺服控制任务
。因此,整个系统可以在机器人应用中实时执行,而不会降低两项任务的精度。
2.2 视觉伺服控制
经典的
视觉伺服(VS)策略
要求提取
视觉特征
作为
控制律的输入
。必须正确选择这些特征,因为控制的鲁棒性与此选择直接相关。
最新的VS技术探索了深度学习算法,以同时
克服特征提取和跟踪、泛化、系统的先验知识以及在某些情况下处理时间
等问题。
Zhang等人开发了第一项工作,证明了在没有任何配置先验知识的情况下,
从原始像素图像生成控制器
的可能性。作者使用
Deep Q-Network
,通过
深度视觉运动策略
控制机器人的3个关节,执行到达目标的任务。训练是在模拟中进行的,没有遇到真实的图像。
遵循
强化学习方法
的工作使用
确定性策略梯度
设计新的基于图像的VS或Fuzzy Q-Learning,依靠特征提取,控制多转子空中机器人。
另一种方法中,一些研究
视觉伺服深度学习
的工作是通过
卷积神经网络
进行的。
CNN的泛化能力优于RL
,因为RL学习的参数是特定于环境和任务的。.
本文设计了
四种卷积神经网络
模型作为
端到端视觉伺服控制器
的潜在候选。网络不使用参考图像和当前图像以外的任何类型的附加信息来
回归控制信号
。因此,所提出的网络作为实际上的控制器工作,预测速度信号,而不是相对姿态。
2.3 动态抓取
学习感知行为的视觉表征,遵循反应范式,
直接从感觉输入生成控制信号
,无需高级推理,有助于动态抓取。
强化学习方法
适用于特定类型的对象,并且仍然
依赖于某种先验知识
,因此,最近大量研究探索了将
深度学习
作为解决
闭环抓取
问题的方法。
Levine等人提出了一种
基于两个组件
的
抓取系统
。
第一部分
是
预测CNN
,其接收
图像和运动命令
作为
输入
,并
输出
通过执行这样的命令,所产生的抓取将是令人满意的
概率。第二个部分
是
视觉伺服
功能。这将使用预测CNN来选择将持续控制机器人成功抓取的命令。这称为是深度强化学习,需要很久的训练时间。
2019年,Morrison, Corke 和 Leitner 开发了一种
闭环抓取系统
,在这种系统中,
抓取检测和视觉伺服不是同时学习的
。作者
使用完全CNN获取抓取点
,并
应用基于位置的视觉伺服
,使抓取器的姿势与预测的抓取姿势相匹配。
3 本文实现的方法
VS
的
目的
是通过将
相机连续获得的图像与参考图像进行比较
,引导
操纵器
到达机器人能够完全看到物体的位置,从而满足抓取检测条件。因此,该方法的应用涵盖了所有情况,其中
机器人操作器
(相机安装在手眼模式下)必须跟踪和抓取对象。
该
系统
包括
三个阶段
:
设计阶段、测试阶段和运行阶段
。
第一个
是
基于CNN架构的设计和训练
,以及
数据集的收集和处理
。在
第二阶段
,使用
验证集
获得离线结果,并根据其准确性、速度和应用领域进行
评估
。
第三阶段
涉及在机器人上测试经过训练的网络,以
评估
其在
实时和现实应用
中的充分性。
在
运行阶段
,系统运行的要求是事先获得目标对象的图像,该图像将被VS用作设定点。只要控制信号的L1范数大于某个阈值,则执行控制回路。
单个参考图像
作为
视觉伺服CNN
的
输入
之一呈现给系统。相机当前获取的图像作为该网络的
第二个输入
,并作为
抓取CNN
的
输入
。这两个网络都连续运行,因为
抓取CNN实时预测矩形
以进行监控,
VS网络
执行
机器人姿势
的
实时控制
。
VS CNN
预测一个
速度信号
,该信号乘以比例增益λ,以应用于相机中。机器人的
内部控制器
寻找保证相机中
预测速度
的
关节速度
。在每次循环执行时,根据机器人的当前位置更新当前图像,只要控制信号不收敛,该循环就会重复。
当满足停止条件时,抓取网络的预测映射到世界坐标系。机器人通过逆运动学得到并到达预测点,然后关闭夹持器。
3.1 网络体系结构
该卷积网络架构被用于
抓取检测
。网络接收224×224×3的
RGB图像
作为
输入
,
无深度信息
。
layer 1
由
32个3×3
卷积组成,
layer 2
包含
164个卷积
。在这两种情况下,卷积运算都是通过
步长2和零填充(zero-padding)
执行的,然后是
批标准化(batch normalization)和2×2最大池化
。
layer 3
包含
96个卷积
,其中卷积使用
步长1和零填充
执行,然后仅执行
批标准化
。
layer 4
,也是最后一层,卷积层由128个卷积组成,
以步长1执行
,然后是
2×2最大池化。
在
最后一层卷积
之后,
生成的特征映射
在包含4608个元素的一维向量中被展开。进一步传递到
两个全连接(FC)层
,每个层有256个神经元。在这些层次之间,训练期间考虑
50%的dropout rate
。
最后,
输出层
由
5个神经元
组成,对应于编码抓取矩形的**(x,y,w,h,θ)
值。在
所有
层中,使用的
激活函数
都是
ReLU**,但在输出层中使用线性函数的情况除外。
3.2 Cornell 抓取数据集
为了对数据集真值进行编码,使用四个顶点的x和y坐标编译抓取矩形。
Xc和Yc参数分别表示矩形中心点的X和Y坐标,可从以下公式获得:
计算夹持器开口w和高度h,同样更具四个顶点计算:
最后,表示夹持器相对于水平轴方向的θ由下式给出:
3.3 结果评估
预测矩形(r
p
)和真值矩形(r
c
)之间的角度θ差必须在30度以内。
雅卡尔指数(交并比)需大于0.25,不用达到一般的0.25 即可
3.4 视觉伺服网络体系结构
与抓取不同,设计
用于执行机械手视觉伺服控制
的网络接收
两个图像
作为
输入
,并且必须
回归六个值
,考虑到
线性
和
角度相机速度
,这些值也可以分为
两个输出
。共有四个模型处理VS任务。
模型1-
直接回归
(最终实验效果最佳)。它基本上
与抓取网络相同
,
除了
在
第三卷积层
中包含最大池化和不同的输入维度,这导致特征图上的比例差异相同。
模型2-
任务特定回归
。网络输入被串联,第三组特征图由两个独立的层序列处理(
多任务网络
)。因此,网络以两个3D矢量的形式预测6D速度矢量。具体来说,该结构由一个共
享编码器和两个特定解码器
组成 - 一个用于
线速度
,另一个用于
角速度
。
模型3-
串联特征的直接回归
和模型4-
相关特征的直接回归
,两个模型的
结构类似
,通过关联运算符(∑)区分。
模型3简单连接
;
模型4使用相关层
。
模型3
简单地由
第三个卷积层
产生的
特征映射
连接,因此第四个层的输入深度是原来的两倍。而
模型4
有一个
相关层
,帮助网络找到每个图像的
特征表示
之间的
对应关系
。原始相关层是flow network
FlowNet
的结构单元。
3.5 VS数据集
该数据集能够有效地捕获
机器人操作环境
的属性,具有足够的多样性,以确保泛化。
机器人以
参考姿态为中心
的
高斯分布的不同姿态
,具有
不同
的
标准偏差(SD)
。
下表为
参考姿势(分布的平均值)
和
机器人假设的标准偏差集(SD)。
SD选择考虑了机器人在VS期间必须执行的预期位移值。
从
高SD
获得的图像有助于网络了解机器人产生
大位移
时
图像
空间中产生的
变化
。
当参考
图像
和当前图像非常
接近
时,从
低SD
获得的实例能够
减少
参考图像和当前图像之间的
误差
,从而在稳态下获得良好的精度。
平均SD值有助于网络在大部分VS执行期间进行预测。
获得数据后,数据集以**(I,[x,y,z,α,β,γ])
的形式构造,其中
图像
为
I**,**[x,y,z,α,β,γ]**是拍摄该图像时对应的相机姿态。
α, β, γ为泰特-布莱恩角内旋(按照Z-Y-X变换)
已处理数据集的每个实例都采用(I
d
, I
c
,
d
H
c
)表示。I
d
是选择作为所需图像的随机实例;I
c
选择另一个实例作为当前图像;
d
H
c
是二者的变换。
通过
齐次变换矩阵
形式表示每个姿势(由
平移和欧拉角
表示)来实现(
0
H
c
和
0
H
c
),然后获得
d
H
c
=
0
H
d
-1
0
H
c
最后,对于实际上是
控制器
的网络,其目的是其
预测
相机的
速度信号
,即。E控制信号。 (I
d
, I
c
,
d
H
c
) 被转化为(I
d
, I
c
,V
c
)
Vc
是比例相机速度。由于在确定标记比例速度时不考虑λ增益,因此使用了
周期性项
,并且在
控制执行期间
必须对
λ增益
进行
后验调整
。
速度Vc由
d
H
c
表示:
其中,
R
是
旋转矩阵
;**r
ij
**同一矩阵第i行和第j列的元素;
c∗
t
c
是与当前相机位置到期望相机位置的平移向量;λ是比例增益(初始设置为1)
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/2023面试高手/article/detail/502298
推荐阅读
article
SpringBoot
进行单体应用
改造
为
微
服务
SpringCloud
_
springboot
将单体
架构
...
Spring Boot的API应用,改成Spring Cloud
微
服务
可以通过以下步骤:1、评估现在的Spring ...
赞
踩
article
NLP
以后还要
研究
些
什么
?_
chatgpt
出来后,
nlp
领域
还有
什么
可
研究
的方向...
如今,随着
NLP
技术的迅速发展,越来越多的人开始关注这个
领域
的
研究
。然而,自从ChatGPT出来以后,我已经被问了N次了...
赞
踩
article
webpack
的简单
使用
...
save表示非全局下载;–global表示全局下载(不同项目可能需要不同的依赖版本,故用–save更好)-dev表示开发...
赞
踩
article
【
小
程序
】
隐私
保护
指引设置_
小
程序
隐私
保护
指引...
在demo里,component下有privacyPopup文件夹,把整个文件夹copy到自己项目里的component...
赞
踩
article
基于A*
算法
的
多
机器人
路径
规划与
避障
解决方案
(
Matlab
源码)_基于多传感信息
的
机器人
避障
技术源码...
机器人
的
位置在地图上也可以表示成一个状态,然后通过 A*
算法
计算出每个
机器人
到目标位置
的
最短
路径
。该
算法
在每次扩展节点时...
赞
踩
article
MacOS
配置
Python
开发环境和
Pycharm
的详细步骤(完整版)_
mac
pycharm
...
与Unix的进化分支Linux的众多发行版本或
MacOS
都有自己的软件包管理工具(例如Ubuntu的apt软件包管理工具...
赞
踩
article
STL
C++
之无序容器
哈希
表
unordered
_
set
/
unordered
_
multi
set
/un...
哈希
容器_无序
哈希
表无序
哈希
表 STL
C++
哈希
容器 模板...
赞
踩
article
Java
数组
:使用
binarySearch
()方法
查找
数组
中的
指定
元素_
java
查找
数组
中
指定
数字的...
Java
数组
:使用
binarySearch
()方法
查找
数组
中的
指定
元素_
java
查找
数组
中
指定
数字的位置
java
查找
数组
...
赞
踩
article
分频器
的
Verilog
设计_数控
分频器
的
设计
verilog
...
偶分频_数控
分频器
的
设计
verilog
数控
分频器
的
设计
verilog
...
赞
踩
article
Spring
cloud
--
docker
快速入门_
spring
cloud
docker
...
微服务虽然具备各种各样的优势,但服务的拆分通用给部署带来了很大的麻烦。分布式系统中,依赖的组件非常多,不同组件之间部署时...
赞
踩
article
如何部署
wfs
分布式服务
...
wfs
是海量小文件存储系统。
wfs
1.x不直接支持分布式存储,但为了应对大规模部署和高可用需求,推荐采用如Nginx这样...
赞
踩
article
国产
API
管理
神器
Eolink
,
我爱了
_
eolink
导出无
错误码
...
大家好
,
我是findyi。给大家推荐一波我最近在使用的一个
API
管理
神器:
Eolink
。无论是前端还是后端
,
基本都要和A...
赞
踩
article
Docker
容器
常用操作命令_
docker
exec
...
不论是开发者是运维人员,都经常有需要进入
容器
的诉求。目前看,主要的方法不外乎以下几种:使用ssh登陆进
容器
使用nsent...
赞
踩
article
分组
密码
:
DES
密码
原理详解_
des
分组
密码
...
DES
是
分组
密码
的典型代表,也是第一个被公布出来的加密标准算法。属于对称运算,综合使用了置换(P)、代替(S)和代数(异...
赞
踩
article
http
和
http
s 区别_
http
htps
...
一、HTTP和HTTPS的基本概念 HTTP:是互联网上应用最为广泛的一种网络协议,是一个客户端和服务端请求和应答的标准...
赞
踩
article
flask
操作
数据库
...
文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言之前学习了如何管理
数据库
,但实际中更多的是...
赞
踩
article
Mac如何使用
python
创建
Excel
文件
,并进行内容
写入
_
mac
电脑
python
操作
写入
数据
...
引用
python
Excel
库,实现创建
Excel
文件
,并进行内容
写入
_
mac
电脑
python
操作
写入
数据
mac
电脑py...
赞
踩
article
校车
车载
4G视频智能
监控
系统
方案...
本方案通过整合硬件设备、软件
系统
和网络资源,构建了一套功能强大的
校车
车载
4G视频智能
监控
系统
。该
系统
不仅提高了
校车
运营的...
赞
踩
article
Circuits
--
Sequential
--
Finite4
...
【代码】Circuits
--
Sequential
--
Finite4
。Circuits
--
Sequential
--
Fini...
赞
踩
article
[
虚幻
引擎
][
UE
][
UE
5
]在
UE
5
中使用
线条
画一颗简单的三维
圣诞树
(练习向)_
ue5
连连看
线条
...
[
虚幻
引擎
][
UE
][
UE
5
]使用
线条
画一颗简单的三维
圣诞树
(练习向)_
ue5
连连看
线条
ue5
连连看
线条
...
赞
踩
相关标签
java
spring
springboot
springcloud
自然语言处理
人工智能
机器学习
webpack
前端
npm
node.js
小程序
算法
机器人
matlab
python
macos
pycharm
c++
散列表
哈希算法
verilog
docker
spring cloud
hdfs