搜索
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
搜索
2023面试高手
这个屌丝很懒,什么也没留下!
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1
STM32单片机(五)-寄存器地址理解和控制LED闪烁_stm32寄存器地址,偏移地址什么意思
2
【Bard vs. GPT-4】谷歌一雪前耻!全新PaLM 2反超GPT-4,办公全家桶炸裂升级,Bard史诗进化_bart和gpt4
3
UbuntuLinux 16.04系统升级Docker CE_ubuntu 升级docker
4
springboot对接minio的webhook全过程_springbootadmin使用webhook
5
IDEA SVN 提交忽略class等文件_idea svn忽略class文件
6
大数据入门系列 5:全网最全,Hadoop 实验——熟悉常用的 HDFS 目录操作和文件操作_hdfs目录操作_向hdfs中上传任意文本文件,如果指定的文件在hdfs
7
永信至诚通过注册:年营收3.2亿 奇安信曾是第三大股东
8
TTS 文本转语音模型综合简述_文字转语音模型
9
粒子滤波在机器人视觉中的应用_粒子滤波算法pytorch
10
pip升级_a new release of pip is available: 23.3.1 -> 23.3.
当前位置:
article
> 正文
机器人识别抓取笔记(基于视觉的机器人抓取——从物体定位、物体姿态估计到平行抓取器抓取估计:综述)_rl抓取估计
作者:2023面试高手 | 2024-04-28 12:44:36
赞
踩
rl抓取估计
Real-Time Deep Learning Approach to Visual Servo Control and Grasp Detection for Autonomous Robotic Manipulation
(基于视觉的机器人抓取——从物体定位、物体姿态估计到平行抓取器抓取估计:综述)
1 引言
找到
理想抓取配置
的
抓取假设
的
子集
包括:
机器人将执行的任务类型、目标物体的特征、关于物体的先验知识类型、机械爪类型,以及最后的抓取合成
。
注:
从本文中可以学习到
视觉伺服
的相关内容,用于对
动态目标
的
跟踪抓取
或
自动调整观察姿态
,因为观察的角度不同,预测的抓取框位置也不同,抓取物品离相机位置
越近
,抓取预测
越准
。
1.1 抓取综合方法
抓取综合方法
是机器人抓取问题的
核心
,因为它涉及到在物体中寻找
最佳抓取点
的任务。这些是夹持器必须与物体接触的点,以确保外力的作用不会导致物体不稳定,并满足一组抓取任务的相关标准。
抓取综合方法
通常可分为
分析法
和
基于数据的方法
。
分析法
是指使用具有特定动力学行为的灵巧且稳定的多指手构造力闭合
基于数据的方法
建立在按某种标准的条件下,
对抓取候选对象的搜索
和
对象分类
的基础上。(这一过程往往需要一些先验经验)
1.2 基于视觉的机器人抓取系统
基于视觉的机器人抓取系统
一般由四个主要步骤组成,即
目标物体定位、物体姿态估计、抓取检测(合成)和抓取规划
。
一个
基于卷积神经网络的系统
,一般可以
同时执行前三个步骤
,该系统接收
对象的图像
作为
输入
,并预测
抓取矩形
作为
输出
。
而
抓取规划阶段
,即机械手找到目标的最佳路径。它应该能够适应工作空间的变化,并考虑动态对象,使用视觉反馈。
目前大多数机器人抓取任务的方法执行
一次性抓取检测
,无法响应环境的变化。因此,在抓取系统中
插入视觉反馈
是可取的,因为它使抓取系统对感知噪声、物体运动和运动学误差具有鲁棒性。
2 抓取检测、视觉伺服和动态抓取
抓取计划分两步
执行。
首先
作为一个
视觉伺服控制器
,以反应性地适应对象姿势的变化。
其次
,作为
机器人逆运动学的一个内部问题
,除了与奇异性相关的限制外,机器人对物体的运动没有任何限制。
2.1抓取检测
早期的抓取检测方法一般为
分析法
,依赖于被抓取物体的几何结构,在执行时间和力估计方面存在许多问题。此外,它们在许多方面都不同于
基于数据的方法
基于数据的方法
Jiang、Moseson和Saxena等人仅使用图像,从五个维度提出了机器人抓取器闭合前的位置和方向表示,
如下图
,该五维表示足以对抓取姿势的七维表示进行编码[16],因为假定图像平面的法线近似,因此三维方向仅由θ给出。
本文的工作重点是开发一种
简单高效的CNN
,用于
预测抓取矩形
。在训练和测试步骤中,所提出的网络足够轻,
可以联合应用第二个CNN,解决视觉伺服控制任务
。因此,整个系统可以在机器人应用中实时执行,而不会降低两项任务的精度。
2.2 视觉伺服控制
经典的
视觉伺服(VS)策略
要求提取
视觉特征
作为
控制律的输入
。必须正确选择这些特征,因为控制的鲁棒性与此选择直接相关。
最新的VS技术探索了深度学习算法,以同时
克服特征提取和跟踪、泛化、系统的先验知识以及在某些情况下处理时间
等问题。
Zhang等人开发了第一项工作,证明了在没有任何配置先验知识的情况下,
从原始像素图像生成控制器
的可能性。作者使用
Deep Q-Network
,通过
深度视觉运动策略
控制机器人的3个关节,执行到达目标的任务。训练是在模拟中进行的,没有遇到真实的图像。
遵循
强化学习方法
的工作使用
确定性策略梯度
设计新的基于图像的VS或Fuzzy Q-Learning,依靠特征提取,控制多转子空中机器人。
另一种方法中,一些研究
视觉伺服深度学习
的工作是通过
卷积神经网络
进行的。
CNN的泛化能力优于RL
,因为RL学习的参数是特定于环境和任务的。.
本文设计了
四种卷积神经网络
模型作为
端到端视觉伺服控制器
的潜在候选。网络不使用参考图像和当前图像以外的任何类型的附加信息来
回归控制信号
。因此,所提出的网络作为实际上的控制器工作,预测速度信号,而不是相对姿态。
2.3 动态抓取
学习感知行为的视觉表征,遵循反应范式,
直接从感觉输入生成控制信号
,无需高级推理,有助于动态抓取。
强化学习方法
适用于特定类型的对象,并且仍然
依赖于某种先验知识
,因此,最近大量研究探索了将
深度学习
作为解决
闭环抓取
问题的方法。
Levine等人提出了一种
基于两个组件
的
抓取系统
。
第一部分
是
预测CNN
,其接收
图像和运动命令
作为
输入
,并
输出
通过执行这样的命令,所产生的抓取将是令人满意的
概率。第二个部分
是
视觉伺服
功能。这将使用预测CNN来选择将持续控制机器人成功抓取的命令。这称为是深度强化学习,需要很久的训练时间。
2019年,Morrison, Corke 和 Leitner 开发了一种
闭环抓取系统
,在这种系统中,
抓取检测和视觉伺服不是同时学习的
。作者
使用完全CNN获取抓取点
,并
应用基于位置的视觉伺服
,使抓取器的姿势与预测的抓取姿势相匹配。
3 本文实现的方法
VS
的
目的
是通过将
相机连续获得的图像与参考图像进行比较
,引导
操纵器
到达机器人能够完全看到物体的位置,从而满足抓取检测条件。因此,该方法的应用涵盖了所有情况,其中
机器人操作器
(相机安装在手眼模式下)必须跟踪和抓取对象。
该
系统
包括
三个阶段
:
设计阶段、测试阶段和运行阶段
。
第一个
是
基于CNN架构的设计和训练
,以及
数据集的收集和处理
。在
第二阶段
,使用
验证集
获得离线结果,并根据其准确性、速度和应用领域进行
评估
。
第三阶段
涉及在机器人上测试经过训练的网络,以
评估
其在
实时和现实应用
中的充分性。
在
运行阶段
,系统运行的要求是事先获得目标对象的图像,该图像将被VS用作设定点。只要控制信号的L1范数大于某个阈值,则执行控制回路。
单个参考图像
作为
视觉伺服CNN
的
输入
之一呈现给系统。相机当前获取的图像作为该网络的
第二个输入
,并作为
抓取CNN
的
输入
。这两个网络都连续运行,因为
抓取CNN实时预测矩形
以进行监控,
VS网络
执行
机器人姿势
的
实时控制
。
VS CNN
预测一个
速度信号
,该信号乘以比例增益λ,以应用于相机中。机器人的
内部控制器
寻找保证相机中
预测速度
的
关节速度
。在每次循环执行时,根据机器人的当前位置更新当前图像,只要控制信号不收敛,该循环就会重复。
当满足停止条件时,抓取网络的预测映射到世界坐标系。机器人通过逆运动学得到并到达预测点,然后关闭夹持器。
3.1 网络体系结构
该卷积网络架构被用于
抓取检测
。网络接收224×224×3的
RGB图像
作为
输入
,
无深度信息
。
layer 1
由
32个3×3
卷积组成,
layer 2
包含
164个卷积
。在这两种情况下,卷积运算都是通过
步长2和零填充(zero-padding)
执行的,然后是
批标准化(batch normalization)和2×2最大池化
。
layer 3
包含
96个卷积
,其中卷积使用
步长1和零填充
执行,然后仅执行
批标准化
。
layer 4
,也是最后一层,卷积层由128个卷积组成,
以步长1执行
,然后是
2×2最大池化。
在
最后一层卷积
之后,
生成的特征映射
在包含4608个元素的一维向量中被展开。进一步传递到
两个全连接(FC)层
,每个层有256个神经元。在这些层次之间,训练期间考虑
50%的dropout rate
。
最后,
输出层
由
5个神经元
组成,对应于编码抓取矩形的**(x,y,w,h,θ)
值。在
所有
层中,使用的
激活函数
都是
ReLU**,但在输出层中使用线性函数的情况除外。
3.2 Cornell 抓取数据集
为了对数据集真值进行编码,使用四个顶点的x和y坐标编译抓取矩形。
Xc和Yc参数分别表示矩形中心点的X和Y坐标,可从以下公式获得:
计算夹持器开口w和高度h,同样更具四个顶点计算:
最后,表示夹持器相对于水平轴方向的θ由下式给出:
3.3 结果评估
预测矩形(r
p
)和真值矩形(r
c
)之间的角度θ差必须在30度以内。
雅卡尔指数(交并比)需大于0.25,不用达到一般的0.25 即可
3.4 视觉伺服网络体系结构
与抓取不同,设计
用于执行机械手视觉伺服控制
的网络接收
两个图像
作为
输入
,并且必须
回归六个值
,考虑到
线性
和
角度相机速度
,这些值也可以分为
两个输出
。共有四个模型处理VS任务。
模型1-
直接回归
(最终实验效果最佳)。它基本上
与抓取网络相同
,
除了
在
第三卷积层
中包含最大池化和不同的输入维度,这导致特征图上的比例差异相同。
模型2-
任务特定回归
。网络输入被串联,第三组特征图由两个独立的层序列处理(
多任务网络
)。因此,网络以两个3D矢量的形式预测6D速度矢量。具体来说,该结构由一个共
享编码器和两个特定解码器
组成 - 一个用于
线速度
,另一个用于
角速度
。
模型3-
串联特征的直接回归
和模型4-
相关特征的直接回归
,两个模型的
结构类似
,通过关联运算符(∑)区分。
模型3简单连接
;
模型4使用相关层
。
模型3
简单地由
第三个卷积层
产生的
特征映射
连接,因此第四个层的输入深度是原来的两倍。而
模型4
有一个
相关层
,帮助网络找到每个图像的
特征表示
之间的
对应关系
。原始相关层是flow network
FlowNet
的结构单元。
3.5 VS数据集
该数据集能够有效地捕获
机器人操作环境
的属性,具有足够的多样性,以确保泛化。
机器人以
参考姿态为中心
的
高斯分布的不同姿态
,具有
不同
的
标准偏差(SD)
。
下表为
参考姿势(分布的平均值)
和
机器人假设的标准偏差集(SD)。
SD选择考虑了机器人在VS期间必须执行的预期位移值。
从
高SD
获得的图像有助于网络了解机器人产生
大位移
时
图像
空间中产生的
变化
。
当参考
图像
和当前图像非常
接近
时,从
低SD
获得的实例能够
减少
参考图像和当前图像之间的
误差
,从而在稳态下获得良好的精度。
平均SD值有助于网络在大部分VS执行期间进行预测。
获得数据后,数据集以**(I,[x,y,z,α,β,γ])
的形式构造,其中
图像
为
I**,**[x,y,z,α,β,γ]**是拍摄该图像时对应的相机姿态。
α, β, γ为泰特-布莱恩角内旋(按照Z-Y-X变换)
已处理数据集的每个实例都采用(I
d
, I
c
,
d
H
c
)表示。I
d
是选择作为所需图像的随机实例;I
c
选择另一个实例作为当前图像;
d
H
c
是二者的变换。
通过
齐次变换矩阵
形式表示每个姿势(由
平移和欧拉角
表示)来实现(
0
H
c
和
0
H
c
),然后获得
d
H
c
=
0
H
d
-1
0
H
c
最后,对于实际上是
控制器
的网络,其目的是其
预测
相机的
速度信号
,即。E控制信号。 (I
d
, I
c
,
d
H
c
) 被转化为(I
d
, I
c
,V
c
)
Vc
是比例相机速度。由于在确定标记比例速度时不考虑λ增益,因此使用了
周期性项
,并且在
控制执行期间
必须对
λ增益
进行
后验调整
。
速度Vc由
d
H
c
表示:
其中,
R
是
旋转矩阵
;**r
ij
**同一矩阵第i行和第j列的元素;
c∗
t
c
是与当前相机位置到期望相机位置的平移向量;λ是比例增益(初始设置为1)
声明:
本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:
https://www.wpsshop.cn/w/2023面试高手/article/detail/502298
推荐阅读
article
云贝
餐饮连锁V2-2.
9
.
9
源码...
网站环境:Nginx 1.15.10 + MySQL 5.6.46 + PHP-7.1-7.3。
云贝
餐饮连锁V2独立版、...
赞
踩
article
【
大
模型
实践】
ChatGLM3
微调输入-输出
模型
(六)_
chatglm3
prompt
...
ChatGLM3
是智谱AI和清华
大
学 KEG 实验室联合发布的新一代对话预训练
模型
。
ChatGLM3
-6B 是 Cha...
赞
踩
article
马化腾
发飚了:
很多
业务
该砍就要砍
_
马化腾
发飙
原因
...
新时代,腾讯在变!
_
马化腾
发飙
原因
马化腾
发飙
原因
最近在腾讯内部...
赞
踩
article
04_
c
/
c
++开源库
json
解析
json
c
pp库...
c
++
json
字符
解析
。04_
c
/
c
++开源库
json
解析
json
c
pp库 ...
赞
踩
article
JMeter
测试结果分析_
jmeter
生成
jtl
文件
...
JMeter
测试结果分析_
jmeter
生成
jtl
文件
jmeter
生成
jtl
文件
...
赞
踩
article
如何才能
提高
团队
工作
效率
_指在
一个
组织
中
,
依
成员
工作
性质、能力组成各种小组
,
参与
组织
各项决定和解决问...
团队
管理指在
一个
组织
中,依
成员
工作
性质、能力组成各种小组,参与
组织
各项决定和
解决问题
等事务,以
提高
组织
生产力和达成
组织
目...
赞
踩
article
大麦
网抢票
(
2.0
)版
_
怎么解决
大麦
网页
不支持
购买
...
近日小编同事很想去看某明星的演唱会,但苦于一票难求,同时网上的抢票代码和教程和目前的
大麦
网目前的网站抢票流程也有较大的变...
赞
踩
article
怎么查找
Linux
服务器
是否有
后门
账户
_
linux
查看隐藏
用户
命令
...
依据我们SINE安全15年的安全从业经验来看,检查
Linux
服务器
里是否被植入隐藏的系统
账户
后门
,可以编辑一下/etc/...
赞
踩
article
Github2024
-04-25
开源
项目
日报
Top10
...
根据Github Trendings的统计,今日(2024-04-25统计)共有10个
项目
上榜。
Github2024
-0...
赞
踩
article
Map
集合
和
Collections
(
集合
工具类)_
collections
工具类中的binarysea...
Map
集合
将键映射到值的对象。一个映射不能包含重复的键。每个键最多只能映射到一个值。
Map
接口和Collection接口...
赞
踩
article
easyconnect
mac
版下载地址...
下载地址如下:xhttp://download.sangfor.com.cn/download/produ...
赞
踩
article
【
C++
】
string
的
深
浅
拷贝
问题
_
string
深
拷贝
...
C++
中的
深
拷贝
与浅
拷贝
_
string
深
拷贝
string
深
拷贝
...
赞
踩
article
FPGA
设计
时序
约束
用法详细说明大全终章...
如果
约束
S为0,不存在clkin2驱动的ff_case到o_case的路径;该操作是可以的,也存在相关场景,但是会存在一...
赞
踩
article
如何
排查
网站
及
APP
数据
泄露
的源头_
网站
漏洞
如何
溯源...
若get post head请求响应,返回的
数据
包里中含有用户敏感信息,建议大家对该返回的
数据
进行加密,或者脱敏,(AP...
赞
踩
article
元
学习
在
自动
驾驶
中的应用...
1.背景介绍
自动
驾驶
技术是近年来迅速发展的一个领域,它涉及到多个技术领域的集成,包括计算机视觉、机器
学习
、人工智能、控制...
赞
踩
article
HTML
随机
点名
程序...
HTML
随机
点名
程序
HTML
随机
点名
程序 案例要求 1.点击
点名
按钮,名字界面随机显示,按钮文字...
赞
踩
article
《
isp
图像
工程师
—
—
图像
基础知识
学习笔记二》...
照度为一亮度单位,顾名思义,是指摄像机在摄取影像时,对周围环境照明亮度的需求,1LUX大约等于1烛光在1米距离的照度,我...
赞
踩
article
性能
测试
入门 —
LoadRunner
使用
初探...
前言:
性能
测试
是利用产品、人员和流程来降低应用程序、升级程序或补丁程序部署风险的一种手段。
性能
测试
的主要思想是通过模拟产...
赞
踩
article
怎么
进入
docker
容器
并执行_
docker
进入
容器
并
执行命令
...
怎么
进入
docker
容器
并执行_
docker
进入
容器
并
执行命令
docker
进入
容器
并
执行命令
...
赞
踩
article
springboot
+
mysql
高校
教学
管理系统
-计算机
毕业设计
源码32780...
图3-1 用户用例图
高校
教学
管理系统
在对需求做解析后,整个系统主要分为管理员和教师用户,学生用户,每个模块下的分支功能不...
赞
踩
相关标签
小程序
php
前端
开源
开源软件
深度学习
人工智能
python
职场人生
原创
职场和发展
c语言
c++
jmeter
测试工具
项目管理
经验分享
chrome
linux后门排查
服务器后门查找
Github趋势分析
开源项目
Python
Golang