赞
踩
本精要由珠海科技学院学生自行从课本教材和课堂笔记整理,用于珠海科技学院智能机器人技术及应用期末复习,不作商业用途。
本精要只摘录课堂重点及可能的考试重点,遵循的原则是“多一个字不多,少一个字不少”,对细节部分和考纲无关内容不会过多阐述,只用于巩固复习和考前备战,如需系统学习智能机器人技术及应用请参考相关书籍和课程。
对于本精要的超重点部分会用高亮提示,关键词部分会用加粗提示。
本精要针对重要考点都添加了考点提示,可根据自身的需要进行针对性地学习。
更新版本:已完结。
机器人技术涉及机械、电子、计算机、材料、传感器、控制技术、人工智能、仿生学等多门科学。
机器人的发展是目前科技发展最活跃的领域之一,发展应用机器人的目的在于:
1942年,美国科幻巨匠阿西莫夫提出的“机器人三定律”虽只是科幻小说里的创造,但已成为学术界默认的研发原则:
考点:根据实际例子判断机器人层次
机器人现在已被广泛地用于生产和生活的许多领域,按其拥有智能的水平可以分为三个层次:
(1) 示教再现型:示教再现型机器人只能死板地按照人给它规定的程序工作,不管外界条件有何变化,自己都不能对程序也就是对所做的工作作相应的调整。如果要改变机器人所做的工作,必须由人对程序作相应的改变,因此它是毫无智能的。
(2) 感觉型:感觉型机器人可以根据外界条件的变化,在一定范围内自行修改程序,也就是它能适应外界条件变化对自己怎样作相应调整。不过,修改程序的原则由人预先给以规定。感觉型机器人拥有初级智能水平,没有自动规划能力,目前已走向成熟,达到实用水平。
(3) 智能型:高级智能机器人已拥有一定的自动规划能力,能够自己安排自己的工作。这种机器人可以不要人的照料,完全独立的工作,故称为高级自律机器人。
考点:判断例子中采用的架构是否合理
程控架构:又称规划式架构,它根据给定初始状态和目标状态给出一个行为动作的序列,按部就班地执行。程序序列中可采用“条件判断+跳转”的方法,根据传感器的反馈情况对控制策略进行调整。
优点:
系统结构简单明了,所有逻辑决策和计算均在集中式的控制器中完成。
这种架构清晰,显然控制器是大脑,其他的部分不需要有处理能力。设计者在机器人工作前预先设计好最优策略让机器人开始工作,工作过程中只需要处理一些可以预料到的异常事件。
缺点:
对于设计一个在房间里漫游的移动机器人时,若其房间的大小未知,无法准确地得到机器人在房间中的相对位置的情况下,程控式控制架构就很难适应了。
分层递阶架构:又称为慎思式架构。分层递阶架构是随着分布式控制理论和技术的发展而发展起来的。分布式控制通常由一个或多个主控制器和很多个节点组成,主控制器和节点均具有处理能力。
主控制器可以比较弱,大部分的非符号化信息在其各自的节点被处理、符号化后,再传递给主控制器来进行决策判断。
优点
遵循“感知—思维—行动”的基本规律,较好地解决了智能和控制精度的问题。层次向上智能增加,精度降低,层次向下,智能降低,精度增加。
缺点:
输入环境的信息通过信息流程的所有模块,往往是将简单问题复杂化,影响了机器人对环境变化的响应速度。
各模块串行连接,其中任何一个模块的故障直接影响整个系统的功能。
包容式架构:又称为基于行为、基于情境的结构,是一种典型的反应式结构。
1986年,美国麻省理工学院的R.Brooks以移动机器人为背景提出了这种依据行为来划分层次和构造模块的反应式结构。
Brooks认为机器人行为的复杂性反映了其所处环境的复杂性,而非机器人内部结构的复杂性。
包容式体系结构是一种完全的反应式体系结构,是基于感知与行为(SA)之间映射关系的并行结构。
包容结构中每个控制层直接基于传感器的输入进行决策,在其内部不维护外界环境模型,可以在完全陌生的环境中进行操作,结构如下图所示。
优点
包容结构中没有环境模型,模块之间信息流的表示也很简单,反应性非常好,其灵活的反应行为体现了一定的智能特征。包容结构不存在中心控制,各层间的通信量极小,可扩充性好。多传感信息各层独自处理,增加了系统的鲁棒性,同时起到了稳定可靠的作用。
缺点
包容结构过分强调单元的独立、平行工作,缺少全局的指导和协调,虽然在局部行动上可显示出很灵活的反应能力和鲁棒性,但是对于长远的全局性的目标跟踪显得缺少主动性,目的性较差,而且人的经验、启发性知识难于加入,限制了人的知识和应用。
包容式架构机器人提供了一个高鲁棒性、高适应能力和对外界信息依赖更少的控制方法。但其致命弱点是效率低下。因此对于一些复杂情况,需要融合应用程控架构、分层递阶架构和包容式架构。
Gat提出的混合式三层体系结构,分别是:反应式的反馈控制层,反应式的规划―执行层和规划层。
混合式架构在较高级的决策层面采用程控架构,以获得较好的目的性和效率;在较低级的反应层面采用包容式架构,以获得较好的环境适应能力、鲁棒性和实时性。
1998年,Piaggio提出一种称为混合智能机器人专家(HEIR)的非层次的分布式结构。
分布式结构由符号组件(S)、图解组件(D)和反应组件®三部分组成,如图所示。
分布式结构每个组件处理不同类型知识,是一个由多个具有特定认知功能、可以并发执行的Agent构成的专家组。
各组件相互间通过信息交换进行协调,没有层次高低之分,自主地、并发地工作。
将进化计算理论与反馈控制理论相结合,形成了一个新的智能控制方法——进化控制。它能很好地解决移动机器人的学习与适应能力方面的问题。
2000年,蔡自兴提出了基于功能/行为集成的自主式移动机器人进化控制体系结构。
整个体系结构包括进化规划与基于行为的控制两大模块,如右图所示,这种综合的体系结构的优点是既具有基于行为的系统的实时性,又保持了基于功能的系统的目标可控性同时该体系结构具有自学习功能,能够根据先验知识、历史经验、对当前环境情况的判断和自身的状况,调整自己的目标、行为,以及相应的协调机制,以达到适应环境、完成任务的目的。
1999年,Rooney等根据社会智能假说提出了一种由物理层、反应层、慎思层和社会层构成的社会机器人体系结构,如下图所示。
会出大题,主重点:底盘设计
轮式移动机构、履带式移动机构、足式移动机构、步进式移动机构、蠕动式移动机构、蛇行式移动机构、混合式移动机构
移动机构的选择通常基于以下原则:
轮式移动机构的效率最高,但其适应能力、通行能力相对较差。
履带机器人对于崎岖地形的适应能力较好,越障能力较强。
腿式的适应能力最强,但其效率一般不高。为了适应野外环境,室外移动机器人需要多采用履带式行动机构。
一些仿生机器人则是通过模仿某种生物的运动方式而采用相应的移动机构,如机器蛇采用蛇行式移动机构,机器鱼则采用尾鳍推进式移动机构。
在软硬路面相间、平坦与崎岖地形特征并存的复杂环境下,采用几何形状可变的履带式和复合式(包括轮-履式、轮-腿式、轮-履-腿式等)。
轮式移动机构根据车轮的多少分为1轮、2轮、3轮、4轮和多轮机构。
1轮及2轮移动机构存在稳定性问题,所以实际应用的轮式移动机构多采用3轮(至少需要3个)和4轮(4轮最普遍)。
驱动轮的选择通常基于以下因素考虑:(如何选轮)
根据移动特性可将轮式机器人分为非全向和全向两种:
由于全向轮机构特点的限制,要求驱动轮数大于等于3,才能实现水平面内的全向移动,并且行驶的平稳性、效率和全向轮的结构形式有很大关系
优点:
缺点:
同步带一旦选定,长度、宽度就是固定的,因此基本上属于定制,设计不同的履带式平台就需要不同的同步带,这限制了同步带作为履带应用的灵活性。
优点:
单独的履块简单,可以用注塑成型的方法制造,可以以单节履块为单位任意增减,因此具有较好的灵活性;单个履块上可以装配各种类型的履带齿,适应不同地形。而且活节履带的履块中部可以设计侧向限位块,带轮无须挡边就可以防止履带从带轮侧面脱出。
缺点:
由于各履块之间靠连杆连接,因此连杆处受力较大,整个履带的承载能力弱于同步带式履带,并且活节履带由于履块为刚性结构,理论效率较同步带式履带低,运行噪音也会较大。
一体式专用履带基本结构采用同步带的形式,具备侧向定位,因此能很好地避免履带脱出且效率高承载力大。但是履带设计较复杂,成本较高,多用于大型机器人。
优点:
移动机器人的驱动系统包括执行器的驱动系统和机器人本体的驱动系统。驱动系统主要采用以下几种驱动器:电动机(包括伺服电机、步进电机、直接驱动电机),液压驱动器,气动驱动器,形状记忆金属驱动器,磁性伸缩驱动器。其中,电动机尤其是伺服电机是最常用的机器人驱动器。
机器人驱动系统中的电机不同于一般的电动机,它具有下列特点及要求:
从结构上讲目前的直流伺服电动机,就是小功率的直流电动机。直流伺服电动机的优点表现在:
具有较大的转矩,以克服传动装置的摩擦转矩和负载转矩;
调速范围宽,且运行速度平稳;
具有快速响应能力,可以适应复杂的速度变化;
电机的负载特性硬,有较大的过载能力,确保运行速度不受负载冲击的影响。
交流伺服电动机本质上是一种两相异步电动机。其控制方法主要有三种:幅值控制、相位控制和幅相控制。这种电动机的优点是结构简单、成本低、无电刷和换向器;缺点是易产生自转现象、特性非线性且较软、效率较低。
无刷直流电机是在有刷直流电动机的基础上发展来的,可以分为无刷速率电机和无刷力矩电机。无刷直流电机为了减少转动惯量,通常采用“细长”的结构,在重量和体积上要比有刷直流电机小得多,相应的转动惯量可以减少40%-50%左右。其机械特性和调节特性的线性度好、调速范围广、寿命长、维护方便、噪声小,不存在因电刷而引起的一系列问题。
直线电机是一种特殊的无刷电机,可以理解为将无刷电机沿轴线展开,铺平;定子上的绕组被平铺在一条直线上,而永久磁钢制
成的转子放在这些绕组的上方。
给这些排成一列的绕组按照特定的顺序通电,磁钢就会受到磁力吸引而运动。控制通
电的顺序和规律,就可以使磁钢作直线运动。
空心杯直流电机属于直流永磁电机,与普通有刷、无刷直流电机的主要区别采用是无铁芯转子,也叫空心杯型转子。该转子是直接采用导线绕制成的,没有任何其他的结构支撑这些绕线,绕线本身做成杯状,就构成了转子的结构。
步进电动机是将电脉冲信号变换为相应的角位移或直线位移的元件,其角位移和线位移量与脉冲数成正比。转速或线速度与脉冲频率成正比。
步进电机的最大特点就是可以直接接受计算机的方向和速度的控制,控制信号简单,便于数字化,而且具有调速方便、定位准确、抗干扰能力强、误差不长期累积等优点。
舵机,顾名思义是控制舵面的电动机。舵机的出现最早是作为遥控模型控制舵面、油门等机构的动力来源,但是由于舵机具有很多优秀的特性,在制作机器人时也时常能看到它的应用。
对机器人电源的选用通常有如下考虑:
考点:密度,大电流放电能力,循环寿命
内容 | 铅酸蓄电池 | 镍镉电池 | 镍氢电池 | 锂离子电池 | 锂聚合物电池 |
---|---|---|---|---|---|
能量 | 30-50Wh/kg | 35-40Wh/kg | 60-80Wh/kg | 90-110Wh/kg | ~130Wh/kg |
密度 | 差 | 差 | 一般 | 较好 | 非常好 |
大电流放电能力 | 非常好 | 非常好 | 较好 | 较好 | 较好 |
可维护性 | 非常好 | 较好 | 好 | 一般 | 较好 |
循环寿命 | 400-600次 | 300-500次 | 800-1000次 | 500-600次 | 500-600次 |
放电曲线性能 | 好 | 好 | 一般 | 非常好 | 较好 |
安全性 | 非常好 | 较好 | 较好 | 一般 | 较好 |
价格 | 低 | 低 | 较低 | 高 | 高 |
记忆效应 | 轻微 | 严重 | 较轻 | 轻微 | 轻微 |
考点:大重点,会出大题
机器人感知系统本质是一个传感器系统。机器人感知系统的构建包括:系统需求分析、环境建模、传感器的选择等。
感知行为按照复杂度分为以下几个等级:
人类具有5种感觉,即视觉、嗅觉、味觉、听觉和触觉。机器人有类似人一样的感觉系统,Asimo机器人的传感器分布。机器人则是通过传感器得到这些信息的,这些信息通过传感器采集,通过不同的处理方式,可以分成视觉、力觉、触觉、接近觉等几个大类。
考点:内外传感器辨析
内部传感器通常用来确定机器人在其自身坐标系内的姿态位置,是完成移动机器人运动所必需的那些传感器。(与环境无关)
检测内容 | 传感器的方式和种类 |
---|---|
倾斜(平衡) | 静电容式、导电式、铅垂振子式、浮动磁铁式、滚动球式 |
方位 | 陀螺仪式、地磁铁式、浮动磁铁式 |
温度 | 热敏电阻、热电偶、光纤式 |
接触或滑动 | 机械式、导电橡胶式、滚子式、探针式 |
特定的位置或角度 | 限位开关、微动开关、接触式开关、光电开关 |
任意位置或角度 | 板弹簧式、电位计、直线编码器、旋转编码器 |
速度 | 陀螺仪式 |
角速度 | 内置微分电路的编码器 |
加速度 | 应变仪式、伺服式 |
角加速度 | 压电式、振动式、光相位差式 |
注意:编码器(在内)编码器,(在外)轮速传感器,是内外传感器的交集
外传感器用于机器人本身相对其周围环境的定位,负责检测距离、接近程度和接触程度之类的变量,便于机器人的引导及物体的识别和处理。按照机器人作业的内容,外传感器通常安装在机器人的头部、肩部、腕部、臀部、腿部、足部等。
多传感器信息融合技术是通过对这些传感器及其观测信息的合理支配和使用,把多个传感器在时间和空间上的冗余或互补信息依据某种准则进行组合,以获取被观测对象的一致性解释或描述。
为获取较好的感知效果,移动机器人的多传感器有着不同的分布形式:
考点:实例辨析
考点:传感器是测量什么的 使用范围 测量原理
机器人测距系统主要完成如下功能:
超声波是频率高于20KHz的声波,它方向性好,穿透能力强,易于获得较集中的声能。脉冲回波法通过测量超声波经反射到达接收传感器的时间和发射时间之差来实现机器人与障碍物之间的测距,也叫渡越时间法。该方法简单实用,应用广泛。
红外辐射俗称红外线,是一种不可见光,其波长范围大致在0.76~1000μm。工程上把红外线所占据的波段分为四部分,即近红外、中红外、远红外和极远红外。红外传感系统按照功能能够分成五类:
扫描运动位于由物体到检测器和由检测器到激光发射器两直线所确定的平面内,检测器聚焦在表面很小的一个区域内。因为光源与基线之间的角度和光源与检测器之间的基线距离已知,可根据几何关系求出被测物体和检测器之间的距离。
绝对型编码器能提供运转角度范围内的绝对位置信息,工作原理如图所示。
图中示意了从发光管经过分光滤镜等光学组件,通过编码盘的透射光被光学敏感器件检测到的原理。
典型的增量式编码器由一个红外对射式光电传感器和一个由遮光线和空隔构成的码盘组成。当码盘旋转时,遮光线和空隔能阻拦红外光束或让其通过。为计算绝对位置,增量型编码器通常需要集成一个独立的通道——索引通道,它可以在每次旋转到定义的零点或原点位置时提供一个脉冲。通过计算来自这个原点的脉冲,可以计算出绝对位置。
电位计就是带中心抽头的可变电阻。旋转电位计通常具有一个轴,轴旋转的时候电位计的抽头会在电阻丝上移动。
使用它们作为角位移传感器的时候要注意两点:
旋转电位计都是采用电阻丝作为传感元件。属于接触式测量,会有磨损,寿命有限,因此不宜用在高速频繁旋转的场合;
由于制造工艺原因,同一型号的多个旋转电位计会有一定误差。通常这个误差在5%~10%。因此无法用于高精度的角位移测量。
一般认为触觉包括接触觉、压觉、滑觉、力觉四种,狭义的触觉按字面上来看是指前三种感知接触的感觉。触觉传感器可以具体分为集中式和分布式(或阵列式)。
集中式传感器的特点是功能单一,结构简单。
分布式传感器可以检测分布在面状物体上的力或位移。
通常我们将机器人的力传感器分为三类:
力觉传感器是从应变来测量力和力矩的,所以如何设计和制作应变部分的形状,恰如其分地反映力和力矩的真实情况至关重要。
移动机器人在行进的时候可能会遇到各种地形或者各种障碍。这时即使机器人的驱动装置采用闭环控制,也会由于轮子打滑等原因造成机器人偏离设定的运动轨迹,并且这种偏移是旋转编码器无法测量到的。这时就必须依靠电子罗盘或者角速率陀螺仪来测量这些偏移,并作必要的修正,以保证机器人行走的方向不至偏离。
指南针就是一种机械式磁罗盘。早期的磁罗盘将磁针悬浮于水面或者悬置于空中来获取航向。现在的机械式磁罗盘系统将环形磁铁或者一对磁棒安装于云母刻度盘上,并将其悬浮于装有水与酒精或者甘油混合液的密闭容器中。
磁通门罗盘是在磁通门场强计的原理上研制出来的,它除了可应用在陆地的各种载体上之外,还广泛地应用在飞行体、舰船和潜水设备的导航与控制上。其主要优点是灵敏度高、可靠性好、体积小和启动快。
当在矩形霍尔元件中通以电流I,并外加磁场B,磁场方向垂直于霍尔元件所在平面时,霍尔元件中的载流子在洛仑兹力的作用下运动将发生偏转,在霍尔元件上下边缘出现电荷积聚,产生一电场,该电场称为霍尔电场。达到稳态时霍尔电场和磁场对载流子的作用互相抵消,载流子恢复初始的运动方向,从而使霍尔元件上下边缘产生电压差,称为霍尔电压。
磁阻式罗盘是利用磁阻元件制作而成的罗盘。磁阻元件可以分为各向异性磁阻元件和巨磁阻元件。
这类传感器利用的是一种镍铁合金材料的磁阻效应工作的,给镍铁合金制成的薄片通上电流,磁场垂直于该薄片的分量将改变薄片的磁极化方向,从而改变薄片的电阻。这种合金电阻的变化就叫做磁阻效应,并且这种效应直接与电流方向和磁化矢量之间的夹角有关。这种电阻变化可由惠斯通电桥测得。
绕一个支点高速转动的刚体称为陀螺。在一定的初始条件和一定的外力矩在作用下,陀螺会在不停自转的同时,还绕着另一个固定的转轴不停地旋转,这就是陀螺的旋进,又称为回转效应。
陀螺传感器检测随物体转动而产生的角速度它可以用于移动机器人的姿态,以及转轴不固定的转动物体的角速度检测。陀螺式传感器大体上有速率陀螺仪、位移陀螺仪、方向陀螺仪等几种,在机器人领域中大都使用速率陀螺仪(rate gyroscope)。
为抑制振动,有时在机器人的各个构件上安装加速度传感器测量振动加速度,并把它反馈到构件底部的驱动器上。有时把加速度传感器安装在机器人的手爪部位,将测得的加速度进行数值积分,然后加到反馈环节中,以改善机器人的性能。
姿态/航向测量单元”简称AHRS,是一种集成了多轴加速度计、多轴陀螺仪以及电子磁罗盘等传感器的智能传感单元。AHRS依靠这些传感器的数据,通过捷联航姿解算,可以以50-200Hz的速率输出实时测量的XYZ三轴的加速度、角速率,以及航向角、滚转角和俯仰角。具备AHRS的机器人可以实时地知道自己的姿态和航向,也可以获得实时的角速率、加速度等信息,这对于机器人的运动控制、时空认知有很大的意义。
一种方法是测量视野内各点在透镜聚焦的位置,以推算出透镜和物体之间的距离;另一种方法是移动摄像机,拍摄到对象物体的多个图像,求出各个点的移动量再设法复原形状。
双眼立体视觉是被动视觉传感器中最常用的方式。已知两个摄像机的相对关系,基于三角测量原理可计算出的三维位置。
随着物联网、车联网与智能家居概念的宣传,ZigBee开始进入我们的视线。ZigBee基于IEEE 802.15.4标准,由ZigBee联盟制定,具有自组网、低速率、低功耗的特点,尤其适合小型设备组网的需要。
Wifi被广泛应用于笔记本电脑、手机、平板电脑中,用于支持设备通过无线的方式连接互联网。Wifi的通信吞吐率很高,且与现存的网络设备具有良好的兼容性。
蓝牙技术的创始人是爱立信公司,用于手机与外围设备的连接,如蓝牙耳机、蓝牙GPS等。蓝牙使用时分双工的模式来实现全双工通讯,是一种特殊的2.4 G无线技术,遵循IEEE802.15.1协议。蓝牙具有通讯速率快、连接简单、全球通用、功耗低等特点,广泛用于手机、计算机、娱乐外围设备之中。
IrDA使用红外线进行通讯,是一种低成本的通讯方案。该标准制定了一个半双工的通讯系统,通讯范围1m左右,传输角度30到60度。因为使用红外线作为通讯媒介,IrDA的数据传输率最大可以达到4Mbps。IrDA较大的劣势就是其对传输路径的要求比较高,传输距离、收发角度都有限制,减小了它的应用领域。
与传统意义上的有线电话网络或者无线蜂窝网络通信系统不同,移动机器人通信的主体是移动机器人,由于其应用背景的不同,而对于通信系统的要求有很大区别。对于特殊环境应用的移动机器人,需要特别关注以下几方面:
在移动机器人系统中,能够实时提取机器人系统的信息和发送控制指令是十分必要的。通信系统应当能够提供较好的通信质量,尽量降低网络延迟。对于多移动机器人系统的视频数据传输等场合,这一点尤其必要。对于战场或科学考察等重大意义场合,要求机器人的通信系统具有出色的健壮性,以确保设备回收或者数据反馈。
由于机器人采用自身电池供电,不但要提供通信所需电能,更要为行走、实物操作等对能量有较大需求的模块提供能量。但是其能量极其有限,这关系着系统的生存能力和安全性。一般来讲通信模块能量的消耗,包括发射能耗、计算能耗、存储能耗。因此,在设计移动机器人的通信系统时,有必要考虑其能量特性,尽可能采用能量消耗较少的系统设计。
通信模块过大,会带来安装上的不便,同时还会给机器人驱动模块带来额外的负荷,降低机器人的灵活性,限制其应用场合。
综合以上特点,设计移动机器人通信系统时需要考虑以下几个因素:
机器人通信系统在工作时间内、在一定条件下无故障地执行指定功能的能力。
机器人的电能利用效率是否达标。
带宽(band width)是指在固定的时间可传输资料数量,亦即在传输管道中可以传递数据的能力。对于数字信号而言,带宽指单位时间能通过链路的数据量。
QoS(Quality of Service,服务质量)指一个网络能够利用各种基础技术,为指定的网络通信提供更好的服务能力,是网络的一种安全机制, 是用来解决网络延迟和阻塞等问题的一种技术。
考点:什么时候用有线何时无线
有线通信与无线通信方案的考虑
有线通信 | 无线通信 | |
---|---|---|
优势 | ①信号稳定,抗干扰效果好 ②对人体辐射小,安全可靠 | ①方便快捷 ②投资小 |
劣势 | ①有固定线的束缚,不够方便 ②投资建设成本大 | ①信号不稳定,易被干扰 ②安全问题,任何同频率的信号都有可能控制机器人或使得信号拥塞 ③频谱是一个稀缺资源,使用无线信道需要协调 |
一般来说,机器人之间的通信可以分为隐式通信和显式通信两种模式。
显式通信包括直接通信和间接通信两种。
要求发送者和接收者保持一致,即通信时发送者和接收者同时在线,因此需要一种通讯协议。
不需要发送者与接收者保持一致。广播是一种间接通信类型,它不要
求一定有接收者,也不保证信息是否正确地传送给接收者。监听(或观察)
是另一种类型的间接通信,它侧重于信息接收者接收信息的方式。
隐式通信是指多机器人系统通过外界环境和自身传感器来获取所需的信息并实现相互之间的协作,机器人之间没有通过某种共有的规则和方式进行数据转移和信息交换来实现特定含义信息的传递。
多机器人系统感知问题时,多机器人系统就充分利用了基于自身传感器信息的隐式通信,通过感知环境的变化,并依据机器人内部一定的推理、理解模型来进行相应的决策和协作。
机器人在通过传感器获取外界环境信息的同时也可能获取到其它机器人遗留在环境中的某些特定信息,从而进行信息传递。
在计算机系统中,目前常用的通信模型有“客户/服务器”模型(C/SClient/Server)和“点对点”模型(P2P: Peer-to-Peer)。
在基于C/S模型的通信系统中,机器人之间的通信必须通过服务器“中转” ,系统具有中心服务器,所有客户进程与服务器进程进行双向通信,客户进程间无直接通路。
C/S通信模型如图所示,C/S通信适用于需要集中控制的场合,其结构简单,易于实现,便于错误诊断及系统维护。一方面,中心服务器利用其特殊地位了解各客户机的需求,这有利于对客户进程的管理以及实现通信资源的合理分配与调度。另一方面,客户间进程通信效率低,中心服务器工作负荷大,其错误会导致整个系统的崩溃。
如图4.6所示,P2P通信模型由中心结构改变为分布式结构,节点间通信不经过中心服务器的转发,而是直接进行通信,提高了通信效率。系统运行不依赖于模型中某个节点,因此系统负载较为均衡、可靠性高。
P2P 模型中,由于智能体的对等特性,那么每个智能体都要保存所有智能体的状态信息,增加了本地的存储负担,智能体内部状态的任何变化都必须及时通知其它智能体,增加了网络通信负担;每个智能体都必须处理控制或调度相关的计算,增加了系统负担。
考点:可能出大题
视觉传感系统图像处理的一般流程如图所示:
图像预处理的目的就是增强图像,以便为后续过程做好准备。
图像平滑是指用于突出图像的宽大区域、低频成分、主干部分或抑制图像噪声和干扰高频成分的图像处理方法,目的是使图像亮度平缓渐变,减小突变梯度,改善图像质量。
图像分割就是把图像分成各具特征的区域并提取出感兴趣目标的技术和过程,这里的特征可以是灰度、颜色、纹理等。
图像分割可被粗略分为三类:
特征提取就是提取目标的特征,也是图像分析的一个重点。
最常见的图像特征包括:线段、区域和特征点。点特征提取主要是明显点,如角点,圆点等。
根据预定的算法对图像进行图像识别,或区分出合格与不合格产品,或给出障碍物的分类,或给出定量的检测结果。
视觉传感器一般由图像采集单元、图像处理单元、图像处理软件、通信装置、I/O接口等构成,如图所示。
照明系统的主要任务是以恰当的方式将光线投射到被测物体上,从而突出被测特征部分的对比度。照明系统直接关系到检测图像的质量,并决定后续检测的复杂度。
镜头是视觉传感系统中的重要组件,对成像质量有着关键性的作用。
根据焦距能否调节,镜头可分为定焦距镜头和变焦距镜头两大类。
镜头主要性能指标如下:
在选取镜头时,一般从以下几个方面入手进行考虑:
摄像机是机器视觉系统中的一个核心部件,其功能是将光信号转变成有序的电信号。摄像机以其小巧、可靠、清晰度高等特点在商用与工业领域都得到了广泛地使用。
人眼的深度感知能力(Depth Perception),主要依靠人眼的如下几种机能:
立体视觉系统可以划分为以下六个模块:
通过二维图像获取深度信息。具体步骤如下:
立体视觉的测量过程如下:
视觉系统接收来自场景发射或反射的光能量,形成有关场景光能量分布函数,即灰度图像,然后在这些图像的基础上恢复场景的深度信息。最一般的方法是使用两个相隔一定距离的摄像机同时获取场景图像来生成深度图。另一种方法是一个摄象机在不同空间位置上获取两幅或两幅以上图像,通过多幅图像的灰度信息和成象几何来生成深度图。
主动视觉强调以下两点:
视觉跟踪系统
1. 视觉跟踪系统构成
根据摄像机与场景目标的运动状态,可以分为以下四类:
(1) 摄像机静止/目标静止
(2) 摄像机静止/目标运动
(3) 摄像机运动/目标静止
(4) 摄像机运动/目标运动
根据摄像机与场景目标的运动状态,可以分为以下四类:
基于对比度分析的的目标追踪是利用目标与背景在对比度上的差异来提取、识别和跟踪目标。检测图像序列相邻两帧之间变化的最简单方法是直接比较两帧图像对应像素点的灰度值.在这种最简单的形式下,帧f(x,y,j)与帧f(x,y,k)之间的变化可用一个二值差分图像表示。
光流法是基于运动检测的目标跟踪代表性算法。光流是空间运动物体在成像面上的像素运动的瞬时速度,光流矢量是图像平面坐标点上的灰度瞬时变化率。光流的计算是利用图像序列中的像素灰度分布的时域变化和相关性来确定各自像素位置的运动。
基于匹配的目标跟踪算法需要提取目标的特征,并在每一帧中寻找该特征。 寻找的过程就是特征匹配过程。目标跟踪中用到的特征主要有几何形状、子空间特征、外形轮廓和特征点等。其中,特征点是匹配算法中常用的特征。特征点的提取算法很多, 如Kanade Lucas Tomasi(KLT)算法、Harris 算法、SIFT(尺度不变特征变换 ) 算法以及SURF 算法等。
Mean shift算法称为均值偏移方法,其基本思想是对相似度概率密度函数或者后验概率密度函数采用直接的连续估计。Mean Shift 跟踪算法采用彩色直方图作为匹配特征,反复不断地把数据点朝向MeanShift 矢量方向进行移动,最终收敛到某个概率密度函数的极值点。
核函数是Mean Shift 算法的核心,可以通过尺度空间差的局部最大化来选择核尺度,若采用高斯差分计算尺度空间差,则得到高斯差分Mean Shift 算法。
考点:小重点
视觉伺服是利用机器视觉的原理,直接基于图像反馈信息,快速进行图像处理,在尽量短的时间内给出控制信号,构成机器人的位置闭环控制。
1. 根据摄像机的数目分类
2. 根据摄像机放置位置分类
3. 根据误差信号分类
图像处理,包括特征的选择及匹配,仍然是视觉伺服在实际应用中的瓶颈问题。而对于特征的选择和匹配,如何提高其鲁棒性仍然是面临的主要问题。多视觉信息融合的方法以及自动特征选择的方法具有良好的发展前景。
视觉伺服所面临的主要问题主要有以下两方面:
稳定性
实时性
被动视觉导航是依赖于可见光或不可见光成像技术的方法。CCD相机作为被动成像的典型传感器,广泛应用于各种视觉导航系统中。
主动视觉导航是利用激光雷达、声纳等主动探测方式进行环境感知的导航方法。例如,1997年着陆的火星探路者号使用编码激光条纹技术进行前视距离探测,可靠地解决了未知环境中的障碍识别问题。
单目视觉的特点是结构和数据处理较简单,研究的方向集中在如何从二维图像中提取导航信息,常用技术有阈值分割、透视图法等。
一个完整的立体视觉系统分为图像获取、摄像机标定、特征提取、立体匹配、深度确定及内插重建等几部分。
立体匹配是立体视觉中最困难的一步。立体匹配方法必须解决三个问题:正确选择图像的匹配特征;寻找特征间的本质属性;建立正确的匹配策略。
基于地图的导航是发展较早的机器人导航方法。自然地标和人工地标是地标跟踪的两个分类。
地图生成型导航系统通过感知周围环境,并在线生成某种表示的导航地图,较好地解决了未知环境中同时完成实时定位、绘图和自定位任务的问题。
同时定位和绘图方法(SLAM: Simultaneous Localisation andMapping)也称为CML (Concurrent Mapping and Localization),即时定位与地图构建,或并发建图与定位。
考点:slam问题的描述
SLAM问题可以描述为: 机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和地图进行自身定位,同时在自身定位的基础上建造增量式地图,实现机器人的自主定位和导航。
无地图导航方法不需要对环境信息进行全面描述。光流法、基于特征跟踪基于模板的导航方法是无地图视觉导航方法的主要研究方向。
导航,最初是指对航海的船舶抵达目的地进行的导引过程。这一术语和自主性相结合,已成为智能机器人研究的核心和热点。
Leonard和Durrant-Whyte将移动机器人导航定义为三个子问题:
为完成导航,机器人需要依靠自身传感系统对内部姿态和外部环境信息进行感知,通过对环境空间信息的存储、识别、搜索等操作寻找最优或近似最优的无碰撞路径并实现安全运动。
对于不同的室内与室外环境、结构化与非结构化环境,机器人完成准确的自身定位后,常用的导航方式主要有磁导航、惯性导航、视觉导航、卫星导航等。
磁导航是在路径上连续埋设多条引导电缆,分别流过不同频率的电流,通过感应线圈对电流的检测来感知路径信息。
惯性导航是利用陀螺仪和加速度计等惯性传感器测量移动机器人的方位角和加速率,从而推知机器人当前位置和下一步的目的地。
依据环境空间的描述方式,可将移动机器人的视觉导航方式划分为三类。
移动机器人通过安装卫星信号接收装置,可以实现自身定位,无论其在室内还是室外。
考点:大重点
地铁、公交路线图均是典型的拓扑地图实例,其中停靠站为节点,节点间的通道为边。在一般的办公环境中,拓扑单元有走廊和房间等,而打印机、桌椅等则是功能单元。连接器用于连接对应的位置,如门、楼梯、电梯等。
拓扑图把环境建模为一张线图表示,忽略了具体的几何特征信息,不必精确表示不同节点间的地理位置关系,图形抽象,表示方便。
结构化环境中,最常见的特征是直线段、角、边等。
这些特征可用它们的颜色、长度、宽度、位置等参数表示。
基于特征的地图一般用式(7.1)的特征集合表示:
M
=
{
f
j
∣
j
=
1
,
…
,
n
}
M = \{ f_j \mid j = 1, \ldots, n \}
M={fj∣j=1,…,n} (7.1)
其中 $f_j $是一个特征(边、线角等),( n ) 是地图中的特征总数。
特征法定位准确,模型易于由计算机描述和表示,参数化特征也适用于路径规划和轨迹控制,但特征法需要特征提取等预处理过程,对传感器噪声比较敏感,只适于高度结构化环境。
网格图把机器人的工作空间划分成网状结构,网格中的每一单元代表环境的一部分,每一个单元都分配了一个概率值,表示该单元被障碍物占据的可能性大小。
网格法是一种近似描述,易于创建和维护,对某个网格的感知信息可直接与环境中某个区域对应,机器人对所测得的障碍物具体形状不太敏感,特别适于处理超声测量数据。但当在大型环境中或网格单元划分比较细时,网格法计算量迅速增长,需要大量内存单元,使计算机的实时处理变得很困难。
通过记录来自不同位置及方向的环境外观感知数据,这些图像中包括了某些坐标、几何特征或符号信息,利用这些数据作为在这些位置处的环境特征描述。
直接表征法与识别拓扑位置所采用的方法原理上是一样的,差别仅在于该法试图从所获取的传感器数据中创建一个函数关系以便更精确地确定机器人的位姿。
直接表征法数据存贮量大,环境噪声干扰严重,特征数据的提取与匹配困难,其应用受到一定限制。
相对定位又称为局部位置跟踪,要求机器人在已知初始位置的条件下通过测量机器人相对于初始位置的距离和方向来确定当前位置,通常也称航迹推算法。相对定位只适于短时短距离运动的位姿估计,长时间运动时必须应用其它的传感器配合相关的定位算法进行校正。
考点:重点 里程计法会产生什么误差
里程计法是移动机器人定位技术中广泛采用的方法之一。在移动机器人的车轮上安装光电编码器,通过编码器记录的车轮转动圈数来计算机器人的位移和偏转角度。
里程计法定位过程中会产生两种误差。
系统误差在很长的时间内不会改变,和机器人导航的外界环境并没有关系,主要由下列因素引起:
非系统误差是在机器人和外界环境接触过程中,由于外界环境不可预料特性引起的。主要误差来源如下:
对于机器人定位来说,非系统误差是异常严重的问题,因为它无法预测并导致严重的方向误差。
非系统误差包括方向误差和位置误差。考虑机器人的定位误差时,方向误差是主要的误差源。机器人导航过程中小的方向误差会导致严重的位置误差。
轮子打滑和地面不平都能导致严重的方向误差。在室内环境中,轮子打滑对机器人定位精度的影响要比地面不平对定位精度影响要大,因为轮子打滑发生的频率更高。
机器人定位过程中,需要利用外界的传感器信息补偿误差。因此利用外界传感器定位机器人时,主要任务在于如何提取导航环境的特征并和环境地图进行匹配。在室内环境中,墙壁、走廊、拐角、门等特征被广泛地用于机器人的定位研究。
惯性导航定位法是一种使用惯性导航传感器定位的方法。
它通常用陀螺仪来测量机器人的角速度,用加速度计测量机器人的加速度。对测量结果进行一次和二次积分即可得到机器人偏移的角度和位移,进而得出机器人当前的位置和姿态。
绝对定位又称为全局定位,要求机器人在未知初始位置的情况下确定自己的位置。主要采用导航信标、主动或被动标识、地图匹配、卫星导航技术或概率方法进行定位,定位精度较高。这几种方法中,信标或标识牌的建设和维护成本较高,地图匹配技术处理速度慢,GPS只能用于室外,目前精度还很差,绝对定位的位置计算方法包括三视角法、三视距法、模型匹配算法等。
主动灯塔是可以很可靠地被检测到的信号发射源,将该信号进行最少的处理就可以提供精确的定位信息。
路标导航定位法是利用环境中的路标,给移动机器人提供位置信息。路标分为人工路标和自然路标。
基于地图的定位方法称为地图匹配法。机器人运用各种传感器(如超声波传感器、激光测距仪、视觉系统等)探测环境来创建它所处的局部环境地图,然后将此局部地图与存储在机器人中的己知的全局地图进行匹配。如果匹配成功,机器人就计算出自身在该环境中的位置。
GPS是适用于室外移动机器人的一种全局定位系统,它是一种以空间卫星为基础的高精度导航与定位系统,是由美国国防部批准研制,为海、陆、空三军服务的一种新的军用卫星导航系统,该系统由三大部分构成:GPS卫星星座(空间部分),地面监控部分(控制部分)和GPS信号接收机(用户部分)。GPS系统能够实施全球性、全天候、实时连续的三维导航定位服务。
概率定位中最重要的马尔可夫定位和蒙特卡罗定位。马尔可夫定位和蒙特卡罗定位不仅能够实现全局定位和局部位置跟踪,而且能够解决机器人的“绑架”问题。
机器人“绑架”问题是指,由于机器人容易与外界发生碰撞而使机器人在不知情(里程计没有记录)的情况下发生移动。
尔可夫定位的基本思想是:机器人不知道它的确切位置,而是知道它可能位置的信度(Belief,即机器人在整个位置空间的概率分布,信度值之和为1)。马尔可夫定位的关键之处在于信度值的计算。当机器人收到外界传感器信息或者利用编码器获得机器人移动信息时,基于马尔可夫假设和贝叶斯规则,每个栅格的信度值被更新。
基于马尔可夫定位方法,Dellaert等人提出了蒙特卡罗定位方法。MCL 也称为粒子滤波(Particle Filter)。
MCL的主要思想是用N个带有权重的离散采样
S t = { ( x t ( j ) , w t ( j ) ) ∣ j = 1 , . . . , N } S_t = \{ (x_t^{(j)}, w_t^{(j)}) | j = 1,...,N \} St={(xt(j),wt(j))∣j=1,...,N}
来表示后验概率密度 ( p ( x t ∣ Y t ) ) ( p(x_t | Y_t) ) (p(xt∣Yt))。其中 $ x_t^{(j)} $是机器人在t时刻的一个可能状态, w t ( j ) w_t^{(j)} wt(j) 是一个非负的参数称为权重,表示t时刻机器人状态 x t ( j ) x_t^{(j)} xt(j) 的概率也就是
p ( x t ( j ) ∣ Y t ) ≈ w t ( j ) p(x_t^{(j)} | Y_t) \approx w_t^{(j)} p(xt(j)∣Yt)≈wt(j)
且
∑ j = 1 N w t ( j ) = 1 \sum_{j=1}^N w_t^{(j)} = 1 j=1∑Nwt(j)=1
kalman滤波器是一个最优化自回归数据处理算法。基本思想是采用信号和噪声空间状态模型,结合当前时刻的观测值和前一时刻的估计值来更新对状态变量的估计,从而得到当前时刻的估计值。对于非线性估计问题,可以通过线性近似去解决。相应的方法有EKF(Extended Kalman Filter)、UKF(Unscented Kalman Filter)等。
路径规划本身可以分成不同的层次,从不同的方面有不同的划分。根据对环境的掌握情况,机器人的路径规划问题可以大致分为三种类型:
基于地图的全局路径规划,根据先验环境模型找出从起始点到目标点的符合一定性能的可行或最优的路径。
基于传感器的局部路径规划,依赖传感器获得障碍物的尺寸、形状和位置等信息。环境是未知或部分未知的。
混合型方法试图结合全局和局部的优点,将全局规划的“粗”路径作为局部规划的目标,从而引导机器人最终找到目标点。
可视图(Visibility Graph,VG)由一系列障碍物的顶点和机器人起始点及目标点用直线组合相连。要求机器人和障碍物各顶点之间、目标点和障碍物各顶点之间以及各障碍物顶点与顶点之间的连线均不能穿越障碍物,即直线是“可视的” 。这样,从起始点到目标点的最优路径转化为从起始点到目标点经过这些可视直线的最短距离问题。图中粗实线即为由VG法得到的具有最短路径,但由于过于靠近障碍物,得到路径的安全性较差。可视图法适用于环境中的障碍物是多边形的情况。
Voronoi图,又叫泰森多边形图。如下图所示,它是由一组由连接两邻点直线的垂直平分线组成的连续多边形组成。
如下图所示,首先把状态空间分解为与空间平行的许多矩形或立方体,称为单元(Cell),其中每个cell都标记为:
传统的人工势场法把智能机器人在环境中的运动视为一种在抽象的人造受力场中的运动,目标点对智能机器人产生“引力” ,障碍物对智能机器人产生“斥力” ,最后通过求合力来控制智能机器人的运动。但是,由于势场法把所有信息压缩为单个合力,这样就存在把有关障碍物分布的有价值的信息抛弃的缺陷,且易陷入局部最小值。
Dijkstra算法的基本思想如图所示:
模糊方法是在线规划中通常采用的一种规划方法,包括建模和局部规划。基于模糊逻辑的机器人路径规划的基本思想:各个物体的运动状态用模糊集的概念来表达,每个物体的隶属函数包含该物体当前位置、速度大小和速度方向的信息。然后通过模糊综合评价对各个方向进行综合考察,得到路径规划结果。
Hopfiled神经网络用于机器人路径规划的基本思想:障碍物中心处的空间点其碰撞罚函数有最大值。随着空间点与障碍物中心距离的增大,其碰撞罚函数的值逐渐减小,且为单调连续变化。在障碍物区域外的空间点其碰撞罚函数的值近似为0。因此使整个能量函数E最小,便可以使该路径尽可能远离障碍物,不与障碍物相碰,并使路径的长度尽量短,即得到一条最优路径。
遗传算法用于机器人路径规划的基本思想:采用栅格法对机器人工作空间进行划分,用序号标识栅格,并以此序号作为机器人路径规划参数编码,统一确定其个体长度,随机产生障碍物位置及数目,并在搜索到最优路径后,再在环境空间中随机插入障碍物,模拟环境变化。但是,规划空间栅格法建模还存在缺陷,即若栅格划分过粗,则规划精度较低;若栅格划分太细,则数据量又会太大。
动态规划法是解决多阶段决策优化问题的一种数值方法。动态规划算法将复杂的多变量决策问题进行分段决策,从而将其转化为多个单变量的决策问题。
Jerome Barraquand等人以经典的动态规划方法为基础,对全局路径规划问题进行了研究。结论表明,动态规划算法非常适合于动态环境下的路径规划。如何改进动态规划的算法,以提高计算效率,是当前动态规划研究一项重要内容。
人工势场实际上是对机器人运行环境的一种抽象描述。在势场中包含斥力和引力极,不希望机器人进入的区域的障碍物属于斥力极,子目标及建议机器人进入的区域为引力极。引力极和斥力极的周围由势函数产生相应的势场。机器人在势场中具有一定的抽象势能,它的负梯度方向表达了机器人系统所受到抽象力的方向,正是这种抽象力,促使机器人绕过障碍物,朝目标前进**。**
优点:
人工势场法的优点是应用人工势场法规划出来的路径一般是比较平滑并且安全的,因为斥力场的作用,智能机器人总是要远离障碍物的势场范围;势场法结构简单、易于实现,所以在路径规划中被广泛地采用。
缺点:
势场法的缺点是存在一个局部最优点问题。为了解决这个问题,许多学者进行了研究,如Rimon、Shahid和Khosla等。他们期望通过建立统一的势能函数来解决这一问题,但是这就要求障碍物最好是规则的,否则算法的计算量很大,有时甚至是无法计算的。
有些文献中采用正方形栅格表示环境,每个正方形栅格有一个表征值CV,表示在此方法中障碍物对于机器人的危险程度,对于高CV值的栅格位置,机器人就要优先躲避。CV值按其距车体的距离被事先划分成若干等级。每个等级对机器人的躲避方向会产生不同的影响。
障碍物的位置一旦被确定,则按照一定的衰减的方式赋给障碍物本身及其周围栅格一定的值,每个栅格的值代表了该位置有障碍物的可能性。障碍物栅格的初值和递减速度完全是由路径的安全性和最优性来共同决定。下图给出一种障碍物的赋值示例,以被检测到的障碍物为中心向周围八个方向进行传播,障碍物所在的栅格值最大。
当给定起点位置和目标位置后,应根据给定的目标点位置对整个地图进行初始化。确定初始值的各种方法都大致相同:每个栅格的初始值等于该栅格与目标栅格的横向距离加上该栅格与目标栅格纵向距离。由此形成初始地图。初始地图与障碍物地图合起来就成了路径搜索用的地图了,在这个地图上进行路径的搜索。
传统的栅格法中,路径搜索一般是将“起始点栅格”作为参考栅格,从参考栅格的八个相邻栅格中选择值最小的栅格;再将所选栅格作为新的参考栅格,重复此步骤直到到达到了“目标栅格” 。那么为了保证路径的平滑,要做一定的设置,即如果有多个可选栅格时,选择使智能机器人转动角度最小的栅格。那么此时就要记录智能机器人的移动方向。
通过研究发现栅格具有简单、实用、操作方便的特点,完全能够满足使用要求。
考点:算法中一定是先定位
机器人构建一个环境地图,并同时运用这个地图进行机器人定位,称作同时定位与建图(Simultaneous Locallzation andMapPing,SLAM)或并发定位与建图(Concurrent Localizationand Mapping,CLM)。
环境建模(MaPPing)是建立机器人所工作环境的各种物体如障碍、路标等的准确的空间位置描述,即空间模型或地图。
定位(Localization)是确定机器人自身在该工作环境中的精确位置。精确的环境模型(地图)及机器人定位有助于高效地路径规划和决策,是保证机器人安全导航的基础。
可见:定位和建图是一个“鸡和蛋”的问题,环境建模需要定位,定位又依赖于环境地图。
SLAM问题可以描述为:移动机器人从一个未知的位置出发,在不断运动过程中根据自身位姿估计和传感器对环境的感知构建增量式地图,同时利用该地图更新自己的定位。定位与增量式建图融为一体,而不是独立的两个阶段。
作为机器人导航领域的热点,SLAM问题的研究主要包括以下几个方面:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。