当前位置:   article > 正文

自动驾驶:自主超车行为的轨迹规划研究_mlc 强制变道 must lane change

mlc 强制变道 must lane change

自动驾驶:自主超车行为的轨迹规划研究

image

附赠自动驾驶学习资料和量产经验:链接

1 引言

近年来,自主驾驶技术的研究一直是学术界,工业界和军方关注的焦点[1],[2]。2014年,有32675次交通死亡事故,230万人受伤以及610万次报告的碰撞事件,其中估计有94%是由驾驶员错误造成的,其中31%涉及合法醉酒司机,10%来自分心驾驶员[3],[4],而自动驾驶车辆能够获得比驾驶员更多的视野和环境信息,能够大量减少驾驶员失误和交通事故发生率,同时减轻驾驶员疲劳,减少燃料消耗并提高道路容量[5], [6],所以自动驾驶技术的普及有望使得车辆运行比人类驾驶员驾驶获得更高的安全性及其它效益。美国国防先进研究项目局(Defense Advanced Research Projects Agency, DARPA )在2004-2007年举办了3届自动驾驶挑战赛,激发了该领域的研究兴趣。此外,Google无人驾驶汽车已经在超过1,600,000英里的美国道路上进行了测试,特斯拉为其MODEL S汽车配备了自动驾驶系统。虽然谷歌和特斯拉针对DARPA挑战而开发的汽车已显示出良好的自动驾驶性能,但在技术和价格方面仍然存在自动驾驶汽车商业化的重大挑战[7],[8],在实际应用中存在与自动驾驶系统相关的许多问题[9],Gartner新技术成熟度曲线2018也强调了L4/L5级自动驾驶的发展动态,特别是L4级处于膨胀期与幻灭期的交点,预计十年以后才能实现真正的全自动驾驶[10]。

智能化是汽车工业发展的必然趋势,而自动驾驶技术是汽车智能化的重要研究内容,也因此受到了相关国家政策的支持鼓励,在国务院发布的《中国制造2025》[11]中,明确要求“到 2025 年,掌握自动驾驶总体技术及各项关键技术”,我国工业和信息化部也印发了《促进新一代人工智能产业发展三年行动计划(2018-2020年)》的通知,强调到2020年建立可靠、安全、实时性强的智能网联汽车智能化平台,形成平台相关标准,支撑高度自动驾驶(HA级)[12]。现代汽车配备各种传感器和电子系统,提供紧急协助(ABS,牵引力控制,稳定性控制),ADAS(自适应巡航,车道保持,侧风辅助,盲点检测)和导航辅助(行程规划,路线选择,交通规则更新),而在下一代智能车辆中将具有更强的功能,允许在各种驾驶场景中自主操作[13]。

目前关于自动驾驶的研究涉及不同的领域,包括感知,定位、决策规划和控制[14]。感知和定位是利用传感器技术和通信技术分析车辆所处的周围环境信息[15],了解车辆自身状态,为底层的决策控制模块提供决策和控制数据,根据这些数据进行车辆的行为规划和轨迹规划[16],而控制的目标是确定转向系统,油门系统或制动系统的适当参数,以使车辆跟踪规划轨迹。自动驾驶研究领域是浩瀚的,本着对决策规划模块的兴趣,本文选择了对该模块中超车行为的轨迹规划研究。规划是一个消耗内存,计算频次较高的模块,与感知、定位、控制和数据融合等模块并行运行,规划模块的输入和输出会和这些模块交互,所以可靠性高、适应性强的规划模块至关重要。

自主超车是常见且复杂的,也是最能体现自动驾驶技术的驾驶行为之一,任何能够实现端到端自主的车辆必须能够确定是否、何时以及如何执行此驾驶任务[17]。超车涉及横向和纵向运动,同时避免与较慢移动的车辆发生碰撞[18]。由于不同的环境条件,比如交通规则、能见度、天气,以及交通参与者的多样性比如小型汽车、公共汽车、卡车等,而增加了超车决策规划的复杂性[19]。目前国内外对超车行为进行了大量的研究,提出了大量的决策模型和规划算法,但自动驾驶车辆在城市道路环境下的自主行驶仍然存在较多问题[20],由于城市环境中结构化道路和交通规则的复杂性,交通参与者的多样性,感知信息的不确定性,以及环境信息的部分可观性,给超车行为的行为决策和轨迹规划的研究带来了严峻的挑战,使得决策模型和规划算法并不能适用所有驾驶场景。跟自适应巡航或跟车行驶等驾驶模式相比,超车行为发生碰撞的概率更高,如果对其他车辆运动的预测不合理,或者超车决策规划很激进,很容易引起重大的交通事故[21]。

自动驾驶场景中公认的比较难处理的场景包括交叉路口,转向掉头,超车等模式,传感器感知的误差、盲区以及延时的特点,还有环境的动态性和不确定性,使得决策与规划的研究变得尤为困难,也是攻克自动驾驶技术的一道坎,所以我们现在研究特定驾驶情景下的车辆自主行驶技术也变得尤为必要。决策规划模块是自动驾驶车辆的“大脑”,而自主超车行为又是决策规划模块研究中的重中之重,提高自动驾驶车辆在复杂、动态、不确定环境中的自主超车性能,能够提高车辆的智能化水平,使得自动驾驶水平真正迈向L4/L5这个等级[22],具有十分重要的研究意义和极具潜力的应用前景。

2 决策与规划研究现状

在2007年DARPA举办的无人驾驶车辆挑战赛中,麻省理工大学的“Talos”无人车与康奈尔大学的“Skynet”无人车相碰撞,人们意识到行为决策和对其他交通参与者意图预测的重要性[21]。在车辆自主行驶过程中给定了全局路径之后,行为决策层会基于交通规则和感知的环境信息,以及驾驶者偏好和对其他交通参与者的预测,会做出安全评价最优或者时间最小的决策,转变到合适的驾驶模式,再去跟踪由运动规划层给出的轨迹。文献[16] 将运动规划分为三个层次:路线规划,行为规划和轨迹规划。路线规划基于最短距离或最小预期行驶时间或其他标准来给定道路网络下的两个地理位置之间的最佳路线,现在的许多地图网站都具备路线规划功能,路线规划提供更具战略性,全局性和固定的路径信息,给出的路线能够行驶几分钟或几小时,然而通常不考虑更精细的时间尺度和道路交通信息流的交互,路线规划所需的信息通常是数字地图、GPS和关于交通状况和道路建设的信息。轨迹规划与路线规划相比,地理尺度更小,时间尺度更精细,规划时间通常以毫秒为单位,轨迹规划通常强调的是局部规划,而路径规划通常是全局规划,轨迹规划层需要传感器的实时环境信息,高频次地给出安全轨迹以执行驾驶任务并且会实时地更新规划轨迹,这一过程又叫滚动优化过程,给出的轨迹需要满足车辆行驶地平顺性和稳定性、交通规则约束等其他约束条件。行为规划也可以叫做行为决策,行为决策层动态地产生一系列车辆驾驶行为,如停车,转向掉头,超车换道,跟随和避让等等,快速响应道路交通环境和驾驶场景,时间尺度通常以秒为单位,以执行由路线规划层给定的总体驾驶任务,行为决策层是自动驾驶技术核心中的核心,是最接近人类智能的一个模块。文献[14] 提出当代自动驾驶系统中的决策通常分层为路线规划,行为决策,局部运动规划和反馈控制。然而这些层次的划分相当模糊,不同的文献中出现了不同版本的划分,这取决于各个研究机构自己开发的自动驾驶车辆的系统架构,但是在核心的算法层面各家又是大同小异。本节对行为决策和运动规划的研究现状进行总结,图 1是自动驾驶车辆的技术框架图,图2是宝马集团开发的自动驾驶车辆驾驶策略和控制的系统结构[23]。

image

图 1 自动驾驶车辆技术框架

image

图 2 宝马集团开发的自动驾驶车辆驾驶策略和控制的系统结构

2.1行为决策

行为决策不能够忽视当前车辆与交通环境的交互,包括对交通参与者的预测和交通状况的评估。行为决策和搜索路径、轨迹生成不同,作为车辆的大脑会过滤路径搜索结果,与其他交通参与者交互,并且给出合适的几何路径(不是可行的轨迹,路径应该是决策层从路线规划层选取,轨迹是由运动规划层获得)[16]。决策层使用到的两个重要的技术:

  1. 运动建模和障碍物预测;

  2. 交通环境建模。

文献[24] 根据驾驶策略搜索和存储方式的不同将现有决策方法分为四类:状态机模型;决策/行为树模型;基于知识的推理决策模型;基于效用/价值的决策模型。

2.1.1状态机模型

自动驾驶车辆最开始的决策模型为状态机模型[1],车辆根据当前环境选择合适的驾驶行为,如停车、换道、超车、避让、缓慢行驶等模式,状态机模型通过构建有限的有向连通图来描述不同的驾驶状态以及状态之间的转移关系,从而根据驾驶状态的迁移反应式地生成驾驶动作。

状态机模型因为简单、易行,是无人驾驶领域目前最广泛的行为决策模型,但该类模型忽略了环境的动态性和不确定性,此外,当驾驶场景特征较多时,状态的划分和管理比较繁琐,多适用于简单场景下,很难胜任具有丰富结构化特征的城区道路环境下的行为决策任务。

2.1.2决策/行为树模型

和状态机模型类似,决策/行为树模型[25]也是通过当前驾驶状态的属性值反应式地选择不同的驾驶动作,但不同的是该类模型将驾驶状态和控制逻辑固化到了树形结构中,通过自顶向下的“轮询”机制进行驾驶策略搜索。

这类决策模型具备可视化的控制逻辑,并且控制节点可复用,但需要针对每个驾驶场景离线定义决策网路,当状态空间、行为空间较大时,控制逻辑将比较复杂。另外,该类模型无法考虑城区交通环境中存在的不确定性因素。

2.1.3基于知识的推理决策模型

基于知识的推理决策模型由“场景特征-驾驶动作”的映射关系来模仿人类驾驶员的行为决策过程,该类模型将驾驶知识存储在知识库或者神经网络中,这里的驾驶知识主要表现为规则、案例或场景特征到驾驶动作的映射关系。进而,通过“查询”机制从知识库或者训练过的网络结构中推理出驾驶动作。该类模型主要包括:基于规则的推理系统[26]、基于案例的推理系统[27]和基于神经网络的映射模型[28]。

该类模型对先验驾驶知识、训练数据的依赖性较大,需要对驾驶知识进行精心整理、管理和更新,虽然基于神经网络的映射模型可以省去数据标注和知识整合的过程,但是仍然存在以下缺点:其“数据”驱动机制使得其对训练数据的依赖性较大,训练数据需要足够充分[29];将映射关系固化到网络结构中,其解释性较差;存在“黑箱”问题,透明性差,对于实际系统中出现的问题可追溯性较差,很难发现问题的根本原因。

2.1.4基于效用/价值的决策模型

根据最大效用理论,基于效用/价值的决策模型的基本思想是依据选择准则在多个备选方案中选择出最优的驾驶策略/动作[30]。为了评估每个驾驶动作的好换程度,该类模型定义了效用(utility)或价值(value)函数,根据某些准则属性定量地评估驾驶策略符合驾驶任务目标的程度,对于无人驾驶任务而言,这些准则属性可以是安全性、舒适度、行车效率等,效用和价值可以是由其中单个属性决定也可以是由多个属性决定。

澳大利亚格里菲斯大学的Furda和Vlacic提出了多准则决策方法从候选动作集中选择最优的驾驶动作[31];新加坡国立大学的Bandyopadhyay等人提出了基于POMDP的行为决策模型[32];卡内基梅隆大学的Wei J等人提出的基于PCB(Prediction and-Cost-function Based)的行为决策模型[33];因为在特征提取方面的优势,深度增强学习也被用以学习Q函数,进而完成最优驾驶动作的生成[34];博弈论也被研究者用来推理车辆之间的交互行为[35],[36]。

2.2轨迹规划

从上世纪七十年代开始,人们就从事运动规划的研究,大多数的研究对象都是机器人领域[37],因为机器人运动的低速性,早期人们从事的基本都是路径规划的研究,但是车辆的速度较快,所以规划出的路径包含时间这一元素尤为必要,这时人们提出了轨迹规划的概念,进行运动规划的车辆和机器人之间的主要区别在于,前者涉及必须遵守交通规则的道路网络,而后者必须应对开放的环境,没有太多具体的规则要遵循,只要能到达最终目的地就行[38],除此之外,自动驾驶车辆轨迹规划的约束还包括安全性和舒适性等等。文献[16]对路径规划和轨迹规划的定义作了阐述,路径是起始构型空间[39]到终点构型空间的连续变换序列,路径规划就是发现这样一个满足避障条件、运动学约束和交通规则的序列。轨迹是由时间、位置、速度参数化了的状态空间序列,轨迹规划就是发现满足车辆运动学、动力学约束、避障条件、交通规则约束和舒适性约束的状态空间序列。由于轨迹是在路径的基础上加了时间约束,本文并不对路径规划算法和轨迹规划算法做出严格的区分,在路径的基础上明确考虑规划和执行时间t[40],路径也就成了轨迹,可以说轨迹是路径的超集,所以两者之间的算法是相通的。本文将基于路径或轨迹的搜索方式或生成原理的不同将常见的算法分为五类。

2.2.1数值优化法/最优控制法

随着自动驾驶技术的兴起,基于数值优化的方法近年来取得了巨大成功[41],正如基于采样算法在机器人领域大行其道一样[42]。数值优化法(Numerical Optimization)[38]也叫最优控制法(Optimal Control)[17],旨在最小化或最大化受不同变量约束的函数,数值优化法的代价函数中,一般会考虑碰撞风险,舒适度,运动学约束,交通规则等变量,根据驾驶者偏好分别给不同的变量赋予权重来计算轨迹集的代价函数,应用有限路径集的方法可以减少解空间,这允许实时实现。

最早使用数值优化思想的是Dieter Fox提出的动态窗口法(Dynamic Window Approach)解决移动机器人的避障问题[43],而在自动驾驶领域也诞生了很多的基于数值优化的算法。Julius Ziegler通过组合构型空间和时间来构造时空lattice,并且通过重新参数化构型空间以匹配道路的路线[44],然而这个方法无法模拟其他交通的固有不可预测性,以及由此产生的不确定性。Chris Urmson等通常通过描述车辆动力学微分方程的前向积分来计算有限的轨迹集,从该集合中,选择轨迹根据最小化的代价函数[15]。Moritz Werling设计了一个算法规划框架,并且设计了两组轨迹,一组用于横向运动,另一组用于纵向运动,每一条都针对安全性和乘员舒适度进行了优化,通过组合这两组轨迹获得一条横向和纵向运动轨迹[40],然而通过这种开环单级优化获得的轨迹不考虑动态环境中的不确定性,因此这些轨迹规划方法具有有限的潜力。在轨迹规划中,最优性和算法时间消耗都很重要,因此一些规划算法在带时间约束的Frenet框架中用SLT图去降低规划维度[45],Frenet框架是一个三维约束优化问题,目前解决这个优化问题分为两个学派,直接三维优化法和路径-速度解耦法。

image

图 3 LT图中的lattice采样

1直接优化法

直接法试图在SLT图中使用轨迹采样或lattice搜索发现最优轨迹[46],[44],这些方法增加了时间或空间上的分辨率,所以受限于他们的搜索复杂度而导致应用场景的有限[45],为了减少时间消耗就不得不增加栅格尺寸或采样分辨率,因此生成的轨迹是次优的。

2路径-速度解耦法

路径-速度解耦法分别优化路径和速度,路径优化主要考虑静态障碍物,接着基于生成的路径构造速度框架[47]。在动态障碍物下路径-速度解耦法可能不是最优的,但是这个方法能够做到在路径和速度分别优化时的灵活性。

百度EM planner[45]也是分别优化路径和速度,速度框架用来评估路径优化器中车辆与低速障碍物的交互性,然后速度优化器接收到生成的轨迹并且评估最优的速度框架。对于高速障碍物,EM planner选择变道行为而不是缓慢行车。

image

图 4 LT图中的时空均匀采样

最近兴起的规划算法是模型预测控制算法,通过运动学模型和控制器输入,解决了寻找最佳轨迹的优化问题,MPC使用线性自行车模型在驾驶通道内规划[48],该技术的缺点在于,车辆的约束越多,优化其轨迹的难度越大,所以适用于静态障碍物。

Ioannis A. Ntousakis 提出了纵向轨迹规划方法,以协助高速公路上的车辆合流,它实现了安全和交通效率的结合,同时通过最小化合流期间的加速度,该问题被表述为有限时域最优控制问题并通过分析求解。模型预测控制(MPC)方案用于补偿协作车辆的轨迹中的可能干扰,由此使用更新的测量值实时地重复应用分析的最优解,直到合流过程实际完成为止,随后该方法被推广到合流区域内的一组车辆。各种数值模拟说明了该方法的有效性和适用性[49]。

2.2.2人工势场法

人工势场法是受物理学中磁场的启发,最初由Khatib提出[50],障碍物和目标位置分别产生斥力和引力,我们可以沿着势场的最陡梯度去规划路径[51]。Stephen Waydo使用流函数进行平滑路径的规划[52],Robert Daily在高速车辆上提出谐波势场路径规划方法[53]。势场规划法能够在简单场景下做到实时性,同时在一些场景中可能陷入局部最小值,在这种情况下,所获得的路径不是最佳的或者可能找不到路径[39],另外,该算法不能处理高速驾驶场景中的车辆运动学约束,只通过了城市场景中的低速验证[54]。

2.2.3几何空间构造法/参数化曲线构造法

几何构造法主要是通过构造某种图来描述环境的自由空间,构造的空间可以称为搜索空间,再从搜索空间中找出满足一定约束或者某种指标(最短距离、最少时间等)的最优路径。其代表方法有;可视图、Voronoi图、栅格图、lattice图和驾驶通道,文献[16]已经对这些方法有了一个详细的总结。

参数化曲线法比较吸引人的是能够考虑运动学约束,规划的路径是曲率连续的,根据起始点和目标点,考虑障碍物,给出一条平滑路径。常见的曲线有Reeds-Shepp曲线[55],Dubins曲线[56],回旋曲线,多项式曲线,贝塞尔曲线,样条曲线。文献[38]和文献[16]对参数化曲线规划有详细的总结,给出了优缺点和应用范围。

image

图 5 通过三次多项式构造的轨迹

2.2.4图搜索

在图搜索算法中,机器人或者车辆的运动的构型空间会近似为栅格(grid)或状态格(lattice)。Jonathan Bohren使用Dijkstra算法根据交通状况自适应地计算航路点序列[57]。A*算法是图启发式搜索算法,由于其距离函数的定义具有很好的启发性,因此该算法在栅格地图搜索中表现出的性能相当不错[58],但是在实际应用中,其总体性能仍局限于地图的分辨率,为此很多专家学者对其进行了各种改进。2008年DAARPA比赛中来自斯坦福大学的junior无人车基于比赛环境的需要,采用了混合A*算法,并最终取得了比赛的亚军[1],后来Stentz提出了一种可在动态环境中完成最短路径搜索的方法D*算法[59],其他的改进A*算法Field D*[60] ,Theta*[61] , Anytime repairing A* (ARA*) and Anytime D*(AD*)[62]。后来考虑到曲率的连续性和车辆的运动学约束,lattice搜索算法被开发了出来,如图2所示[44],通过构造lattice空间,Howard and Kelly得到了不平地形上的全局规划和局部规划有潜力的结果[63]。然而,搜索算法的增量性质导致计算复杂性的指数增长问题,基于网格的方法在低速应用中的路径规划中表现良好,但它们不适合高速驾驶。在局部规划,也就是轨迹规划过程中,我们并不能确定一个临时的目标点具体在什么位置,为了有良好的避障能力,临时目标点可以说是随机的,所以我们往往会构造多条轨迹,这使得最优控制法比A*这样的算法更适合局部规划。

image

图 6 lattice图中运动基元的构造

2.2.5基于采样的搜索

为了解决高维空间中的规划问题,采样算法被开发了出来,确定性算法因为分辨率或者维度问题,导致规划的时间太长,这就是著名的“维度诅咒”[64]。机器人技术中最常用的方法是概率路线图方法(PRM)[65]和快速探索随机树法(RRT)[66],后者已经过自动车辆的广泛测试。在自动驾驶领域,采样法也分为两个派别,基于随机采样的方法和确定性地对构型空间采样的方法。随机采样的代表算法主要是RRT家族,已经成功应用于时间参数化轨迹[67]。另一个则以周期状态格为代表[68],状态格采样考虑运动学、动力学、曲率等约束,构建的边的代价可以任意配置,该代价不必与工作空间中的度量相关,最后以动态规划算法去计算以能量最小或者安全性要求最高的目的来计算代价函数。

文献[69]和文献[42]回顾了采样算法的应用和改进,Yoshiaki Kuwata将RRT算法应用于路径的实时增量式搜索[70],然而采样算法产生的路径不是最优的,是不稳定的并且不是曲率连续的,后来Karaman等人开发了RRT*算法虽然能够收敛于最优路径,但难以解决复杂的多约束和曲率难以控制的问题使得直接生成的轨迹对乘员的舒适性产生影响[71]。

image

图 7 RRT*路径搜索图[72]

3 超车行为的轨迹规划研究现状

超车行为的研究起始于上个世纪30年代,早在1938年Matson 和 Forbes对超车行为的开始与结束条件进行了规定,并建立了快速超车、加速超车、强制超车和主动超车的概念[73]。随着计算机运算能力的提高,各种超车模型也被提了出来并开发了各种仿真系统,其中比较出名的有TWOPAS、TRARR、VTISIM,然而基于超车视距[74],[75]计算的各种超车模型的仿真研究并不适合于高速的、动态的和不确定的行驶环境。文献[76]对超车换道的一些轨迹规划曲线有一个整体介绍,然而这些参数化曲线在静态障碍物环境中和对环境信息充分感知的条件下才能适用。早期的各种超车模型和轨迹规划简化了环境信息,缺少车辆运动学与动力学模型和对其他交通参与者的轨迹预测,并且也缺少对取消超车这一驾驶行为的考虑,要想自动驾驶车辆落地这些因素都是需要考虑在内。

一般而言,超车包括三个子操作: 变道到超车道; 通过前方一辆或多辆车辆; 车道回到原车道。然后车道变换的子操作行为也可以分为两类: 自由变道(Discretionary Lane Change,DLC); 强制性变道(Mandatory Lane Change,MLC)。当更快车道中的交通情况被认为比当前车道更好时就执行DLC子操作,由交通规则引起的强制性换道(例如停滞的车辆,车道线指示合流)就执行MLC子操作,因此基于交通规则,驾驶意图和实时交通状况,将超车行为转换成动态选择最佳行驶车道的复杂任务[17]。由于驾驶环境的动态性质,超车不是一个标准化的操作,在实际场景中每一次超车都是独特的,这种独特性源于超车数量的变化,超车的持续时间,车辆之间的相对速度,车辆之间的距离等。对于自主车辆,基于主车辆状态和环境信息做出决策的安全性评估组成了规划和决策过程的一部分, 一些常见的决策技术可以参考上一节,同时,超车过程中从原始车道换到超车道的轨迹时间是多少,在超车道的行驶时间是多少以及回到原车道的时间,这些内容既是轨迹规划的研究内容,也属于决策的研究范畴,所以说规划和决策本就是一个相互渗透的领域,所以对于一些算法的严格分类也不必那么较真。

在自动驾驶车辆的常见驾驶操作中,跟弯道行驶,交叉路口行驶和跟车行驶相比,超车行为是比较复杂的,特别是轨迹规划的研究,需要充分考虑车辆的平顺性,高速情境下是否会发生侧滑,交通参与者运动意图的判断和运动轨迹的预测。为了规划超车操作,车辆使用感知数据来检查操作的可行性并设计出无碰撞局部参考轨迹,感知数据包括相邻车辆的位置和速度估计,环境约束,碰撞时间(Time-to-collision,TTC),主车辆当前状态[17]。

image

图 8 三相超车模型示意图[5]

文献[77]将超车行为分为四类:

  1. 常见超车(Normal):主车辆接近前车并等待合适机会执行超车;

  2. 飞跃(Flying):主车不调整纵向速度直接超越前车;

  3. 借力(Piggy backing):主车跟随前车超车;

  4. 2+:主车在单次超车行为中超过两个或多个车辆。

已经有学者对常见的欧洲高速超车的持续时间有了记录,一般是5.4 s~12.5 s[78],[79]。同时又有学者对车辆环境的特征分为三类,分别是不变(车道约束)、缓慢变化(速度约束,道路作业)和快速变化(周围车辆速度,位置)。目前,尽管有精密的传感器套装和第一代V2X通信系统,现代自动驾驶车辆的能力仅限于低速超车,因为超车的能力受制于传感器范围和盲区、交通参与者预测的时间尺度、传感器缺陷和V2X网络中断,这些限制会给规划的几秒钟高速超车行为带来显著的不确定性[23]。另外,即使有完美的车载传感器和V2X通信网络,我们对交通参与者预测中的不确定性也不能完全忽略,因此为了进行风险评估而对交通参与者运动的预测成为规划模块重要的组成部分。文献[17] 基于交通运动的抽象化将运动规划方法分为三类:基于物理模型(Physics-based),基于行为模式(Manoeuvre-based)和基于交互感知(Interaction-aware)。

文献[80]提出双层模糊控制架构,一层用于路径跟踪,一层用于车道变换,不需要为超车行为制定特定的参考轨迹,车道变换系统能够根据参考车道的GPS映射来执行操作,然而该方法太依赖于感知和定位的精确性。文献[81] 通过制定非线性约束优化问题设计了超车操作的最优轨迹,使用五次多项式函数确定用于车道变换操作的最佳时间和距离。文献[82]基于弹性带(Elastic Strip)概念提供了一种快速避障的最优策略及其轨迹的方法设计。文献[5]提出了一种三相超车模型和自适应控制器,通过连续跟踪虚拟参考点并使用多项式函数生成期望轨迹,在计算机仿真中使用低阶模型验证了跟踪性能,但在没有实验验证的情况下,很难对这些方法的功效做出结论。模型预测控制方法也被研究人员用于局部轨迹规划,因为它能够更好地处理系统约束和非线性,然而非线性车辆动力学的存在,以及在动态环境中导航时的时变状态和输入约束,因此给实时解决优化问题带来计算负担,人们试图使用点质量模型、线性自行车运动学模型和非线性模型的迭代线性化来降低计算复杂度[83],最近有文章已经证明计算限制可能很快成为过去的问题,因为已经开发了用于在实时原型系统和车辆电子控制单元上实现MPC控制器的高效算法[84]。

对于超车这一行为,人们普遍上都喜欢对行为决策进行研究,单独针对超车行为的轨迹规划算法并不多[80],通常还是使用常规的轨迹规划算法,这些算法能够良好运行的前提是准确的环境先验知识,精确的定位和实时的周围车辆状态等信息的获取,由于各种不确定因素的存在要想这些信息精准无误是不现实的,同时超车时速度的提高使得低速时的轨迹规划算法并不适用,我们不得不考虑动力学模型和提高规划的频次,而且超车行为的轨迹规划的算法规模是比普通规划要大的[80],所以常规的轨迹规划算法直接应用于超车行为是不适宜的,文献[85]提出轨迹规划算法必须符合两个性能,一是为了与驾驶员进行强有力的互动,必须在其决策中理解并尊重驾驶员的想法,二是算法必须在嵌入式微处理器上运行,计算必须在100毫秒内完成。本文对轨迹规划算法的评价指标做了一个总结,包括实时性、安全性、高速场景下的适用能力、舒适性和符合道路交通规则,这些因素都严重影响着一个算法的性能。

超车行为环境的多变和感知的不确定性与延迟使得轨迹规划算法可能会搜索到一条不可行的或不安全的参考轨迹,这增加了超车行为轨迹规划的复杂性,一些轨迹规划算法也提出了处理感知的不确定性和有限的未来预测能力的不同方式。势场法基于车头时距和瞬时相对速度对障碍物设置缓冲区[86],文献[5]还通过根据对象和引导车辆的相对速度扩展虚拟参考点的边缘来保守地计算虚拟目标点,文献[84]提出基于情景的模型预测控制,基于行为的交通预测模型被纳入MPC框架,以模拟交通情景作为概率分布和有限时域,以生成在安全可行和易接受的轨迹。最近研究人员提出,V2X通信系统可以增强车辆感知能力,并能提高车辆行为规划的安全性和可行性[87],然而V2X系统如何能够实时提供准确的周围信息可以改善轨迹规划方法这也是一个需要进一步研究的问题。

现有的应用在自动驾驶领域的规划算法基本上都是在最优性和规划效率之间寻找一个平衡,为了实时性的考虑研究人员也宁愿得到一个次优的轨迹,除了环境不确定性和多约束之外,规划问题还有一个性质导致它的复杂性,那就是非凸性,不像凸优化中局部最优点一定是全局最优点,规划问题是一个非凸优化问题,我们并不能保证轨迹生成的可行性和唯一性,所以我们往往会在轨迹评价的代价函数里面加入一些驾驶者偏好约束,如算法是激进的还是保守的,轨迹规划模块和驾驶者偏好的结合也将使得自动驾驶技术更加人性化。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/510401
推荐阅读
相关标签
  

闽ICP备14008679号