赞
踩
注:自学笔记,有错误的地方欢迎指正!
论文地址:Model-Based Imitation Learning for Urban Driving
MILE:一种基于模型的模仿学习方法,用于共同学习世界模型和自动驾驶策略。
该方法利用3D几何作为归纳偏差①,并直接从专家演示的高分辨率视频中学习高度紧凑的潜在空间;在离线的城市驾驶数据语料库上训练,与环境没有任何的在线交互。
成果:当部署在一个全新的城镇和新的天气条件下时,MILE在CARLA模拟器上的驾驶分数比现有技术提高了31%。论文模型可以预测不同的和合理的状态和动作,并解码为鸟瞰图语义分割。
①归纳偏差(Inductive bias)可以理解为一种先验或约束,能够帮助我们在多个可能的模型中选择出一个。该模型利用3D几何形状作为归纳偏差来扩展城市环境中自动驾驶的视觉复杂性。
工作处于模仿学习、3D场景表示和世界建模的交叉点(论文中该部分介绍了模仿学习、3D场景表示、世界模型以及轨迹预测的目前工作进展)。
3.1 概率生成模型
其中, 为个视频帧序列; 为专家动作; 为地面实况鸟瞰图语义分割标签; 为潜变量。完整的概率模型如下:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。