赞
踩
Klein等人于2007年提出PTAM(Parallel Tracking And Mapping),PTAM的重要意义:
首次实现了跟踪与建图的并行化,即前后端的并行处理。前端图像跟踪与后端优化独立进行,在必要时刻才进行线程同步即可。
主要缺陷:场景小、跟踪容易丢失等。
ORB-SLAM是PTAM的著名继承者,于2015年提出,是现代最完善和易用的SLAM系统之一。它是主流特征点 SLAM 中成为顶峰,它的代码以清晰易读著称,有着完善的注释,供后来的研究者们进一步理解。其有以下几条优势:
ORB-SLAM缺陷:
LSD-SLAM(Large Scale Direct monocular SLAM)是J.Engle于2014年提出,是单目直接法在SLAM中应用的标志,可以不计算特征点又可以构建半稠密地图(半稠密即图像像素梯度明显的位置),其优点有:
LSD-SLAM缺点(继承了直接法的缺点):
SVO 是 Semi-direct Visual Odoemtry(“半直接”法) 的缩写 。它是由 Forster 等人于 14 年提出的一种基于稀疏直接法的视觉里程计。其优点:
开源版的 SVO 代码清晰易读,十分适合读者作为第一个 SLAM 实例进行分析。
SVO缺点:
目标应用平台为无人机的俯视相机,细节是围绕这个应用设计的,使得它在平视相机中表现不佳:
在单目初始化时,使用了分解 H 矩阵而不是传统的 F 或 E 矩阵的方式,这需要假设特征点位于平面上。
SVO 在关键帧选择时,使用了平移量作为确定新的关键帧的策略,而没有考虑旋转量。
想要在平视相机中使用 SVO,必须自己加以修改。
为了速度和轻量化,舍弃了后端优化和回环检测部分,也基本没有建图功能。故它为一个 VO,而不是完整的 SLAM。
RTAB-MAP(Real Time Appearance-Based Mapping)[107] 是 RGB-D SLAM 中比较经典的一个方案。它实现了 RGB-D SLAM 中所有应该有的东西:基于特征的视觉里程计、基于词袋的回环检测、后端位姿优化及点云三角网格建图。它是一个完整的GRB-D SLAM方案,可以从ROS直接获取二进制程序,且支持常见RGB-D或者双目传感器,但它更偏向于是一个SLAM应用而不是好的研究对象。
相关开源网站:openslam.org
主要方向:
惯性传感器(IMU)能够测量传感器本体的角速度和加速度,被认为与相机传感器具有明显的互补性,而且十分有潜力在融合之后得到更完善的 SLAM 系统(VIO(Visual Inertial Odometry)):
VIO未来前景:
VIO(Visual Inertial Odometry)都是相当复杂的。其复杂性主要来源于 IMU 测量加速度和角速度这两个量的事实,所以不得不引入运动学计算。目前 VIO 的框架已经定型为两大类:松耦合(Loosely Coupled)和紧耦合(Tightly Coupled)。松耦合是指,IMU 和相机分别进行自身的运动估计,然后对它们的位姿估计结果进行融合。紧耦合是指,把 IMU 的状态与相机的状态合并在一起,共同构建运动方程和观测方程,然后进行状态估计——这和我们之前介绍的理论非常相似。我们可以预见到,紧耦合理论也必将分为基于滤波和基于优化的两个方向。在滤波方面,传统的 EKF以及改进的 MSCKF(Multi-State Constraint KF)都取得;优化方面亦有了一定的成果,研究者们对 EKF 也进行了深入的讨论相应的方案 。值得一提的是,尽管在纯视觉 SLAM 中,优化方法已经占了主流,但在 VIO 中,由于 IMU 的数据频率非常高,对状态进行优化需要的计算量就更大,因此VIO 领域目前仍处于滤波与优化并存的阶段。
VIO 为将来 SLAM 的小型化与低成本化提供了一个非常有效的方向。而且结合稀疏直接法,我们有望在低端硬件上取得良好的 SLAM 或 VO 效果,是非常有前景的。
语义SLAM是视觉SLAM和深度学习技术结合的方向。目的是通过深度学习实现类似与人类的通过识别物体,构建带物体标签的地图,并将标签信息引入BA或优化端的目标函数与约束中,更可通过物体识别检测回环。SLAM 和语义的结合点主要有两
个方面 [9]:
在深度学习之前,支持向量机、条件随机场在分类正确率上存在限制,所以效果也往往不尽如人意。随着深度学习的发展,我们开始使用网络,越来越准确地对图像进行识别、检测和分割。这为构建准确的语义地图打下了更好的基础 。而且逐渐开始有学者将神经网络方法引入到 SLAM 中的物体识别和分割,甚至 SLAM 本身的位姿估计与回环检测中。以后深度学习与SLAM的结合将越来越深。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。