weixin_40725706

这个屌丝很懒，什么也没留下！

热门标签

热门文章

当前位置: article > 正文

推荐一些视觉SLAM的深度学习方法（上）_vision odometry deep learning

作者：weixin_40725706 | 2024-06-14 18:03:52

赞

踩

vision odometry deep learning

最近也看了一些VSLAM综述文章，这里收集一些论文推荐供参考。

1。Deep Direct Visual Odometry

这篇论文把DL模型的姿态估计做为传统方法DSO的初始化。如图

DL 模型架构图如下

基于非监督学习的训练框架如下（同时还有depth估计一起训练）

2。Deep Virtual Stereo Odometry: Leveraging Deep Depth Prediction for Monocular Direct Sparse Odometry

这也是在DSO嵌入深度学习模型的方法，改成depth预测辅助初始化。如图所示

其中的depthnet模型架构如图（视差估计）

3。D3VO: Deep Depth, Deep Pose and Deep Uncertainty for Monocular Visual Odometry

这个工作是VO，但仍然有前后台（frontend做跟踪，backend做优化）。这里深度学习参与前后台，给出depth和pose的信息。其框架如下

前台的factor graph结构图（关键帧）

而深度学习模型：posenet和depthnet如下表

4。Pose Graph Optimization for Unsupervised Monocular Visual Odometry

同样具有前后台的VO，采用非监督学习的DL模型。如图框架所示

这里PGO分别在局部的滑行窗和全局进行，但没有做SLAM的loop closure和keyframe。如下是DL模型的训练框架（depth和pose），需要双目。

5。CNN-SLAM: Real-time dense monocular SLAM with learned depth prediction

同样将深度学习的depth估计去初始化传统SLAM，这里基于LSD-SLAM（半致密法），同时还采用DL的语义分割对生成的全局图做语义融合。如图所示：

6。Self Improving Visual Odometry

这是MagicLeap的工作，基于DL的特征点提取SuperPoint模型和特征点匹配SuperGlue模型，提出一个自监督的VO框架，如图

7。BA-Net

这个方法是除了前端深度图估计之外，还想用DL解决SLAM的后端优化，即BA。如图是框架图

其中的depthnet部分是如下结构

而其中的BA-layer如图（非线性迭代L-M）

8。Self-Supervised Learning of Depth and Ego-motion with Differentiable Bundle Adjustment

该方法类似，只是扩展了前端，即depthnet和posenet，如图

这里BA layer如图：

9。Geometry-Aware Learning of Maps for Camera Localization

这是Nvidia的工作，不同于前面方法，采用深度学习做image-based re-localization的思路，但采取VO和PGO增强。如图所示MapNet

10. Unsupervised Collaborative Learning of Keyframe Detection and Visual Odometry Towards Monocular Deep SLAM

该论文特意通过深度学习，对关键帧提取进行训练，基本框架如图

其中VO包括depthnet和posenet，加上keyframe extractor，如图所示

关于keyframe的管理更新和训练框架，见下图

待续。。。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/weixin_40725706/article/detail/719052

推荐阅读

相关标签

Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号