当前位置:   article > 正文

【深度学习基础知识 - 12】深度估计概述

深度估计

深度估计是计算机视觉领域中的一个子任务,其目的是获取物体和拍摄点之间的距离,为三维重建、距离感知、SLAM、视觉里程计、活体检测、视频插帧、图像重建等一系列任务提供深度信息。这篇文章会对其做一个简单介绍。

任务目标

  • 深度估计任务的目标就是获取物体和拍摄点之间的距离,最终会获得一个深度图,也称为光流图,它记录了同一物体在不同图像之间的视差,再通过相机参数、两个拍摄点之间的位置信息即可换算出物体和拍摄点之间的距离。

什么是视差(光流)

  • 先举一个直观的例子,大家应该都坐过车,在车辆移动时往窗外看去,可以看到远处的物体变化的慢,而近处的物体变化的非常快,这里面蕴含的就是视差信息。
  • 视差也被称为光流,在上面的例子中,随着车辆的移动,假设你在两个连续的时刻各拍了一张图,如果这两张图像中有一些相同的物体,那么这些物体在这两张图像中像素坐标的差异通常是不同的,而如果某个物体在这两张图片中的像素坐标差异非常大,那么由此可判断这个物体离拍摄点相对较近,而如果某个物体在这两张图像中的像素坐标差异较小,那么可以推断出这个物体距离拍摄点相对较近,也就是说,较近的物体视差较大,较远的物体视差较小,而同一物体在不同图像中的像素坐标差异,就是视差。

深度估计的应用场景

  • 视差的主要作用是获取物体的深度信息,也就是和拍摄点之间的距离。
  • 在三维重建任务中,可以由此深度获取物体的三维点云图,然后进行三维重建。
  • 在距离感知任务中,如基于视觉的自动驾驶中,可以由此判断场
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/花生_TL007/article/detail/713391
推荐阅读
相关标签
  

闽ICP备14008679号