(1)项目中指定x与y大小为:[3, 2],单位米(m)
:(3 x 2 x 1) / (0.02 x 0.02 x0.02) * 2KB = (750000)*2KB = 1464.844MB = 1.43GB
备注:1 KB = 1024 B(字节)、1 MB = 1024 KB 、1 GB = 1024 MB、1 TB = 1024 GB


  • Fusion.py文件的TSDFVolume类中,通过参数use_gpu=False选择是否使用GPU,两者速度相差极大。如果为False,既选择CPU;若为True,则需要安装CUDA和PyCUDA。
  • 把TSDF地图从CPU存储中移动到GPU中需要两步:(1)调用cuda.mem_alloc在GPU中提前开辟一块内存空间;(2)调用cuda.memcpy_htod用开辟的内存空间存储TSDF地图数据。
    备注:htod表示host to device,即从CPU存数据到GPU。如果是反过来的话,就使用cuda.memcpy_dtoh。
  • 最终输出结果为mesh.ply文件,想要打开该文件的工具有很多。此处会介绍其中的MeshLab软件。

TSDF 算法特性





其中:TSDF的取值范围为[-1, 1]其表示体素与最近的物体表面的距离。

  • 1:表示体素x 位于相机与物体表面之间
  • -1:表示体素位于物体表面之后
  • 趋近于0:即认为体素在物体表面


基于截断(T)的带符号距离函数Truncated Signed Distance Function,TSDF

  • 是一种常见的计算等势面(物体表面)的3D重建方法。
  • SDF于2003年由Sosher提出,而TSDFSDF的基础上提出截断距离(T)
    举例:若体素的SDF值大于30,赋值30;若小于15的部分,赋值15。最终,所有体素得到的SDF值都在[15, 30]范围内,即截断。


  • 白色的小方格:表示TSDF地图中的体素。
  • 蓝色的三角形:表示相机的视场范围。
  • 绿色截线:表示物体的横截面。
  • 绿色虚线:物体截面的深度信息。
  • 深蓝色直线:沿着相机的光心与体素X做一条直线,该直线与物体的截面有一个交点P。该交点是平面上离体素X最近的点。小白科研笔记:从零学习基于TSDF的三维重建



根据实拍环境以及待重建点云分布情况,构建一个足够大的长方体,使得所有3D图像的三维点都在X Y Z = [L x W x H]长方体中(能够完全包围要重建的物体)。项目中指定x与y大小为:[3, 2],单位米(m)

假设 z 方向为相机的拍摄位置, 则 xy 方向上的极值就是图像的边界。

  • (1)四条边界得到四个交汇点(边界点):(0, 0), (W, 0), (0, H), (W, H)
  • (2)z 方向上深度范围:0 ~ L
  • 最终得到长方体的八个顶点(边界点):(0, 0, 0)、(W, 0, 0)、(W, H, 0)、(0, H, 0)、(0, 0, L)、(W, 0, L)、(W, H, L)、(0, H, L)




举例理解:在[-1, 1]范围内,指定体素大小为0.02m,则可以划分出50个体素。最终,每个体素的8个顶点坐标可以通过世界坐标(-1+0.02x, -1+0.02y, -1+0.02*z)计算得到。

步骤三:迭代更新:TSDF值 + 权重值


  • (1)计算当前帧图像的TSDF值及权重。此时需要遍历所有的体素:计算每个体素TSDF值 + 截断每个体素的TSDF值 + 更新每个体素的TSDF值 + 计算每个体素的权值
  • (2)当前帧图像与全局融合结果进行融合

(1)举例推导:以任意一个体素在世界坐标系的三维坐标点p为例。世界坐标即最终生成的3D模型(体素体),由世界坐标 -> 相机坐标 -> 像素坐标

  • 坐标变换。由深度图像的相机位姿矩阵,求世界坐标系下点P在相机坐标系下的映射点v;并由相机内参矩阵及反映射V点求深度图像中的对应像素点x
  • 计算坐标点p的tsdf值。
    • 此时坐标点p的sdf值:sdf( p ) = value( x ) - distance( v )。其中:像素点x的深度值为value( x )、点v到相机坐标原点距离为distance( v )。
    • 然后引入截断距离计算tsdf( p )
      判断1:在截断距离 U = [-1, 1] 以内:tsdf( p ) = sdf( p ) / | U |;
      判断2:如果sdf( p ) > 0,tsdf( p ) = 1;
      判断3:若果sdf( p ) < 0,tsdf( p ) = -1;
  • 计算坐标点p的权重:w( p ) = cos(θ) / distance( v )。其中,θ为投影光线与表面法向量的夹角。
  • 然后就是每添加一帧深度图像,执行以上步骤。最终将输出结果给Marching Cube计算物体表面。TSDF算法学习

(2)通过当前帧tsdf( p ) 更新 融合后的TSDF值
TSDF( p )表示体素 p 融合后的TSDF值;
W( p )表示体素 p 融合后的权重值;
tsdf( p )表示体素 p 当前帧的TSDF值;
w( p )表示体素 p 当前帧的权重值;


marching cubes算法在TSDF网格中寻找dist加权和为0的等值面,即物体表面。

  • 加粗红色曲线:物体表面(人脸)
  • 物体内部
    • 橙色数字:负值。且离物体表面越远,数值越大。
    • 红色数字:负值。截断。
  • 物体外部
    • 紫色数字:正值。且离物体表面越远,数值越大。
    • 暗蓝数字:正值。截断。






数据集来源于RGB-D Dataset 7-Scenes,即将7个场景数据集中的1000张RGB深度图像,融合为2cm分辨率的TSDF体素体(3D表面网格和点云)。









  • mesh.ply:是一种多边形网格文件格式
    • 包含了多个三角形或四边形面片,每个面片由若干个顶点组成。还可能包含每个顶点的颜色、法线、纹理坐标等信息。
    • 常用于计算机图形学、三维建模和可视化等领域。
  • pc.ply:是一种点云文件格式
    • 只包含了若干个点的坐标信息,每个点可能还有其他的属性(如:颜色、法线、强度等)。
    • 常用于三维扫描、激光雷达、遥感、医学图像等领域。点云数据可以用于建立三维模型、分析形状和结构、检测缺陷和异常等。

区别点:mesh.ply 更注重表面的细节和形状,而 pc.ply 更注重点的位置和属性

四、环境配置 + 工具安装

4.0、ImportError: DLL load failed while importing _arpack: 找不到指定的程序。

(2)scipy包存在缺失。卸载pip uninstall scipy、安装最新版本pip install scipy。备注:尝试安装了低版本scipy,仍有问题。
以上四个原因是在查阅资料时总结得到,博主的问题最后定位到是由于 " scipy包存在缺失 " 的原因,通过上述方法可解决,


该项目基于Numpy + opencv + pycuda + numba + skimage即可完成。

4.1.1、Anaconda + Pycharm + OpenCV

【深度学习环境配置】Anaconda + Pycharm + CUDA +cuDNN + Pytorch + Opencv(资源已上传)

【Python虚拟环境】创建 + 激活 + 查看 + 退出 + 复制 + 删除




BUG提示ImportError:Numba needs NumPy 1.22 or less
安装numba:pip install numba。该方法会自动检测numba版本,若numpy版本与之不对应,将自动卸载当前numpy然后重新安装对应版本。切记:不可删除llvmlite文件夹,否则项目运行时会提示没有该模块。ERROR: Cannot uninstall ‘llvmlite’. It is a distutils installed project.



  • (1)在Fusion.py文件的TSDFVolume类中,通过参数use_gpu=False选择是否使用GPU
  • (2)在Demo.py文件中,点击Run运行。



BUG提示AttributeError: module ‘skimage.measure’ has no attribute ‘marching_cubes_lewiner’

  • 若是旧版本的scikit-image,可以尝试升级版本来解决这个问题。
    • 11、pip list查看已安装的scikit-image版本号为0.19.2。
    • 22、pip uninstall scikit-image卸载。
    • 33、安装scikit-image:pip install scikit-image。默认安装最新版本。上述BUG提示的链接中提到的方法是将0.19.2版本(python3.9)换成0.16.2版本(python3.8)就能解决问题,故需要通过scikit-image.whl下载地址安装。但是该方法需要同时切换python版本,由于本人使用的是python3.9,但是在官网中没有找到对应的scikit-image版本,尝试了一些版本但未成功。
  • 若是新版本的scikit-image,则可能是导入时使用了错误的名称。可通过以下代码使用:marching_cubes_lewiner:
    from skimage import measure
    verts, faces, _, _ = measure.marching_cubes_lewiner(volume, level)

最终基于新版本的scikit-image,项目运行成功,并生成mesh.ply + pc.ply文件。

步骤三:前两个步骤已经可以正常生成结果文件,但是系统有两个警告,虽然不影响使用,但只需要将measure.marching_cubes_lewiner 更换为 measure.marching_cubes即可消除该问题。项目运行成功,并生成mesh.ply + pc.ply文件。



三维几何处理系统(MeshLab):简介 + 安装 + 使用教程

  • MeshLab是开源的3D三角网格编辑与处理系统,可以对3D网格进行全面的编辑与处理,包括编辑,清理,修复,检查,渲染,纹理和转换网格等。
  • 另外,它还具备了处理由3D数字化工具 / 设备生成的原始数据,并提供3D模型打印功能,从而能够为用户实现工业化的模型创建。



TSDF算法原理、推导过程、源码解析: def __ init __()def integrate()def get_mesh(self)



Fuse 1000 RGB-D images from the 7-scenes dataset into a TSDF voxel volume with 2cm resolution.
import time
import cv2
import numpy as np
import fusion

if __name__ == "__main__":
    # ======================================================================================================== #
    # (1)估计体素体边界
    # ======================================================================================================== #
    print("Estimating voxel volume bounds...")
    n_imgs = 1000                                                                       # 1.1、指定数据集中的RGB图像总个数
    cam_intr = np.loadtxt("data/camera-intrinsics.txt", delimiter=' ')                  # 1.2、读取相机内参
    vol_bnds = np.zeros((3, 2))                                                         # 1.3、以米为单位指定xyz边界(min/max)。
    for i in range(n_imgs):
        depth_im = cv2.imread("data/frame-%06d.depth.png" % i, -1).astype(float)        # 1.4、读取深度图像
        depth_im /= 1000.                           # 单位为毫米。图像深度(depth)保存为16位PNG格式。
        depth_im[depth_im == 65.535] = 0            # 将无效的图像深度设置为0(特定于7场景数据集)
        cam_pose = np.loadtxt("data/frame-%06d.pose.txt" % i)                           # 1.5、读取相机位姿: 4x4刚性变换矩阵
        view_frust_pts = fusion.get_view_frustum(depth_im, cam_intr, cam_pose)          # 1.6、计算相机的视锥体和扩展凸包

        vol_bnds[:, 0] = np.minimum(vol_bnds[:, 0], np.amin(view_frust_pts, axis=1))
        vol_bnds[:, 1] = np.maximum(vol_bnds[:, 1], np.amax(view_frust_pts, axis=1))
        # 视锥体是摄像机可见的空间,看上去像截掉顶部的金字塔。

    # ======================================================================================================== #
    # (2)RGB-D图像的TSDF体积融合
    # ======================================================================================================== #
    print("Initializing voxel volume...")
    ########## 函数: fusion.TSDFVolume ##########
    tsdf_vol = fusion.TSDFVolume(vol_bnds, voxel_size=0.02)     # 初始化体素大小=0.02m(即2cm)

    # ======================================================================================================== #
    # (3)循环RGB-D图像更新每个体素的TSDF值,并将它们融合在一起。
    # ======================================================================================================== #
    t0_elapse = time.time()
    for i in range(n_imgs):
        print("Fusing frame %d/%d" % (i+1, n_imgs))
        color_image = cv2.cvtColor(cv2.imread("data/frame-%06d.color.jpg" % i), cv2.COLOR_BGR2RGB)      # 读取彩色图像
        depth_im = cv2.imread("data/frame-%06d.depth.png" % i, -1).astype(float)                        # 读取深度图像
        depth_im /= 1000.
        depth_im[depth_im == 65.535] = 0
        cam_pose = np.loadtxt("data/frame-%06d.pose.txt" % i)                               # 读取相机位姿
        ########## 函数: fusion.integrate ##########
        tsdf_vol.integrate(color_image, depth_im, cam_intr, cam_pose, obs_weight=1.)        # 将观测结果整合到体素体中(假设颜色与深度对齐)

    # ======================================================================================================== #
    # (4)打印FPS,并输出.ply文件
    # ======================================================================================================== #
    # 4.1、打印平均FPS:(表示画面每秒传输帧数)
    fps = n_imgs / (time.time() - t0_elapse)
    print("Average FPS: {:.2f}".format(fps))

    # 4.2、从体素体中获取3D网格,并保存为多边形.ply文件到磁盘(可以使用Meshlab查看)
    print("Saving mesh to mesh.ply...")
    verts, faces, norms, colors = tsdf_vol.get_mesh()           # 使用marching cubes体素级重建方法计算网格
    ########## 函数: fusion.meshwrite ##########
    fusion.meshwrite("mesh.ply", verts, faces, norms, colors)

    # 4.3、从体素体积中获取点云,并保存为多边形.ply文件到磁盘(可以使用Meshlab查看)
    print("Saving point cloud to pc.ply...")
    point_cloud = tsdf_vol.get_point_cloud()                    # 从体素体中提取点云
    ########## 函数: fusion.pcwrite ##########
    fusion.pcwrite("pc.ply", point_cloud)

