3D高斯溅射：面向三维场景的实时渲染技术

作者：很楠不爱3 | 2024-02-14 19:36:33

踩

1. 前言

高斯溅射技术【1】一经推出，立刻引起学术界和工业界的广泛关注。相比传统的隐式神经散射场渲染技术，高斯溅射依托椭球空间，显性地表示多目图像的三维空间关系，其计算效率和综合性能均有较大的提升，且更容易理解。可以预见，未来2年针对高斯溅射的应用研究将会迎来爆炸式发展。通过本篇博文，我和大家来一起了解高斯溅射技术，希望对有需要的同学提供一点帮助。

2. 简介

高斯溅射3D Guassian Splatting是2023年Siggraph发表的一项创新性技术，其基本的思路为利用运动结构恢复SfM【2】，从一组多目图像中估计一个显性的稀疏点云。对于该点云中的每一个点，构造一个类似散射场的高斯椭球概率预测模型，通过神经网络完成学习，获得每一个椭球的对应参数，进而得到一个类似体像素的离散表示，以支持多角度的体渲染和光栅化。

高斯椭球 起初，图形学几何表达并不局限于三角面片。基于椭球的三维几何表示一度被工程化，例如1994年发售的魔城迷踪ecstatica：知乎：3D Gaussian Splatting入门

实际的现实世界是离散的，面片的位置是确定的，即“空白”区域就是没有数据，可以用标量0表示，有实物的区域或者一个实体表面，就是有数据的，可以用标量1表示。针对现实世界，数据显然是不可微的，因为从无到有是一个标量从0到1的跳变。由于不可微，导致不能直接套用基于微分的优化方法。而神经散射场技术的成功之处在于针对三维世界建立了一个可微的体渲染方式已解决该问题。简单解释，就是对三维世界进行渲染时，一个区域是否有物体，不是一个非0即1的二值判断，而是一个概率的预测。即空间的每一个位置都有一个基于概率的数值。这样，从0到1的跳变就转换成了一个连续的概率变换。优点是使渲染或三维表示变得可微，缺点是不能准确的确定一个几何结构。由于对整个空间建立体概率预测，训练效率较低，即使使用了GPU并行加速和类似八叉树的结构优化，依然不能获得实时的渲染性能。这时，高斯椭球被重新采用。

神经散射场的问题在于无法将概率预测控制在一个可控的区域。高斯椭球提供了一个有效的解决方案，该技术将概率预测压缩在一个基于稀疏点云的多个高斯分布中。即每一个概率预测的计算都是以稀疏点云中的一个点为标定，一个特定的作用范围作为概率预测的界限。这样，体渲染面对的不是全局场景，而是椭球限定的一组小区域。全局优化被拆解为一组局部优化，对应的计算效率自然会有所提升。高斯溅射技术就是基于上述思路提出，以平衡渲染效率和精度。

3. 算法流程

算法输入为一个静态场景的一组多目视图。首先通过SfM技术产生一组稀疏点云。基于该点云的每一个点建立一个3D高斯模型，伴随一组参数，包括位置，协方差矩阵(变换)，透明度还有颜色。由于每一个局部的高斯模型对应不同的参数，那么这种体渲染是各向异性的，具有比较好的灵活性。散射场的颜色对应一个球谐函数的解。在完成优化后，高斯模型的对应参数被学习获得，体渲染需要的信息被获知，即可通过光栅化实现三维渲染的可视化。

可微分的3D高斯溅射 使用一组3D高斯模型来表示几何，优点在于不需要精确估计法向量。高斯模型由一个定义在世界坐标系下的满秩3D协方差矩阵Σ，由中点

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/很楠不爱3/article/detail/81009