赞
踩
StyleNeRF:
现有方法的问题:
2D 图像生成快的原因
通过在计算最终颜色之前将特征早期聚合到 2D 空间中来部分实现第一点。 ,我们将公式4调整为:
我们使用up-sample 将低分辨率的特征空间近似到高分辨率的特征空间。
虽然早期聚合和上采样操作可以加速高分辨率图像合成的渲染过程,但它们会破坏 NeRF 的固有一致性。
不一致性是如何导致的?
We achieve the balance between consistency and image quality by combining these two approaches (see Figure 2).
对于任意输入的特征映射
X
∈
R
N
∗
N
∗
D
X \in R^{N * N * D}
X∈RN∗N∗D:
正则化模型输出以匹配原始路径(等式(4))。
这是通过对输出上的像素进行二次采样并将它们与 NeRF 生成的像素进行比较来实现的:
Predicting colors with view direction condition would give the model additional freedom to capture spurious correlations and dataset bias, especially if only a single-view target is provided.
使用视图方向条件预测颜色将为模型提供额外的自由来捕获虚假相关性和数据集偏差,尤其是在仅提供单视图目标的情况下。因此我们移除了视角方向来提高一致性。 如图8所示。
已有研究表明:注入每像素噪声可以提高模型对随机变化(例如头发、胡茬)的建模能力
我们的默认解决方案是通过消除噪声注入来交换模型捕获变化的能力。
我们还提出了一种基于 StyleNeRF 估计表面的新型几何感知噪声注入。(见附录A3)
从标准的高斯分布中采样 latent codes, 并经过mapping network进行处理。 最后输出向量被广播到synthesis network
我们用 NeRF++作为 styleNeRF的骨干。
NeRF++ 由一个单位球体中的前景 NeRF 和一个用倒转球体参数化表示的背景 NeRF 组成。
两个MLP用于预测密度,其中BG 比 FG参数要少。
然后一个共享的MLP用来预测颜色。
每个风格条件块由一个仿射变换(affine transformaton)层和一个1×1卷积层(Conv)组成。
Conv的群中用放射变换风格来进行调整。
Leaky_Relu用于非线性激活。
块的数量依赖于输入和目标图像的分辨率。
StyleNeRF采用带有R1 正则的 非饱和的GAN 目标。
新的NeRF路径正则化 被应用来增3D一致性。
最终的损失函数定义入下:
从底到高分辨率开始训练。
我们提出了一种新的三阶段渐进训练策略:
用FFHQ、 MetFaces、AFHQ、CompCars 评估styleNeRF
baseline:
高分辨率合成
可控图像合成
相机控制:(这个效果并不好)
风格混合和插值:
Michael Niemeyer and Andreas Geiger. Giraffe: Representing scenes as compositional generative neural feature fields. In Proceedings of the IEEE/CVF Conference on Computer Vision and
Pattern Recognition, pp. 11453–11464, 2021b.
Kai Zhang, Gernot Riegler, Noah Snavely, and Vladlen Koltun. Nerf++: Analyzing and improving
neural radiance fields. arXiv preprint arXiv:2010.07492, 2020.
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。