赞
踩
本文发表于CVPR2020,从野生图像中,缺乏相关的方法能够生成高分辨率、真实感的三维人脸,主要原因是:
本文提出的AvatarMe方法,是第一种能够基于单张的野生的图像,重建真实感三维人脸的方法,这里着重注意是真实感渲染,即PBR,和普通的渲染不一样
PCA方法,虽然能够表示重建人脸的最基本的特征,但是在高频的纹理与几何细节上却有所欠缺,况且也无法表示野生数据中人脸的复杂纹理。随着深度学习的到来,许多编码-解码架构的方法开始被采用,去推理人脸三维几何、反射、光照,但是由于使用的光照模型限制(Lambertian reflectance model)、使用的数据集限制(合成数据集,而非真实数据集)等,这些方法无法产生高频细节的形状与纹理,用于真实感渲染,更进一步说,这些方法缺失了许多身份上的特征。
可以说,第一个证明可以从单张“野生”图像重建高质量纹理和形状的通用方法是最近提出的GANFIT方法,其实就是将texture的部分由PCA替换成了GAN,然后靠着高分辨率的texture训练数据的数据驱动来得到高精度的人脸重建,然后为了保证重建出的人脸身份特征得以保留,使用Arcface这种人脸识别网络构造loss加以约束,但是GANFIT这种方法也有不足之处,因为本身训练的texture就带有了光照烘焙,然后因为人脸形状还是使用的3DMM,所以缺乏高分辨率的法线与镜面反射信息
下面列出了一些尝试从野生图像中进行真实感渲染相关的信息推理的方法(感觉都值得一看):
《Photo-realistic facial details synthesis from single image》ICCV 2019
《Mesoscopic facial geometry inference using deep neural networks》CVPR 2018
《Photorealistic facial texture inference using deep neural networks》CVPR 2017
《High-fidelity facial reflectance and geometry inference from an unconstrained image》TOG 2018
但是这些方法却不具有通用性,因为他们是直接对原始输入的(或许是低质量甚至遮挡的)人脸纹理进行操作与增强,而不是重建它,结果最终的重建质量往往取决于输入图像的质量;使用的三维模型并不具有代表性(比如有的直接眼睛给挖空了)
本文使用了先进的基于光照的人脸多视图捕捉方法先自己造了个数据集,然后采用了pix2pixHD这个项目的改进版本来实现消光(de-lighting)与提取高分辨率反射贴图的任务
首先本文自行制作了个数据集,称作RealFaceDB,人脸采用了和LSFM相似的拓扑结构,共采集200个人脸*7个表情,然后将人脸的组成元素分解为四个部分:
分别是diffuse albedo, specular albedo, diffuse normal, specular normal, 这四个纹理图加上人脸的形状就可以进行真实感三维人脸渲染了
采集好数据后, 对于野生人脸图像,本文三维重建方法如下图所示:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。