赞
踩
在传统的图像去模糊的网络中,由于输入图像质量较低,不能提供准确的几何先验,而且高质量的参考图像是没有的,会极大限制去模糊网络的性能。为了突破这一限制,论文在人脸图像恢复领域提出了基于StyleGAN和去模糊结合的网络,先对图像进行初步的去模糊,然后利用已经经过预训练的styleGAN这种人脸生成模型在去模糊后图像的基础上进行生成,从而恢复图像更多人脸的纹理、边缘信息,使得看起来更加逼真,兼顾了真实性和保真度。其实本质上个人理解还是一个条件生成的过程,将低质量图像作为条件生成高质量图像。
创新点如下:
①将人脸图像恢复任务与GAN这种具有丰富先验的盲脸生成模型相结合;
②提出了一种网络结构,和CS-SFT层以及新的损失函数,可以很好地兼顾真实性和保真度。
上图就是模型的整体结构,主要由两部分组成,第一部分是一个退化消除网络,可以理解成就是一个U-net结构的去模糊网络,第二部分是一个已经预训练好的类似于styleGAN2的脸部生成网络,它们通过CS-SFT层连接起来。在第一部分中,Unet结构的去模糊网络又分为下采样层(编码器)、中间层和上采样层(解码器),输入的模糊图像在经过上采样层的编码器之后来到中间层,此时将其称为图像的潜在特征
如上所描述,其实就是一个去模糊的Unet结构的网络,主要的作用有两个,第一个是去模糊,第二是产生不同尺度的特征编码
首先,不同尺度的
损失函数主要包含四个部分
①重建损失:参考ESRGAN,其中包括了除了L1损失之外,还有一个感受损失,用的也是VGG-19的网络来评估图像的真实性。
②对抗损失:训练的一个辨别器来对图像的真实性进行估计。
③脸部组成损失:分别对左眼、右眼以及嘴巴三个部位训练局部辨别器对图像ROI区域进行辨别,除此之外,还加入了Gram矩阵,可以很好的计算特征相关性,捕捉纹理信息。
④身份损失:采用了预先训练的人脸识别ArcFace模型,该模型捕捉了身份识别中最突出的特征。身份保留损失强制恢复结果在紧凑的深层特征空间中与地面真实保持较小的距离。
总损失计算如下:
在数据集中,使用的是FFHQ,与之前的图像超分辨任务直接进行bicubic不一样,论文模拟图像退化过程,模糊图像退化如下式,随机挑选参数σ, r, δ q 分别从{0.2 : 10},{1 : 8}, {0 : 15}, {60 : 100}
上图展示的是模型的局限性,对于退化比较严重的图像来说,恢复的图像比较扭曲,像是人工进行后期处理的图片。
GFP-GAN把图像去模糊和生成GAN模型进行了结合,使得从去模糊网络中得到图像的特征条件,然后经过GAN生成后回复高频的信息,所以理论上来说还是一个条件生成模型。之所以效果这么好,很大一部分原因是损失函数的设计比较详细,以往的模型直接以PSNR直接作为损失函数,这其实是不太合理的。这篇论文分别将人脸局部、全局的特征、纹理相似性特征、重建特征、对抗损失都考虑在内,另外一个细节是在训练模糊图像时不时直接使用Bicubic的图像,而是随机退化,这样训练的模型更加贴近真实退化过程。但是,文中也描述了不足,这种合成的退化数据集还是不够贴合真实情况。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。