IJCAI 2020 | 淡妆浓抹总相宜之人脸上妆

作者：在线问答5 | 2024-06-26 08:52:11

踩

自动上妆软件研究方向

©PaperWeekly 原创 · 作者｜黄智坤

学校｜杭州电子科技大学硕士生

研究方向｜图像生成、图像增强

这篇论文是杭州电子科技大学（HDU），悉尼科技大学（UTS），中国科学技术大学（University of Science and Technology of China），百度研究院（Baidu Research）被 IJCAI 2020 录用的文章 Real-World Automatic Makeup via Identity Preservation Makeup Net。

社交网络的不断发展也让人们对美颜技术提出了更高的要求，在完成图像美化的同时保证图像的真实性是至关重要的。作者从现实世界需求出发，探索了完成人脸自动上妆同时保留图像的真实性的方法，同时提出了使用 FID 以及 LPIPS 来量化人脸自动上妆的效果。

论文标题：Real-World Automatic Makeup via Identity Preservation Makeup Net

论文来源：IJCAI 2020

论文链接：https://github.com/huangzhikun1995/IPM-Net/blob/master/Real_World_Automatic_Makeup_via_Identity_Preservation_Makeup_Net.pdf

代码链接：https://github.com/huangzhikun1995/IPM-Net

之前的工作有什么痛点？

在生成带妆图像的时候也会引起背景或者人物身份信息的变化，这些变化会令生成的图像失去真实性，用户往往不希望一张美丽的自拍照被人一眼看出“破绽”。
化妆程度不可控。可调节的化妆效果更符合现实世界中用户的需求，单一的化妆效果会降低用户使用的兴趣。
评价指标的缺失。对于化妆效果的好坏还是依靠志愿者的主观判断，缺少客观的量化指标。

这篇论文提出了什么？解决了什么问题？

提出了一种新的基于现实世界的人脸自动上妆网络 IPM-Net，在完成人脸自动上妆的同时保留了图像中人物的身份信息以及图像背景信息，从而保证了生成图像的真实性。
基于现实世界的需求出发，引入了化妆程度可控的方案，用户可以按照自己的意愿控制生成图像的化妆程度。此外，图像处理的速度也是现实世界中考量的因素之一，在 2080Ti 上，我们的模型每秒可以处理 16 张 256*256 的人脸图像。
对部分来自网络的图像进行换装处理，也得到了不错的效果。但网络图像未经过标注，生成效果受到人脸特征分割效果的限制。
引入 FID 和 LPIPS 作为人脸自动上妆模型的量化指标。采用 FID 来测试生成图像的真实性，LPIPS 来测试生成图像的多样性。

具体实现

1.1 特征的定义

在本文中，我们首先定义了两种特征，一种为化妆风格特征，一种为身份信息特征。化妆风格特征与图像中人脸化妆区域的视觉特征相关，身份信息特征与图像的背景、人物的 ID 相关。

1.2 图像预处理

为了让网络能 focus 在人脸的化妆区域，我们对目标图像进行了预处理，预处理的步骤主要有：

为每张目标图像生成掩膜，区分出每张图像中的化妆风格特征和身份信息特征。
提取人脸化妆区域中的纹理。
将目标图像中的人脸化妆区域置灰，加上提取出的掩膜，得到待输入到网络中的图像。

1.3 图像生成

1.3.1 不同ID的生成：

给定目标图像及其预处理好的信息，以及一张参考图像。我们将参考图像上的 makeup style code 提取出来与目标图像中的 identity content code 结合到一起，生成带有参考图像妆容但保留了目标图像身份的新图像。图像与网络生成的图像相加的残差结构，对背景的保留有着很大的帮助。