赞
踩
本文提出一个生成式图像修复系统,基于门控卷积(gated convolution)从百万种图像中学习。
创新1:门控卷积
门控卷积的提出解决了传统卷积中把所有输入像素点都作为有效像素这个问题,并扩展partial convolution(通过提供一个对所有层中每个通道每个位置进行学习的动态选择特征机制)。
创新2:SN-PatchGAN
由于任意形式的masks可能出现在图片中任意位置上以任何形式的存在。我们提出一个patch-based GAN loss(SN-PatchGAN), 也就是对图像进行若干分块,然后分别对其中每个局部区域进行判别应用spectral-normalized 判别器。图像修复和用户引导扩展证明我们的系统生成高质量且更稳定的结果。
图像修复是一个在丢失部分进行填充内容使得这个修复在视觉上是逼真的,在语义上是正确的。在计算机视觉领域,针对深度修复存在的两种常见方法,一种是。。第二种是深度卷积网络,第一种缺点。。第二种优点可以学习到更多语义信息,生成更好的效果。但是传统卷积模块把所有像素都作为有效值进行处理,所有对空洞填充是不适合的。在每层的输入,由空白处无效像素和空白处旁边的有效像素点组成。这样会造成色差,模糊。。。为了解决这个问题,最近提出partial convolution,只对有效像素点进行卷积和归一化,然后有规则的更新mask。partial convolution策略是将输入位置分为有效和无效,并将所有层输入乘以0/1的mask,这个mask可以被视为一个单一不可学习的特征门控通道。
Partial-Convolution = 卷积操作 + mask更新
在每次部分卷积操作之后,我们将更新我们的mask。 规则很简单:如果卷积能够在至少一个有效输入值上其输出1,否则为0。 这个方法存在一些限制。
自动图像修复
介绍了常见方法,没有提本文方法
传统的方法。。。最近的方法。。。为了处理不规则的masks方法。。。
引导用户修复与合成
大概就是我们可以额外添加一张用户引导图像,然后一方面可以根据这张图像生成更符合用户的修复部分,另一方面,原来的rgb图像可以利用这张图片获得更详细的信息
特征选择Feature-wise gating
门控卷积g就是对每一层中输入图像的每一个通道和图片中任意位置,进行特征选择,经过学习识出哪些是有用的特征,就相当是一个门,有用,就进来特征卷积学习f。没有用就出去不用学习。
介绍Gating Convolution,SN-PatchGAN,用户引导
门控卷积
把输入图像首先进入Soft Gating,这就是门控卷积,然后再进入到特征提取Feature中
所以门控卷积是一个可以学习每个通道,每个位置上的一个动态特征选择器。有趣的是,中间选通值的可视化显示,它不仅可以根据背景、掩模、草图来选择特征,还可以考虑某些通道的语义分割。即使在深层,也能学到mask区域和草图信息,更高的提高图像修复能力。
SN-PatchGAN
网络结构
我们生成修复网络由门控卷积形成的粗略,精细网络和SN-PatchGAN组成
对于coarse and refinement 网络,我们都使用简单encoder-decoder结构网络。使用gating 卷积来替换传统卷积。
mask生成
用户引导修复
定性比较
我们提出一个端到端的生成网络,通过像素之间l1损失,SN-PatchGAN损失训练。最后显示门控卷积很大程度上提高了修复结果,我们使用用户草图可以帮助用户移除掉扰乱的物体,修改图像布局、清除水印、编辑人脸以及交互式地在照片中创建新对象。定量结果、定性比较和用户研究证明了我们提出的方法在修复系统统中取得较好的结果。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。