赞
踩
先给出论文链接(https://arxiv.org/pdf/1803.03363v1.pdf)
本文是关于盲去模糊问题。之前做了很长一段时间的盲复原,始终没有得到很好的inspiration,希望这篇论文能有所启发~
本文基于data-driven discriminative prior.(数据驱动的先验鉴别),将image prior作为二进制分类器(CNN),先验的学习(learned prior)可以确定一幅图像是否清晰,嵌入到最大后验的框架中,从而可以实现盲去模糊。然而,由于该方法涉及非线性CNN,因此很难对已有图像的去模糊方法进行优化。因此作者设计了一种有效的基于半二次分裂法(half-quadratic splitting method)以及梯度下降算法(gradient decent algorithm)的方法。进一步地,所提出的模型可以较容易扩展为非均匀去模糊(non-uniform deblurring),并通过定性与定量实验来验证所提出算法的优越性。
introduction
盲图像去模糊(blind image deblurring)是图像处理和计算机视觉领域中的一个经典问题,它的目标是将模糊输入中隐藏的图像进行恢复。当模糊形状满足空间不变性的时候,模糊过程可以用以下的方式进行建模:
其中代表的是卷积算子,B、I、k 和 n 分别代表模糊图像、隐藏的清晰图像、模糊核以及噪声。式(1)中的问题是不适定性(ill-posed),因为 I 和 k 都是未知的,存在无穷多个解。为了解决这个问题,关于模糊核和图像的额外约束和先验知识都是必需的。
最近的去模糊方法的成功主要来自于有效图像先验和边缘检测策略方面的研究进展。然而,基于边缘预测的方法常常会涉及到启发式的边缘选择步骤,当边缘不可预测的时候,这种方法表现不佳。为了避免启发式的边缘选择步骤,人们提出了很多基于自然图像先验的算法,包括稀疏性归一化(normalized sparsity)、L0 梯度 和暗通道先验(dark channel prior)。这些算法在一般的自然图像上表现良好,但是并不适用于特殊的场景,例如文本 、人脸以及低光照图像。大多数上述的图像先验都有相似的效果,它们更加适用于清晰的图像,而不是模糊的图像,这种属性有助于基于 MAP(最大后验)的盲图像去模糊方法的成功。然而,大多数先验都是手工设计的,它们主要是基于对特定图像统计的有限观察。这些算法不能很好地泛化以处理自然环境中的多种场景。所以,开发能够使用 MAP 框架来处理不同场景的图像先验是很有意义的。
为达到这个目的,作者将图像先验表示为能够区分清晰图像和模糊图像的二值分类器。具体来说,作者训练深度卷积神经网络来分类模糊图像 (标记为 1 ) 和清晰图像 (标记为 0 )。由于基于 MAP(最大后验)的去模糊方法通常使用 coarse-to-fine(由粗到精)策略,因此在 MAP 框架中插入具有全连接层的 CNN 无法处理不同大小的输入图像。为了解决这个问题,作者在 CNN 中采用了全局平均池化层 ,以允许学习的分类器处理不同大小的输入。此外,为了使分类器对不同输入图像尺寸具有更强的鲁棒性,作者还采用多尺度训练策略。然后将学习到的 CNN 分类器作为 MAP(最大后验)框架中潜在图像对应的正则项。如图 1 所示,本文提出的图像先验比目前最先进的人工设计的先验 更具区分性。
然而,使用学习到的图像先验去优化这个去模糊方法是很困难的,因为这里涉及到了一个非线性 CNN。因此,本文提出了一种基于半二次方分裂法(half-quadratic splitting method)和梯度下降算法的高效数值算法。这个算法在实际使用中可以快速地收敛,并且可以应用在不同的场景中。此外,它还可以直接应用在非均匀去模糊任务中。
本文的主要贡献如下:
提出了一种高效判别图像先验,它可以通过深度卷积神经网络学习到,用于盲图像去模糊。为了保证这个先验(也就是分类器)能够处理具有不同大小的输入图像,作者利用全局平均池化和多尺度训练策略来训练这个卷积神经网络。
将学习到的分类器作为 MAP(最大后验)框架中潜在图像对应的正则化项,并且提出了一种能够求解去模糊模型的高效优化算法。
作者证明,与当前最佳算法相比,这个算法在广泛使用的自然图像去模糊基准测试和特定领域的去模糊任务中都具备有竞争力的性能。
作者展示了这个方法可以直接泛化到非均匀去模糊任务中。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。