赞
踩
一种基于字典学习和结构聚集的图像去噪
【摘要】:图像信号的稀疏从哪里来?局部和非局部的图像模型对未处理的图像的规整性已经提供充足的观点。前者尝试构造或学习一本有着提升稀疏的基本功能的字典。后者通过聚集把稀疏和图像源本身的相似点联系起来。在本论文,我们提出一种变化的框架来统一以上两种观点,并且提出了一个新的去噪算法,该算法是基于聚类稀疏表示。灵感来自于L1范数最优算法的成功,我们已经用公式表示一个双数据头的最优问题,并且公式中包含字典的学习和结构的构造。一个基于迭代收缩的替代函数已经发展起来解决双数据头L1范数最优问题,该函数还包括一个具有(SCR)模型的概率论的解释。我们的实验结果表明,该模型对一流的去噪技术BM3D在规则纹理图像这一类中有明显的提升,CSR去噪的PSNR性能是无法比拟的,在一个分成12个类的未经处理的图像的集合上,它的PSNR性能总是优于其他的有竞争性的策略(包括BM3D)。
1、介绍
在图像去噪问题的规整方面有两个补充的观点:局部和非局部的。在局部的观点中,一个信号矢量x ∈ R在希尔伯特空间Φ ∈ R(n × m )(也叫字典)能被分解成N维基矢量的集合。也就是说
,
表示权向量,能通过它的L0范数(非凸面的)或者计算更多的易于处理的L1范数来描述
稀疏。这种研究路线引导出基本函数的结构(例如脊波,轮廓波……)和适应性强的字典的学习(例如K-SVD[2],stochastic近似法[3]),在非局部的观点中,未处理图像包含本身重复的模式。利用重叠部分的相似性已经引起非本地图像去噪算法的热潮,例如,非局部均值 [4], BM3D[5],,局部学习字典K-LLD [6],学习同时稀疏编码 (LSSC) [7]。
在它们中,BM3D的PSNR功能保持了最先进水平自从它发表以来,尽管BM3D的性能令人印象深刻,但为什么它的表现如此优秀,还是缺少一种可靠的理解。而且,在稀疏(低水平的视觉任务)和聚集(中等水平视觉的通用工具)的细微的联系仍然难以捉摸,我们确实承认最新关于连接/分组稀疏的成果,这些成果在这个问题流露出成效。在一个统一的理论框架下,它看起来是令人满意的最有希望的两类想法,即字典学习(例如K-SVD)和结构聚类(例如BM3D)。
在本文中,我们通过建立一个新的叫做基于聚类的稀疏表示图像模型完成了上述的目标,CSR模型的基本观点是把局部和非局部的稀疏约束(分别伴随着字典学习和和结构聚类)当做同等的,并把他们合并成为一个统一的可变框架。这新的规则术语可以看做一个在[7]讨论下基本可信的连接/分组稀疏形式。感谢字典的正交属性,我们能同等地在空间领域和变换领域的表示新术语,此外,在压缩传感的成功的启发下,我们打算用L1范数代替具有非局部稀疏特征的L2范数,这样形成了一个双数据头L1范数最优问题。
通过替代函数,我们已经提出了一个迭代算法,用来解决上述的双数据头 L1范数的最优问题。在[8]中的,我们的结果得到了更大程度的推广他们,从单个的函数参数到一对函数参数。这种推广允许我们通过计算机有效的收缩操作来同时处理局部和非局部图像。
而且,我们从再加权L1范数最优化中借鉴了思想来适当性的调整两个公式参数和迭代公式,以进一步提升CSR去噪的性能。大量的实验结果表明我们的CSR运算法则和其他的去噪技术,包括最先进的BM3D技术相比较,CSR能达到高度(经常是更好的)的竞争性能。
2、基于聚类的稀疏表示(SCR)模型
以下出现的符号用在【2】中,我们首先建立图像X和稀疏系数
的联系(也叫稀疏模型),让xi表示从空间位置i提取的图像一个区域,因此,有公式
公式中的Ri表示一个矩形的窗口操作。注意当允许覆盖时,这样的点集表示是高度冗余的,并且图像X从{Xi}点集的恢复形成了一个过分确定的系统。获得以下的最小平方解决方案是非常直接的。
这仅仅是平均重复区域的一个抽象模型。同时,考虑到字典Φ,每一个区域通过下面公式与它的稀疏系数联系起来,
把公式(3)代入公式(2)我们得到
公式中的D是R的双操作数(从稀疏系数重构图像)。在图像去噪的环境中,我们可变化问题公式化为:
公式中的Y=X+N是噪声图像,λ是拉格朗日因子,在解决上述最优化的问题,已经进行了大量的/学习字典的和计算的有效性/强健性的研究。观察的关键动机是,稀疏(非零)系数
不是随意分类的,(请查图形1 的具体例子)。他们局部的不确定性通常与图像信号非局部的相似性有关,这意味着通过利用中种位置关系的约束达到更高稀疏的可能。从解决强度和位置的不确定性这个观点中,
图形1
K-SVD限制:a)有规律结构的图像;b)第六个迭代器稀疏系数一致的空间分布(注意到它们的位置不是随意的)
强度和位置不确定人们甚至会把最初在【12】中建议的所谓的双向过滤的想法联系起来。聚类在开发这样一种非线性(因为它们是位置相关的)限制上代表貌似可信的工具。确实有大量的工具(例如kmeans, kNN, spectral, graph-cut)在文献中。
然而,在数据聚类和稀疏表示之间建立一种联系是困难的,部分因为它们被认为是不同等级的开发工具(中级和低级)。为了更深地洞察非局部是如何提升稀疏的,我们打算研究以下的代价函数
在公式中,
表示系数为
的第k族Ck的中心。这种新的基于聚类的规则化术语的一个直觉解释是权重系数
是在
系下重新编码。通过这样的进一步“压缩”下,稀疏系数能被获得(利用非局部相似性的结果)。确实,先前的工作例如BM3D和LSSC是基于聚类和稀疏的相似系数的,但是他们之间的联系仍然是松散的。就我们所知,这是在一个统一可变的框架下第一个用严格的数学表达式表示聚类和稀疏的关系。为了更好地理解新的规则化术语的意义。我们重写等式(6)
公式中的
(也就是说类似于Xi,所有的中心矢量也是用相同的字典表示的),由于
的正交性能,我们有表达式
。因此方程式(6)归根结底是用以下的方程求最优问题。
受到被压缩感知的成功的启发(【1】的作者称之为L1魔术),
我们打算在新的规则化术语用L1范数代替L2范数。
为了总结CSR模型,我们注意到它用了一种新的方式理解稀疏,通过统一的字典学习
和结构的聚类
的形成一种可变的框架。利用在
中的冗余结构,可以达到更高水平的稀疏。另外一种理解
的(
)的方式是把他们看做学习结构的聚类的样本去在更高水平程度下重新编码
(
s)。(和解卷积网络【13】的概念是相类似的)。
3、重新迭代权重和使L1范数最小化
在本论文中贡献的一个主要技术是通过一个迭代的运算法则更新
或者
来解决方程式(9)双数据头L1最优(问题) 。借鉴替代函数(8)的想法,我们已经推断出一种迭代收缩的操作 为固定
更新
。即:
公式中
和
(c是一个辅助参数保证替代功能的凸性)
上标i表示迭代次数和下标j表示第j个矢量。因此,我们的结果表明迭代收缩也可以应用在两个规则参数的情形中,分别对应于局部和非局部稀疏,它进一步扩展公式【8】的结果(D从正交阵到非正交阵),两个变量的收缩操作
的技术细节,请参考附录。非局部均值去噪采用了类似的过程来更新参数
。(迭代调整权重最小方差【14】可以提供一个更系统化的解决方案,但是在我们的现在的实现中没有使用。
迭代收缩的计算效率允许我们对SCR模型改善,并且它伴随着最优化。首先,我们借鉴可变的图像恢复的文献【15】和再权重的L1最优的文献【9】去恰当地调整这两个规则化参数
。在文献【15】中,它说明规则化参数λ应当和信噪比成反比。在【9】中提出的调整权重策略也表明,在压缩感知的背景下新的权重与信号的x的大小成反比(因为不包含噪声)。因此我们采用了下面的更新
的策略
在公式中,
是噪声方差,
和
是两个预定义的常数(通常设置C1<C2强调非局部术语)。
然后,受到最近工作【10】的启发,我们打算通过公式(13)更新图像恢复的估计。
公式中
表示规则化限制集合上的映射,公式(14)是实现迭代公式想法的实现。
注意到方程式【14】的RHS。它可以看做一种分解Landweber算法(模糊内核归纳为一个恒等操作),δ很小的正数,用来控制噪声的数量,反馈给迭代操作。在三次迭代之后,我们选择手动中止算法,CSR去噪算法的完成描述如下:
算法1:CSR去噪算法
初始化:
;
外循环(字典学习):for i=1,2,……,I
通过kmeans和PCA算法更新
内循环(结构的聚类):for j=1,2,……J
迭代公式:
规则化参数更新:通过方程式(12)获得
的估计;
质心的估计的更新:通过KNN聚类获得
的新的估计;
图像估计更新:通过
获得新的X;
4、贝叶斯公式解释和CSR去噪的延伸
在这个部分中,对上述的CSR去噪算法我们提供了一种贝叶斯算法解释。在小波理论阈值【16】,稀疏表示和贝叶斯去噪已经建立良好的联系。两种理论的联系在过去十年已经发展得很成熟,因为它帮助协调确定性和可能性的不同。规则化函数和预知分布在的确定性和可能性集合中扮演着两种角色,这两个角色清晰地表明了可变的和贝叶斯图像恢复的对等性。因此,我们相信它有利于对扩张上述从局部(基于字典的)到非局部(基于聚类的)框架的联系。
CSR的基本想法是假定我们能把K聚类
的质心看做同等稀疏系数
的隐含变量,这种想法本质上是认识到分解组合的(位置相关)不确定性的潜在的图像信号的重要性。因此,我们用公式表示以下的最大后验估值问题(MAP)
用贝叶斯表达式,我们可以把方程(15)写成
公式中的术语分别地与可能性和先前的分配相对于,第一个术语容易通过降级模型 Y = X+W描述其特征,也就是
统计学模型的技术经常与第二个术语的近似法有关-例如,假设在i.i.d的前提下,我们把
分解成边缘分布的乘积。一种缓和这样一种假设的方式是通过数据聚类利用它的结构约束-也就是
公式中
定义了每一聚类的偏差,这种基于聚类的差别预言能被看做另外一种稀疏编码策略的水平。因此
与
近似独立。
如果我们选择通过i.i.d拉普拉斯算子分布同时模拟
和
。前者的模型通过以下式子给出
把方程(17)和(19)代入(16),我们得到
令
代入方程,结果与方程6等价。可能性的设置允许我们重新审视在确定性设置中的一些特别的选择。例如,受到在非参数统计学中内核密度估计技术的启发(例如Parzen窗口【17】),我们能把方程式(1)推广成下式
方程中的W表示非一致的权重操作有利于样本更接近窗口的中心位置。据此,我们能把方程(3)扩张成一带有权重的最小方差的解决方案
在我们目前的实现中,高斯窗口可以用作W。(与在非局部值【4】中使用权重窗口相似)。
5、图像去噪的实验
我们已经实验了在MATLAB下CSR去噪算法(与这个工作配套的源代码能通过网址
访问到)
我们在实验中使用下列参数:块的大小B=7,λ=0.03,字典大小K=64和I=J=3。总的来说,我们CSR算法能被当做字典学习(类似于K-SVD,但是有着64种字典元素)和结构的聚类(类似于BM3D但是在域中传输)的混合。总的来说,在CSR中,
图2 在测试图像D34比较字典学习在图(a)K-SVD(K = 256)和图(b)CSR(only four out of 64 sets of dictionariesis displayed)
图3在K-SVD和CSR中稀疏分布的比较
图(a)在块水平(B=8)下
划分的空间分布;
图(b)在块水平下(B = 7)
划分的空间分布;
请注意
引入(聚类中心)如何使CSR稀疏的。
kmeans和PCA试图比K_SVD更好的解决空间变化的特征。考虑到转换稀疏,聚类作为第二阶段的稀疏变化来执行(当聚类和过滤在BM3D中是无联系的)。为了了解结构的聚类是如何提升稀疏的,我们比较有相同噪声的图像,CSR和K-SVD的输出,如图1,图2,图3包含学习字典和稀疏分布的比较。对特殊的图像,我们能够观察到K-SVD 和 CSR在对于基础图像的学习上是类似的。然而,实际稀疏(基于块和块的测量)的变化作为结构聚类的结果,可以从图3看出CSR由于利用非局部相似好像能进一步的稀疏(也就是说
重新编码变成
)。
不出意料地发现在有整齐纹理图案的图像中,CSR远远优于K-SVD和BM3D。如图4所示,在K-SVD和 BM3D中获得的PSNR分别超过0.77dB and 1.97dB,显然,当图片是高度自身重复,字典学习比结构的聚类扮演了一个更加重要的角色(由于已证实的K-SVD的增益超过BM3D);但是把他们结合起来获得更进一步明显的提高。显著的增益也在Brodatz数据库中别的有规则纹理图案的图像中观察到了(由于空间的限制并不在这里描述)。
图4 D34的去噪实现比较
图(a) 噪声
图(b)BM3D(PSNR=29.33dB,SSIM=0.9178)
图(c)K-SVD(PSNR=30.53dB,SSIM=0.9327)
图(d)CSR(PSNR=31.30dB,SSIM=0.9426)
我们对于一个含有十二个高清图片的集合中也比较在不同噪声水平CSR算法和其他的先进性去噪技术。K-SVD,SA-DCT,和BM3D三种基准策略的去噪结果都是基于原作者发布的可执行代码。表格1 包含了12个图像集的PSNR的比较(最高的PSNR值在fout中在每个单元格中已经被标明)。我们可以总结提出的CSR算法比BM3D已经能得到更高PSNR。CSR比BM3D略高一筹。就我们所知,这是第一次在相同的环境下比较,去噪的结果比得上BM3D,且发表在公开文献中。图5,图6展示了两种类型图片(一种是充裕的,另外一种有边缘)的主观性能比较。在这些图片中CSR获取的PSNR超过BM3D而稍微比D34的少,但是任然分布在0.3-0.4dB范围内。
图5 去噪性能比较草图
(a)噪声 (σw = 20); (b) BM3D (PSNR = 27.09dB,SSIM = 0.8963);
(c) K-SVD (PSNR = 26.95dB,SSIM = 0.8899);(d) CSR (PSNR = 27.50dB,SSIM = 0.9061).
图6 去噪性能比较的王蝶图
(a)噪声 (σw = 20);(b) BM3D (PSNR = 30.37dB,SSIM =0.9209);
(c) K-SVD (PSNR = 29.89dB,SSIM = 0.9075);(d)CSR (PSNR = 30.70dB,SSIM = 0.9197).
6、讨论:考虑全局还是适应局部?
我们从CSR的新理论和上面的去噪实验中学到了什么。它启发我们从多方面的观点去理解字典学习和结构的聚类之间的关系。
在未处理图像上全局地进行点的采集可以形成一个非线性的由许多群组成的副本;如何发现一个非线性副本的本地的几何性质是今年来受到很多关注的问题。除了可以利用噪声数据进行无指导学习(去噪)工作,在副本学习/恢复的框架下图像去噪也能计算(cast)。像K-SVD这样通过考虑全局从加性噪声中分离图像信号的字典学习(也就是说坐标的改变),同时结构的聚类例如BM3D通过本地在点空间适配hypersurface达到了同样的目标(也就是说迭代收缩)。CSR展示的全局思维和本地适配相结合的益处是什么?
附录:通过替代功能迭代收缩
为了简化符号,我们直接写α,β代替它们的失量形式。经典的L1最优问题可以写成
计算方程(23)的最简情形是当D为正交阵的时候。假设
=I,目标函数变成
当
和我们已经使用了
。注意到上述过程的结果是目标函数的“对角化”—也就是说
当把方程(24)中简化成一个标量最小化问题。
当通过一个温和的收缩给出解决方案
函数替代的最基本的想法展示在标量情况下迭代收缩的简单过程,也同样适用于更普遍的情况(比如,D不是正交阵)【8】。在【8】中,作者已经介绍了下面的替代函数。
C的选取使得
成为凸函数,替换后的等式(23)如下:
在进行一些处理之后,上面的函数可以简化为
在公式中
这个函数形式类似于等式(25),该函数允许以下的迭代收缩方案。
下一步,我们展示通过替代函数来解决等式(9)中的双数据头L1最优问题。
不失普遍性,我们用单一的点X和选择一个聚类描述我们的结果(这样下标k就可以去掉了)。简化后的目标函数如下:
类似地,我们介绍下面的目标替代函数。
对等式(29)进行多步类似的处理后,我们可以简化上述方程为
方程中V0的定义和上述一样。
在把上述的主要问题转化成他们的标量问题之后,我们得到下面的式子
方程中
刻画为松散的参数,b是个由β组成的标量。由此得到,方程(29)的解决方案如下
公式中,
一般化的收缩操作
被定义如下:
基于替代函数的方法能被解释为在凸函数最优的proximal-point算法或者在定点理论中的非膨胀性映射。它可以很直接地证明了操作
的非扩张性属性。
表1不同去噪方法的PSNR结果如下,在每个单元格中四个去噪算法的结果已经给出。左上角为SA-DCT,右上角:K-SVD,左下角BM3D,右下角:CSR
参考:
[1] E.J.Candes,` J.K.Romberg,andT.Tao,"Robust uncertainty principles: exact signal reconstruction from highly incomplete frequency information."IEEE Transactions on Infor-mationTheory, vol.52, no.2,pp. 489–509, 2006. 2, 4
[2] M. Elad and M. Aharon, "Image denoising via sparse and redundant representations over learned dictionaries," IEEE Trans. on Image Proc., vol. 15, no. 12, pp. 3736–3745, December 2006. 2,3, 6
[3] J. Mairal, F. Bach, J. Ponce, and G. Sapiro, "Online dictionary learning for sparse coding," in Proceedings of the 26th Annual International Conference on Machine Learning,2009, pp. 689–696. 2
[4]A.Buades,B.Coll,and J.-M.Morel,"Anon-localalgorithm for image denoising,"CVPR,vol.2,pp
.60–65,2005. 2,4,5
[5] K. Dabov, A. Foi, V. Katkovnik, and K. Egiazarian, "Image denoising by sparse 3-d transform-domain collaborative filtering,"IEEETrans.on Image Processing,vol.16,no.8,pp.
2080–2095, Aug.2007. 2,6
[6] P. Chatterjee and P. Milanfar, "Clustering-based denoising with locally learned dictionaries,"Image Processing, IEEE Transactionson, vol.18,no. 7, pp.1438–1451,2009. 2
[7] J. Mairal, F. Bach, J. Ponce, G. Sapiro, and A. Zisserman,"Non-local sparse models for image restoration," in 2009 IEEE 12th International Conference on Computer Vision,2009, pp. 2272–2279. 2,6
[8] I. Daubechies, M. Defrise, and C. De Mol, "An iterative thresholding algorithm for linear inverse problems with a sparsity constraint," Communications on Pure and Applied Mathematics, vol.57,no.11,pp.1413–1457,2004. 2, 4,7
[9] E. Candes, M. Wakin, and S. Boyd, "Enhancing sparsity by reweighted l1 minimization," Journal of Fourier Analysis and Applications, vol. 14, no. 5, pp. 877–905, 2008. 3,4
[10] S. Osher, M. Burger, D. Goldfarb, J. Xu, and W. Yin, "Aniterative regularization method for total variation-based image restoration,"Multiscale Modeling and Simulation,vol.4,no. 2, pp. 460–489, 2005. 3,4
[11] M. Zibulevsky and M. Elad, "L1-l2 optimization in signal and image processing," IEEE Signal Processing Magazine,vol.27, no. 3, pp. 76 –88, may.2010. 3
[12] C.TomasiandR.Manduchi,"Bilateral filtering for gray and color images,"inICCV,1998, pp. 839–846. 3
[13] M.Zeiler,D.Krishnan,G.Taylor,andR.Fergus,"Deconvolutional networks," in IEEE Conf. on Computer Vision and Pattern Recognition(CVPR),2010, pp. 2528–2535. 4
[14] I. Daubechies, R. DeVore, M. Fornasier, and C. Gunturk,"Iteratively reweighted leasts quares minimization for sparse recovery,"Communications on Pure and Applied Mathematics, vol.63,no. 1, pp.1–38, 2010. 4
[15] N. Galatsanos and A. Katsaggelos, "Methods for choosing the regularization parameter and estimating the noise variance in image restoration and their relation," IEEE Transactions on Image Processing, vol. 1, no. 3, pp. 322 – 336, Mar 1992. 4
[16] L. Sendur and I. W. Selesnick, "Bivariate shrinkage functions for wavelet-based denoising exploiting interscale dependency,"IEEE Transactions on Signal Processing,vol.50,
no. 11, pp. 2744–2756, Nov2002. 5
[17] E. Parzen, "On estimation of a probability density functionand mode," The Annals of Mathematical Statistics, vol. 33,no. 3, pp. 1065–1076, 1962. 5
[18] A. Foi, V. Katkovnik, and K. Egiazarian, "Pointwise shape adaptive dct for high-quality denoising and deblocking of gray scale and color images,"IEEE Trans.on Image Processing, vol.16,no. 5, pp.1395–1411,May 2007. 6
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。