赞
踩
基于水平集方法和G0模型的SAR图像分割
Abstract(摘要)
这篇文章提出了一种分割SAR图像的方法,探索利用SAR数据中的统计特性将图像分区域。我们假设为SAR图像分割分配参数,并与水平集模型相结合。分布属于G分布中的一种,处于数据建模的目的,它们已经成功的被用于振幅SAR图像中不同区域的建模。这种统计数据模型是驱动能量泛函执行区域映射的基础,被引用到水平集传播数值方案中,将SAR图像分为均匀、异构和极其异构区域。此外,我们引入了一个基于随机距离和模型的评估过程,用于量化我们方法的鲁棒性和准确性。实验结果表明,我们的算法对合成和真实SAR数据都具有准确性。+
1、Induction(简介)
合成孔径雷达系统是一种成像装置,采用相干照明比如激光和超声波,并会受到斑点噪声的影响。在SAR图像处理过程中,返回的是斑点噪声和雷达切面建模在一起的结果。这个积性模型(文献[1])因包含大量的真实SAR数据,并且在获取过程中斑点噪声被建模为固有的一部分而被广泛应用。因此,SAR图像应用区域边界和目标检测变得更加困难,可能需要斑点去除。因此,斑点去除是必需的,有效的方法可以在文献[2][3][4][5][6][7][8][9][10]中找到。
对于SAR图像分割,水平集方法构成一类基于哈密顿-雅克比公式的重要算法。水平集方法允许有效的分割标准公式,从文献[12]中讨论的传播函数项可以得到。经典方法有着昂贵的计算成本,但现在的水平集的实现配置了有趣的低成本的替换。
水平集方法的一个重要方面,比如传播模型,可以用来设计SAR图像的分割算法。这个传播函数能够依据伽马和伽马平方根法则将斑点统计进行整合,函数已经被广泛地应用于SAR图像中的均质区域分割。Ayed等基于伽马分布任意建模,设计方案将SAR图像分成多个均质区域。尽管多区分割问题已经解决,该方案人需要一定数量的区域作为输入。Shuai和Sun在文献[16]中提出对这个方法进行了改进,他们使用了一个有效的传播前收敛判断。Marques等引入了一个类似于含有斑点噪声图像中目标检测的框架,将基于本地区域的斑点噪声统计融合进去。这些作者采用伽马平方根对均质区域进行建模并用一个自适应窗口方案检测本地的同质性。
最近,新的SAR数据模型比如K,G,显示出了优势。经典法则受限于均质区域特性的描述,而最近的法则展现出了在数据建模中更有吸引力的特性。法则允许同构、异构和高度异构幅度SAR数据的建模。这个分布族提供了一组参数,可以描述SAR图像中的不同区域。分布的参数信息,可以被广泛的应用于设计SAR图像处理和分类技术。在文献[21]中,Mejail等人介绍了SAR监督数据分类器,它基于其参数映射并实现了有趣的结果。Gambini等人在文献[22]中使用这个分布的一个参数来量化SAR数据的粗糙度,通过活动轮廓和B样条差值来检测边缘。然而,这种技术需要一个初始分割步骤,并受拓扑限制。一般来说,活动轮廓方法不能解决不连续区域分割的问题。
本文介绍了一种新的水平集算法来实现SAR图像中均质、异构和极其异构区域分割的目标。由于分布能够描述SAR图像的同质性和规模,我们的方法采用分布对斑点数据进行建模。这些分布参数基于每一个域点进行估计,通过这些信息,我们可以在水平集分割框架内得到一个能量泛函来驱动向前传播(front propagation)。该泛函以最大化不同区域平均能量间的差异作为结束。最终水平集阶段以能量带作为依据得到SAR图像的分割结果。
本文的另一个贡献是随机评估方法,对算法分割的难度以及正确划分区域的能力进行评估。提出的这个随机方法对量化分割方法的性能非常有效。此外,这些方法针对于真实SAR图像有效,对于参考图像或者地表图像可能并不适用。
本文的其余部分组织如下:在下一节中,我们回顾斑点数据模型并着重于样本矩方法的参数评估方法。第三节介绍了提出的基于SAR图像区域统计映射的水平集分割方法。此外,该节介绍了一组随机方法来评估实验。在第四节中,我们给出了实验结果以及随机评估方法。第五节是结论以及总结我们的贡献和未来的进一步工作。
2、Background on Speckled Data Models(斑点数据模型背景)
本节简要给出SAR数据模型的介绍,主要基于文献[19][21][22][23][24][25][26]中给出的结果。参数估计和解释也同样有讨论,并指出它们在描述SAR数据中的适用性。
SAR系统返回的Z采用了乘性模型。Z=X·Y,其中后向散射X和噪声Y是独立的随机变量。对于多视振幅SAR图像,三个主要模型证实了其有效性:当传感器传来均质信号时使用伽马平方根(),而和分别对应于异构和极其异构区域。这些模型都是特定情况下的G幅度分布(),它以密度为特征,令z>0,
其中n是looks的次数,Ke(·)表示e阶的第三类贝塞尔函数,(·)是伽马函数。参数空间,和表示如下:
表1给出了为振幅SAR数据建模的各分布之间的关系,其中和分别表示收敛于随机变量Z的分布和概率。在特定条件下的参数空间,法则收敛于SAR图像中异构区域建模的分布。分布由如下密度函数描述:
对于SAR图像中的均质区域,法则概率收敛于含有广义参数的伽马平方根。的密度函数给出如下:
Frery等人介绍了另一个法则的特殊情况,特别对于异构和极其异构区域,将振幅数据建模后返回Z。这个分布被称为,使用(configure)一个有趣的替换来描述观测数据。Allend等人强调,该方法是最近被接受的均质区域建模方法。
模型由如下密度方程描述:
阶理论力矩存在如果<-/2,则>0且n≥1,它们由下式给出:
累积分布的定义如下:
其中,是Snedecor’s F法则的累积分布函数,其自由度为2n和-2。
和模型给出了解决累积分布函数数学上的限制。换句话说,(7)中给出的累积分布函数在计算上是十分容易处理的,就像它的反函数。函数Υ和Υ-1能够在统计软件平台获得,并且可以实现重要的结果,文献[28]中给出的一个Z~的样本模拟如下:
其中U是一个在(0,1)之间均匀分布的随机变量。
2.1、Parameter Estimation and Interpretation(参数估计与解释)
基于模型的优势,我们假设Z~,其中θ=( )是分布的参数向量。分布的参数和能够分别用于描述SAR图像的粗糙程度和规模。此外,我们已经知道,当→0—时,数据呈现高度异构的灰度。另一方面,在SAR图像的均质区域,。规模参数与后向散射振幅成正比。
模型的参数估计已经在很多文献中被广泛讨论。统计方法可以被应用于其中,比如矩量法(MO,文献[23][19][21]),极大似然法(ML,文献[28])以及稳健估计法(文献[24][27])。总之,前面提到的估算技术都有类似的局限性,因为分析解法没有实现,而还会出现数值问题。
对于MO[矩量法],它可以在弱正则化条件下简单又成功的应用于评估分布参数,还可以提供一致性的评估。
ML[极大似然]估计方法具有一致性并能呈现最佳性能。然而,Mejail等人观察到,不论何时在均质区域的小样本上进行评估,顺序统计和极大似然方法会导致数值上问题。此外,执行参数估计时所需时间的计算是另一个相关问题。
当前的方法应该使用小样本执行大量的估计实验(对每一个图像像素)。使用大样本得到大窗口,在结果数据中会经常导致大量的模糊数据。为了克服这些缺点,参数估计采用了文献[21]中的策略。因此,为了评估粗糙度参数,我们寻找一个其中关系的数值解决方案。
其中表示第r阶样本矩。通过取代(6)中的,得到被估计的规模参数(),其中r=1且。考虑到不可能获得分析估计的标准误差,我们可以使用Bootstrap方法来获得。详细内容可以参见文献[30]。
Looks的次数n通常是个传感器提供的整数,在本文中它是个先验信息。然而,如果没有这个值,looks的数量也可以通过真实数据进行估计来得到,因此称它为looks的等价值()[19]。
由于均质区域遵循法则,MO[矩量]方法通常用于解决下面这个等式[18]:
3、The Proposed Level Set Framework(提出的水平集框架)
3.1、Energy Functional Map(能量泛函映射)
令是振幅SAR图像,其中我们可以定义图像区域集,各区域互不相交,并涵盖整个区域。
接下来的命题在文献[31]进行了阐述,不同图像区域的样本被不同的分布描述。如果是SAR图像的不同区域,则随机变量遵循分布并分别包含不同的参数向量和。此外,对于任一点,参数向量能够被如,所以有,。
就像之前提到过的,对于其他任一点呈现相似的粗糙度和规模模式也是合情合理的。因此,两个不同点,概率()之间的关系为:
换句话说,如果且,和描述不同的区域;即,累积分布是不同的。基于累积分布的单一性(CDF),我们观察到,它可以用于区分为不同区域的概率分布模型。图1中曲线下方的高亮区域表示函数的识别能力。基于这个假设,我们设计了一个粗糙度和规模项进行描述的能量泛函,去映射不同区域间的差异。如此,这个泛函给出如下:
---------------------------------------
图1. (z,,,1)的两个分布族。=1时用实线表示,=10时用虚线表示。(是规模参数,越小,模型的密度函数越大。)
实线虚线分别包括三个不同的粗糙度模式,均质=-12.5用蓝色线表示,异构=-4.5用绿色线表示,极其异构=-1.5用红色线表示。
---------------------------------------
粗糙度和规模参数可以基于每一个像素被估计出来,以及两个参数映射(和)都已在文献[21]中给出。因此,文献[12]中定义的能量映射如下:
其中n和是中的常量。图1中显示了不同粗糙度值的两族分布。曲线下方的面积与能量值一致。如图1中所示, 当,数据极其异构的并且另外,如果,则。这些关系可以通过分析分布的偏态和峰态来总结概括。前者是在文献[21]中提出,后者在其附录B中得到,文献可以在计算机协会数字图书馆中找到,网址是http://doi.ieeecomputersociety.org/10.1109/TPAMI.2011.274。
---------------------------------------
图2 分布的峰态(Kurtosis)
---------------------------------------
在图2中可以看出,文献[39]中的峰态(见附录B,可以在网上找到补充材料)随粗糙度参数增加,但不依赖于粗糙度参数。结果与概率的增加和粗糙度参数的减小有着直接的关系。然而,如文献[12]中说明的那样,规模参数的增加导致分布函数的变化并因此会使能量(泛函)减小。
这样的考虑让我们假设能量振幅的变化应该在区域边界处达到最大值。然而,这种波动被限制在较低值的区域内。因此,区域边界的能量震动可以从总的能量变化中评估出来:
其中是空间梯度的大小,由下式给出:
由于是图像梯度,且代表累计分布函数的导数,我们可以把总能量变化写作:
并且当符合下面这个条件时,新颖的方程能提供最大的辨别力:
---------------------------------------
图3 累积分布函数的行为。
(a)是基于任意参数=1.5,(b)是提出的方法给出的估计值(=0.7089)
---------------------------------------
图3(a)展示了在几个参数向量()以及任意参数=1.5时函数的行为。图3(b)给出了与提出的准则相符,=0.7089时所计算出的能量值。图3(b)中的表面显现出了更好的曲率,因此它能更好的分辨出不同的参数向量。
---------------------------------------
图4 (a)合成SAR图像由四个函数族建模,参数分别设置为n=1,,且。(b)负粗糙值()时的估计映射。(c)规模()。(d)能量()
---------------------------------------
图4(a)显示了一个SAR图像的四个基于法则的模拟样本。规模参数的设置从上到下分别是100和1000。粗糙度参数设置为左侧=-4.5,右侧为=-1.5。这些值分别代表异构和高度异构数据。图4(b)和图4(c)分别说明了估计的粗糙度和规模映射。图4(d)中可以观察到计算出来的能量映射,这个新的映射提高了图像区域间的辨识度。为了提高可视化,图4(a)(b)(c)中的图像都进行了增强对比度处理,但(d)中并没有进行加强。
与文献[21]中Mejail等人提到的一致,规模参数可以用于区分区域中具有相似粗糙度模式的不同目标。另外,粗糙度参数为复杂图像分割提供相关联的信息。事实上,对SAR图像区域来说,对粗糙度参数以及规模参数进行有效设计是十分必要的。基于这样的假设,就能够被正确估计,能量泛函能够通过不同的粗糙度和规模模式区分图像区域。
3.1.1 、Algorithm Issues算法问题
算法1总结了计算新能量泛函的主要步骤。
算法1. 能量映射估计
第一步为力矩和参数估计设置邻域大小,这在第2~5步中会用到。我们强调,(式9)会与多个域中点的数据不一致;因此,估计值就不会被得到。为了克服这个问题,就如文献[22]中介绍的那样我们为那些估计失败的点分配了从邻域粗糙值中获得的中间值。
在步骤6中,SAR图像的梯度大小被计算出来,而步骤7返回一个初始的估计值。在本文中,我们为初始估计分配了图像直方图模式。此外,由于默认直方图的组距为1,我们使用整型图像。如果得到的直方图是多峰的,则使用最小的模值作为初始估计。为了最大化(式17),在步骤8中我们使用一个基于Broyden-Fletcher-Goldfarb-Shanno常规方法(BFGS)的数值解决方案(numerical routine)。
3.2 、The Level Set Propagation Model(水平集传播模型)
水平集方法是基于变分系统的解决方案。在这个问题中,与成本函数一致,动态系统的评估是为了最小化能量状态。在文献[11]中,Sethian阐述了基于哈密顿-雅克比方程的水平集方法。在这个方法中,闭曲线上的每一个点都以速度()进行演化,其中()是与垂直的单位向量。
在水平集方法中,的向前移动是曲面运动的结果,而已经依据下式潜入到了中:
其中是参数曲线的的坐标,是演化时间。过程由下式表示[11]:
其中,是时间步长,是水平集函数,而是演化函数。
传统上,是由初始曲线簇转化莱尔符号距离函数。演化函数()由基于的曲率的正则化项、水平对流项和传播项()组成。在本文中,我们根据文献[33]中提到的,采用高斯滤波器来正则化水平集函数。正则化的演化函数在文献[34]中定义如下:
其中,是狄克拉函数(Dirac function)的近似,表示如下:
式中,是一个正则化常数。
过程开始于由下式给出的零水平集
其中,和分别代表初始曲线内部和外部区域,相当于区域边缘。
提出传播函数的目的是最大化区域间平均能量的变化。这个标准是的提出是依据在同一区域内函数行为变化最小。在反复试验之后我们发现,线性成本函数对于惩罚有意义的区域间差异已足够,并且不会放大区域内的随机差异。这个相关的成本函数可以表示如下:
其中是第i个区域的平均能量,给出如下:
式中,是区域的总能量,而是区域面积。
我们的水平集模型的演化与文献[16][18]中的相类似,封闭参数曲线上的成本函数,由下面的表达式来最小化:
举个例子,对于二值分割,N=2,成本函数可以写作,其中。则(式25)中的导数可以演化为:
其中,
由于面积导数在下面给出,因此(式27)中右边的项可以被解决:
因此,
其中,是与正交的单位向量。
最终的演化模型给出如下:
实际上,水平集函数的演化遵循(式19)以及(式33)中表达的。
我们提出的方法在条件下收敛,其中是最近一次迭代的平均成本,是收敛阈值。接下来,算法2总结了我们提出的水平集框架。
3.3 、Stochastic Assessment Methodology(随机评估方法)
本节介绍了量化分割算法性能的评价方法。我们提出的评价措施依赖于算术-几何距离,并且,已经利用这些措施对我们提出的方法的测试执行进行了评估。根据Frery等人在文献[31]以及Nascimento等人在文献[35]中的介绍,与使用stochastic-inspired距离对斑点数据进行量化相比,这个距离展现了最好的辨别能力。
在区域和之间的算数-几何距离由下式给出:
接下来,我们在算数-几何距离[34]的基础上得到评价方法。
分割距离(SD)。它对分割结果和相关区域之间的统计距离进行测量。由(式34)可以得到:
式中,是参考前景(reference foreground),而是被分割的区域。
分割难度(DoS)。它将分割前景()和背景()的难度进行量化。当区域对比度低时,意味着减小;结果是,分割的难度上升。困难度的度量可以为表示为:
(跨)区域拟合(CRF)。对该方法正确分割区域能力的量化结合了分割距离和分割难度。由下式给出:
尽管分割难度和分割距离能够对分割方法进行评估,但它们只是相对量。作为替换,区域拟合误差对分割算法的评估不论针对参考图像还是地表实况图像,都将引用参数和考虑在内。这个方法对于真实SAR图像的参考图像或者地表实况图像可能不可用。
为了在分割合成数据时提供一个参考测量,我们提出了区域拟合误差,给出如下:
区域拟合误差(Region Fitting Error,RFE)提供了待分割的前景区域面积和参考区域面积之间的量化的差异。RFE方法是success of shape fit方法的修改版本,若时会导致计算错误。
4、 Experimental Results(实验结果)
为了评估新方法我们将其与其他基于水平集的SAR图像分割方法进行了对比。所有方法和评估措施都使用Matlab平台进行开发。
4.1、Synthetic Speckled Image Segmentation(合成斑点图像分割)
4.1.1、Monte Carlo Experiment(蒙地卡罗实验)
仿真测试在蒙地卡罗实验的指导下进行,使用的SAR数据样本是由一组可调节大小的49幅二值图像产生的。斑点图像遵循收敛性判定准则,水平集方法的参数设置为:=50,=0.05,,=0.5。
前景和背景区域分别遵循不同的分布和。参数设为,,。下面是被测试的三个配置:
对于其中每一种配置,都用27种不同的污染模式被复制到那一组49幅二值图像中。蒙地卡罗实验包括3969个测试,也就是每一种配置进行了1323次测试。图5显示了分割结果中效果最好的一些。图6显示了用于评估实验的区域拟合误差和随机方法的直方图。
---------------------------------------
---------------------------------------
---------------------------------------
对于同一组参数,我们提出得方法在93%的测试中都是收敛的,也就是说,3969次测试有3691次都收敛。这样的性能可以通过调整等参数进行提高。在图6(a)中,通过RFE直方图可以看出,80%左右的测试出现的误差都在0.1左右,最小和最大误差分别在0.0054和0.5070左右。图6(b)中SD(分割距离)和CRF(区域拟合)的直方图显示了相似的结果。
从蒙特卡罗过程我们可知,图6(a)(b)(c)中的结果显示出随机距离强化了所给方法的良好表现。此外,SD和CRF的直方图说明了方法的分割精度。图6(d)中CRF和DoS的对比分析说明了该方法在对比度很低的图像中分割区域的能力。
4.1.2、Comparative Analysis of Level Set Method for Synthetic Data(合成数据水平集方法的对比分析)
---------------------------------------
---------------------------------------
图7给出了一幅256×256的合成斑点图像。它用四种不同的返回模式模拟了一副图像,基于法则,用均质背景(=-10)以及三种不同粗糙度(=-1.5,-4,-5)。的斑点。同样需要注意的还有,对比度的增强能够提高图像的可视化效果。
从区域到模拟模式趋于呈现分割难度逐渐增加,这企鹅方面起因于不同的粗糙度()参数值。
文献[16]中水平集方法的性能与图7(d)中展示出来的并不完全一致,它检测#2和#3区域失败了。在图7(e)中我们可以看到文献[37]中的水平集方法是准确的,但是,分割过程中的残留噪声依然存在。这些方法的性能依然不够好,尤其是在对比度低的区域(#2和#3),但是就像图7(c)中显示的那样,它们都能正确的检测到区域边缘。表格2中指出了我们提出的方法在不同难度水平时的最佳性能的数值结果。总之,我们提出的方法的结果展现了最小的RFE(区域拟合误差)值,并且对于不同统计属性的区域有很好的分割性,尤其体现在分割难度(DoS)值高时。
初步的分割结果表明,一系列有效的措施比如RFE(区域拟合误差),DoS(分割难度)和CRF(区域拟合)能够量化准确度、测试难度以及基于它们统计特征的区域分割的正确性。此外,DoS(分割难度)和CRF(区域拟合)可以通过在背景和前景中选择适当的参考样本,应用于真实SAR图像的分割结果。
---------------------------------------
---------------------------------------
表3显示了在2.4GHz以及4GB RAM的计算时间的平均值,和表2中总结的实验的水平集迭代次数。基于水平集技术的方法都呈现相似的结果。然而,文献[37]中提出的传播模型需要经验参数来引导几次图像的分割。此外,在文献[16]和[37]中,算法的收敛性判断依据并不明确,并需要充足的迭代次数来实现这一(收敛)过程。我们提出的方法,需要额外的时间来执行算法1来进行能量映射计算;但是,收敛性判断依据避免了过多的计算成本,并能得到一致的结果。
4.2、Real SAR Image Segmentation(真实SAR图像分割)
---------------------------------------
---------------------------------------
我们提出的方法已经被应用到单视(single-look)和多视(multilook)SAR图像中。图8(a)中显示了一个通过ESAR传感器获得的真实单视图像,图8(b)显示的是它的能量映射。我们收集了不同区域的样本,基于估计参数进行随机评估。结果在表4中列举出来,值得强调的是,我们选择的样本同样适用于所有允许可靠分析的方法。
按照DoS方法,我们可以得出这样的结论:图8(a)中的#2区域跟背景相比对比度比较小,这对分割算法来说是个挑战。总之,根据CRF值,我们提出的方法呈现出了背景前景分离性的最好结果。
图9(a)和图9(b)显示的图像是通过RADATSAT卫星获取的4视图像,每个像素需要2个字节的分辨率,并且两个场景都是512×515像素。图9(a)显示的高亮区域被认为是近海石油平台,而图9(b)显示了巴西东北海岸的水上浮油(油膜)。图9(c)给出了一个由JERS传感器获得的巴西亚马逊河上的3视SAR图。图像中深色的部分被分类为二级的边界清晰的森林。图9中展示的结果说明,我们提出的方法,不论分割高亮目标点,小区域还是低对比度的场景都能给出令人满意的结果。表5概括了图9中的对比结果。图9(b)中展示的水面浮油图像,其DoS=2.1e18,这将需要一个难度更大的测试。根据CRF指数,我们的方法有最小的分割误差。此外,这些结果都显示,我们的技术能够成功的分割不同的目标。
事实上,该方法为目标探测测试提供了有趣的结果。因此,目标能量映射说明了我们提出的泛函有获取SAR区域特征并加以识别的能力。因此,分割过程可以看做是能量带的分割,尤其是对于高能量值和低能量值。
---------------------------------------
---------------------------------------
---------------------------------------
5、Concluding Remarks and Future Works(结论和未来工作)
本文中,我们介绍了一种使用传播模型的水平集分割方法,其中包含振幅SAR图像的斑点统计。此外,我们由SAR数据的统计模型得出了一个能量泛函,它遵循法则极其参数。该泛函被用于推动水平集分割均质和异构区域。该泛函的能量值高低是区分SAR区域的判别依据。
实验结果包括对合成和真实SAR图像的的测试,表明了我们所提出的方法的准确性。从蒙特卡罗实验中我们观察到,使用相同的一组水平集参数,算法执行令人满意的程度是93%。此外,我们提出的评估方法的结果,与RFE系数一致,这说明基于噪声统计信息的随机方法是非常有前景的评估工具。
未来将研究我们所提出的泛函在SAR图像过滤和分类任务上的适用性。此外,不同的能量泛函可以通过不同的统计模型来得到,比如被分配给测定偏振的SAR图像的泛函。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。