赞
踩
基于光谱反射率数据的经验植被指数被广泛应用于生物圈遥感,因为它们是冠层结构、叶片色素含量以及植物光合作用潜力的可靠替代指标。利用光谱通道之间的所有高阶关系,归纳了广泛的常用植被指数家族。这导致了对植被生物物理和生理参数的更高的敏感性。本文提出的归一化差分植被指数(NDVI)的非线性概化方法不断提高了对叶面积指数、总初级生产力和太阳诱导叶绿素荧光等关键参数的监测精度。结果表明,统计方法最大限度地利用了光谱信息,解决了陆地生物圈卫星对地观测中长期存在的问题。非线性NDVI将有助于更准确地测量陆地碳源/汇动态和稳定大气CO2和减缓全球气候变化的潜力。
介绍
从太空中量化植被覆盖、生物化学、结构和功能是研究和理解全球变化、生物多样性和农业的关键。在实践中,遥感很大程度上依赖于利用(和滥用)由光谱反射率得出的植被指数,因为它们的性能一般不错。VIs是一些光谱波段的参数转换,旨在最大限度地提高它们对特定生物物理现象(例如,绿度、含水量或光合作用活性)的敏感性,同时最小化它们对土壤性质、太阳光照、大气条件和传感器观测几何等因素的敏感性。指标是根据特定的应用和条件设计的,其参数是根据经验确定的。
在对地观测中应用最广泛的VI无疑是归一化植被指数(NDVI)。该指数利用了绿色健康植被在反射红光和近红外(NIR)辐射方面表现出截然不同的行为这一事实。树冠层中的叶绿素越多,就越有可能吸收更多的可见光(包括红色的光)来驱动光合作用,因此吸收的能量就越高,这可能会在固碳过程中被消耗。另一方面,随着活植物生物量的增加,植被会发射、反射更多的近红外辐射,这是无法进行光合作用的。通过计算测量红色和近红外波段之间的差异,NDVI强调了绿色植被的特殊特征,同时衰减了非植物要素的不良影响。NDVI等类似指标已被证明可以有效地评估叶绿素含量,可以很好地替代植被密度参数,如叶面积指数(LAI)和植被覆盖度(FVC),以及吸收的光合有效辐射(fAPAR)。NDVI的成功依赖于它的易用性和它在扩展了30多年的长期观测记录中的可用性,特别是由于先进甚高分辨率辐射计(AVHRR)、陆地卫星光学传感器(多光谱扫描仪、专题绘图仪、增强型专题绘图仪、业务陆地成像仪)、和中分辨率成像光谱仪(MODIS)。
然而,NDVI有两个主要的局限性。首先,NDVI与绿色生物量呈非线性饱和关系。一些指数,如增强型植被指数(EVI)试图利用来自其他波段的信息来弥补这一点,但饱和度问题仍然存在。其他方法尝试改进NDVI的启发式方法,以获得fAPAR和光利用效率的良好代理,因此建议将其用于总初级生产力(GPP)估算。实际上,一些作者提出了NDVI²(平方)和其他任意指数来处理非线性问题。第二个问题是,VIs是通过结构,对绿叶的存在做出反应,而不是对光合作用本身做出反应。因此,GPP可以在不发生叶脱落(即LAI减少)或叶绿素减少的情况下下降。从卫星测量中估算GPP变异性的一种相对较新的方法是来反演太阳诱导的叶绿素荧光(SIF)。然而,冠层GPP与空间反演的SIF之间的关系仍未被完全理解,更重要的是,该技术仍然只能获得过粗的空间分辨率和非常浅的时间存档。
通过使用辐射传输模型,Sellers等人 早就指出,与NDVI相比,近红外反射率是fAPAR的更好代表。接下来的问题是将混合像元中由植被反射的近红外部分与由非植被元素反射的近红外部分的剩余部分分开。为了解决这一问题,Badgley等人 提出将NDVI作为植被覆盖度的代理而不是fAPAR的代理,从而将NDVI乘以NIR计算出一个新的指数NIRv,该指数在特定的时间尺度上与SIF和GPP具有较高的相关性。尽管NIRv在社区中广受欢迎,但它也提出了一些有趣的问题。例如,假设 fAPAR 是由它的两个分量(NIR 和 NDVI)估计的,这对指数的解释有何影响。此外,由于 NIRv 与 NIR 反射率成线性比例关系,它如何处理饱和度。最后,NIRv仍然使用与NDVI相同的波段,但不清楚采用的近似和假设如何影响NIRv,也不清楚它是否利用了这些光谱波段的所有可用信息。
本文介绍了一种基于光谱波段的差异和比值来推广可见光光谱的方法。与以往基于原则 或启发式参数变换 来改进指标的方法不同,这里我们采用了机器学习的观点,使用了核方法的理论,该理论被广泛用于从线性算法推导非线性算法,而仍然需要用到线性代数运算 。核方法利用非线性特征映射将涉及的光谱波段映射到一个定义了索引的高维空间。计算可以通过定义一个核(相似度)函数来表示光谱通道,因此不需要显式地定义feature map。核方法的主要特性是线性化问题,这是大多数指数以启发式或基于第一原理的方式寻求的。此外,通过使用一个特定的核函数,我们可以保证光谱通道之间的所有高阶关系都被考虑在内,而不仅仅是一阶关系。例如,当使用近红外波段和红色波段的差异时,核函数也总结了这些差异的所有单项,即在单个标量中{NIR-red, (NIR-red)2, (NIR-red)3,}。虽然内核方法原则上可以应用于任何VI(见S1.5节和表S1),但本文所阐述的框架是为了推广NDVI,这主要是因为该指数具有悠久的历史和广泛的用途,尤其是用于进行全局和长期的研究。我们明确定义了希尔伯特空间中的NDVI,并采用径向基函数(RBF)复制核,k(NIR,红色)= exp((NIR红色)2/(2σ 2)),其中参数控制了NIR和红色波段之间的距离概念。本文提出的核NDVI (kNDVI)简化计算:
其中斯塔是在每个特定应用中指定的长度尺度参数,表示该指数对稀疏/浓密植被地区的敏感度。一个合理的选择是取平均值 斯塔= 0.5(NIR +红色)(见第S1和S2节的数学和生理生态论证),这导致一个简化的操作指数版本表示为kNDVI = tanh (NDVI²)。核函数的选择和参数的设定使得kNDVI可以进行自动的、像素级的自适应拉伸,并保证了近红外和红色通道之间关系的所有时刻都被考虑在内。这也使得kNDVI能够处理饱和效应、复杂物候循环和季节变化,处理混合像元问题,并传播比其他指数更低的不确定性(第S2.5节)。从理论上可以看出,kNDVI实际上是对NDVI和NIRv的一般化,从而保证了性能的提高。最后,本文提出的方法,特别是kNDVI,在实践中易于实现和使用,对业务研究具有重要意义。
结果与讨论
研究表明,在关键的独立产品(GPP,通量塔估计和全球臭氧监测实验2 (GOME-2)的SIF)中,kNDVI始终表现出比NDVI和NIRv更强的相关性。总体而言,该指数在所有应用、生物群落和气候带方面均优于NDVI和NIRv。kNDVI对饱和度、偏差和复杂物候循环具有更强的抵抗力,在时空尺度上对噪声和稳定性表现出更强的鲁棒性。通过进一步的结果,如拟合MODIS LAI、与其他相关参数(如fAPAR和FVC)的相关性、作物产量估算以及利用kNDVI进行图像变化检测,进一步证实了该方法的有效性。所有这些特性和性能都是在不采用任何特定假设的情况下实现的,只是利用了所涉及的反射之间的所有高阶统计关系。
精确的GPP代理
我们利用FLUXNET数据库中的通量塔GPP估计,**评估和比较了作为GPP(扰动)代理的kNDVI、NDVI和NIRv的性能。**在所有考虑的生物群落和所有 169 个通量塔站点中,拟议的 kNDVI 与 GPP 的相关性与其他指数相似或更好(表 1)。常绿阔叶林的关系最弱,这可以预期,因为在这样的生态系统中,饱和效应更强(使用指数来估算LAI时同样清楚)。kNDVI在每个生物群系中均表现优异,证实了其适应性,在整体上表现出明显的增益(图1)。
虽然光合作用是由像元内的植被光合质量来驱动的,但太阳照射和环境约束也起着关键作用。后者不能被近红外和红波段提供的光谱信息所解释。这解释了为什么在所有生物群落中,所有指标与GPP和SIF的相关性都低于与LAI的相关性。然而,在几乎所有的情况下,kNDVI的相关性都较高。GPP与指标之间的非线性关联的其他度量方法,如Spearman相关性、互信息和距离相关性,得到了类似的结果和结论,从而证实了kNDVI在隐式线性化问题方面的良好能力。
我们研究了各站点指标的鲁棒性。图2显示了所有169个通量塔站点的密度和斜坡的箱形图(从0到1缩放)。NIRv指数的均值接近0.5,但差值高于kNDVI。NDVI和NIRv都表现出非常宽的胡须(从而表现出病理行为和对异常值的高敏感性),而kNDVI表现出更高的鲁棒性和稳定性。对所有塔的简单分析表明,kNDVI 在 84 个塔 (50%) 中表现优于 NIRv 在 59 个 (35%) 和 NDVI 在 26 个 (15%)。落叶和常绿阔叶林的kNDVI增益更明显,这说明不同生物群落(主要是森林)对不同的光合物候具有较好的适应能力。当查看图 3 中一些说明性地点的林分光合作用的季节性模式时,这一点得到了证实,以月 GPP 表示。 例如,CA-TP4(安大略省土耳其点 1939 年白松种植园)是一个以茂密覆盖的木本植被为主的地区,全年都有绿色的树叶。与分别对季节性变化的 GPP 表现出相对过多和过低敏感性的 NDVI 不同,kNDVI 更好地遵循时间形状,并且也捕获了较高和较低的 GPP 值。这可能是由于NDVI基本看不见的细微色素变化,但kNDVI可能更容易检测到,正如最近NIRv所显示的那样(29)。对于草原,如CH-Oe1 (Oensingen, Switzerland),无论是NDVI还是NIRv都不能从背景噪声中分离出植被的物化周期,而kNDVI可以得到可接受的结果,具有更大的动态范围。在这里,树木和灌木覆盖率低于 10%,并且观察到水和草本或木本植被的永久混合,导致复杂的地形加剧了强烈的混合像素问题。IT-Ro1(维泰博附近的Roccarespampani-1)是一片落叶阔叶林,由阔叶树群落组成,具有明显的长叶和落叶周期的年循环,kNDVI指数忠实地遵循这一周期。NIRv和kNDVI表现出非常相似的特征。一个有趣的例子是封闭的灌木丛。肯尼迪航天中心CSH US-KS2地块的常绿和落叶灌木混交林植被,在NIRv (R = 0.68)和NDVI (R = 0.57)的基础上,通过kNDVI (R = 0.72)对其进行有效处理。在这里,与NIRv不同的是,拟议中的kNDVI并没有高估或低估GPP。总的来说,我们发现kNDVI对光合作用的季节动态有较好的跟踪,与GPP的一致性较好。这是通过自适应地拉伸动态范围来实现的,以更好地捕捉时间序列的极端情况(例如,稀疏和密集的植被,以及寒冷和干燥的地区)。提出的kNDVI似乎在很大程度上正确地反映了背景效应(在稀疏植被或积雪中很重要)和饱和度,而且可能对基于颜料而不是结构本身的细微绿色变化(如常青树)更敏感。
生态系统光合作用活动的密切监测
最近的研究将 SIF 和 VI 联系起来,例如 NDVI 和 NIRv (20),作为更复杂的机器学习方法的实用替代方案 (30)。我们在这里评估从 MODIS 反射带计算的 kNDVI,以在 16 天的时间分辨率下近似全球网格化 GOME-2 SIF。尽管 GOME-2 可以同时测量 SIF 和 NIR 以及红色波段,但我们有意独立于同时发生的 MODIS 数据估计所有指数(参见 S6 节中的处理细节)。我们计算了时间序列之间的相关性。kNDVI总体上优于其他指标(图1),在所有生物群系中(表1),尤其是在DBF、GRA和CRO中:与NIRv相比,相关性增加5 ~ 11%,与NDVI相比,相关性增加20 ~ 35%。
为了确认对极端SIF值捕获的鲁棒性,我们研究了时间相关系数的空间图。在所有区域,kNDVI都具有明显的优势(图4,上),与SIF的相关性在69.69%的像素上优于NIRv,在91.32%的像素上优于NDVI(图4,下)。结果表明,在热带植被密集地区(如亚马逊和印度尼西亚)和干旱地区(如澳大利亚和地中海),kNDVI明显优于其他指数。至于GPP的情况,其他相关度量得出了相同的结论(表S7)。进一步分析证实,在所有纬度地区,尤其是高、低纬度地区(表S10),以及在所有气候带,尤其是干旱区和寒区(表S9), kNDVI均占主导地位。
在图4的研究区域中,kNDVI与NDVI、NIRv的差异最大,在图5中进一步考察。
在所有情况下,kNDVI都提供了更好的拟合分数,通常更大的偏移以及对噪声和饱和度的更强抵抗力。kNDVI的较高准确度(例如,在加利福尼亚,NIRv上的R值为+19%)主要来自于明显的物候循环的存在。在伊比利亚半岛,kNDVI和NIRv在定量上表现相似,但所提出的kNDVI受高频分量影响较小,能较好地覆盖整个动态范围。在澳大利亚,良好的R(+25%)数值增益和低得多的散射高光使kNDVI较好地逼近SIF,并与周期密切相关(特别是在3 - 4 - 5月期间)。尽管在亚马逊地区,GOME-2对SIF的估计存在很大的挑战,但与其他指数相比,kNDVI可以是一个更方便的选择,因为它能更好地处理噪声和背景效应(如土壤、静水或雪)。总而言之,建议的kNDVI似乎能更好地应对噪声、饱和度和复杂物候。
当我们研究时间上的空间相关性时,也得到了类似的结论:建议的指数在NDVI和NIRv上取得了显著的改善,特别是在8月和11月之间,由于其适应性拉伸,从而改善了秋季物候(见S6节的图S10)。在较好的时间分辨率(原生双周)上,kNDVI具有较强的竞争力,明显优于NDVI(+15%)和NIRv(+4%),但在双月尺度上,由于时间聚集导致更线性的问题,这种优势消失了。同样,更广泛的空间聚集(从0.5到2)使所有指标的结果都有所改善,但kNDVI仍优于其他独立于空间尺度的指标(section S6和图S11)。
最后,我们研究了kNDVI处理混合像素问题的能力(图6)。与明显饱和的 NDVI 不同,kNDVI 和 NIRv 都与总 NIR、NIRT 成比例。在植被覆盖程度较高的像素上,kNDVI与SIF的相关性较强,但在植被覆盖程度较低的像素上,相关性降低(图6)。kNDVI与NDVI的差异明显,且kNDVI与SIF的相关性略高于NIRv,说明该指数也能可靠地分离出植被归因的反射率比例。这些属性直接来自 NIR-red 关系,因为在设计索引时没有做出任何假设。考虑到所有的NIR-red关系,我们可以有效地优化解混像元问题,特别是在植被密集的地区(例如,S4和图3中作物的LAI和GPP物候)。
自然和农业系统的研究应该从这里提出的kNDVI中受益匪浅,因为它具有坚实的理论基础以及易于计算和应用。该指数与GPP和SIF的相关性在整个生物群落中都很高,特别是在草原、农田、混交林和干旱区,表明该指数可以有效地解决传统指数所面临的饱和和混合像元问题。提出的kNDVI解释了通量塔水平上GPP的很大一部分方差,对噪声和饱和显示了良好的鲁棒性,并增强了跨空间的稳定性。kNDVI也与独立传感器获得的SIF高度相关,这为我们在全球尺度上提高对光合作用的量化和理解铺平了道路。它的应用和用途不仅限于植被监测,还包括变化和极端检测、物候和绿化研究、参数升级,以及所有以往已经证明其实用性的应用。我们的结果表明,不可知的统计方法足以解释大多数观察到的信号。
内核方法框架允许我们概括所有 VI,但我们只关注 NDVI 情况。 一般来说,内核方法,特别是 kNDVI,在光谱带映射到的高维特征空间中实现原始操作(例如,NDVI)。因此,kNDVI的解是NDVI的非线性版本。这个框架允许我们隐式地完成线性化运算。这意味着不需要特别的参数转换,只需要内核操作。这也意味着当频带和感兴趣的参数之间的关系是线性时,例如当应用适当的 PAR 归一化(参见 S5.2 和 S6.4 节)或 每当一个在更大的空间或时间尺度上进行平均(见 S6.3 节)。然而,我们的结果表明,kNDVI 实例化改进了所有问题的结果,即使域之前是线性化的。这使得索引成为一个非常强大和实用的默认选择。我们预期将广泛使用和发展所提议的指数,特别是非线性信息系统系列,以便为实际的地球监测和陆地生物圈生命迹象的量化提供资料性指标。
材料与方法
数据集和处理
GPP和FLUXNET数据
GPP数据来自FLUXNET,它是多个区域网络站点的集合(31)。这个网络提供了一份原位观测的汇编,用来测量二氧化碳、水蒸气和生物圈与大气之间的能量交换(32)。为了计算GPP,采用涡度相关法测量二氧化碳通量,即生态系统净交换量。利用白天(33)或夜间(34)的划分方法,该通量进一步划分为生态系统呼吸和GPP [gC m 2天1]。在我们的分析中,我们使用了使用日间分区方法获得的免费可用的Tier 1数据集的GPP估计值。在所有可用的站点(212个)中,我们选择了169个站点的子集,这些站点对应的自然植被由于云污染而丢失的遥感数据不到50%。此外,我们只考虑那些有超过4个月可用流量数据的站点。
GOME-2的SIF数据
我们通过MetOp-A上的GOME-2传感器测量得到的二级数据,在740 nm处产生了GOME-2 0.5荧光,在670和780 nm处产生了反射率。(35)中提出的SIF [mW/m2/sr/nm]检索算法利用了植物叶绿素荧光引起的夫琅和费株系的填充。数据被划分为16天,分辨率为0.5,覆盖了11年(2007 - 2017年)。在计算或平均结果之前,不进行空间平滑或时间平均。高太阳天顶角观测(SZA >70)从分析中删除,以及云量超过50%的多云场景,以及在当地时间下午2点至上午8点之间进行的观测。考虑照明校正SIF/cos(SZA), cf6节。
MODIS BRDF 校正反射率
MODIS反射率数据来源于MCD43A4.006双向反射率分布函数(BRDF)-Adjusted reflectance 16天L3 Global 500m product(36)。它们由土地过程分布式活动存档中心(LP DAAC)分发,也可在谷歌地球引擎(GEE)上获得。MCD43A2 MODIS产品包含相应MCD43A4产品的辅助质量信息,也被用于避免低质量BRDF估计。我们计算了这些指数,并在 11 年的 SIF 数据中以 16 天的时间和 500 米的空间尺度进行了分析。
分析
一般原理
在我们所有的实验中,我们使用的是来自MODIS的反射率值,但也可以使用辐射值或数字计数。我们实验中的通量塔GPP估计来自(31)中的站点级数据。SIF产品来自GOME-2,因此产品完全独立于MODIS反射率。GPP和SIF相关性是在时域中计算的,而对于SIF,我们还在空间中计算相关性,然后对随时间的结果进行平均(结果如S6节所示)。
在所有的情况下,我们计算指数(NDVI、NIRv和kNDVI)与有意义的植被分类中的产品之间的相关性:针叶林、常绿阔叶林、落叶阔叶林、混交林、灌丛、稀树草原、草本和栽培。这是由于国际地圈-生物圈方案(IGBP)有意义的分类(见第S3节)。对SIF结果的分析也考虑了聚集气候带(热带、干旱、温带、寒冷和极地)、月平均值和纬度平均值(见S6节)。
kNDVI计算
kNDVI指数定义为:
其中n, r∈ℝ分别为近红外通道和红色通道的反射率,核函数k表示这两个波段之间的相似性。我们在所有情况下使用RBF内核,k(a, b) = exp(−(a−b)2/((22)),其中参数控制着近红外和红色波段之间的距离。这个核函数得到了一个重要的简化
其他的内核函数也是可能的,但RBF内核是使用最广泛的内核函数,因为它具有理论和实践上的优点(见S1和S2部分)(24,25)。我们将长度尺度参数=近红外光谱与红波段之间的平均距离,= 0.5(n + r)作为核方法文献中的标准启启式,计算出kNDVI,使指数自适应于每个像素,在实践中效果很好。注意,这种简化进一步减少了索引为
每个生物群系对做了进一步的优化,但结果没有明显改善(结果未显示)。
可复制性:开源软件和数据
所有的计算、可视化和分析都是使用MATLAB编程语言进行的。我们存储和处理netCDF文件和表格数据。kNDVI可以很容易地编码和应用。我们用五种标准编程语言(MATLAB, R, Python, Julia和IDL)和GEE的S10部分给出了实现。
补充资料
利用核函数概化植被指数
新的非线性植被指数家族基于核方法(38,24),这是一种机器学习方法,可以在仍然依靠线性代数运算的情况下,从线性算法推导出非线性算法。我们首先回顾了特征映射和核函数的主要理论性质。并以NDVI为例说明了基于核的植被指数框架。
特征映射和内核函数
推导非线性(核)索引需要定义一个特征映射φ(·)到一个带有核复制特性的希尔伯特空间H。
复制核希尔伯特空间(RKHS)。给定一个希尔伯特空间H具有d上的函数,即f: Rd R,如果k(x,·)H,则函数k(·,·):Rd Rd R称为H的再现核,H为RKHS。
希尔伯特空间的性质。希尔伯特空间H是一个含有内积的空间。设H是上面的一个向量空间。如果:(1)α1f1+α2f2, g H = α1f1, g H+ α2f2, g H;(2) f, g H = g, f H;和(3)f, f H 0,和f, f H = 0 iff = 0。
复制属性。如果x Rd和f H,则f(x) = f, k(x,·)和乘积k(·,x), k(·,z) H = k(x, z),这就是核的再生性。因此,函数f可以表示为一个线性函数,由向量空间H中的内积定义。
一个说明性的例子:NDVI
归一化差分植被指数定义为NDVI = (n-r)/(n+r),其中n和r分别为近红外波段和红波段的反射率。这是一种差比运算:分子中的差可以转换为物理分量,而分母中的和则是一种归一化因子。对于核NDVI的公式,我们分别处理这两个分量。给定标量n, r r, d = 1,我们定义一个特征映射φ φ(n) H,关联的复制核k(n,·)= φ(n),·H, r也是如此。现在我们定义两个作用于关节(n, r)特征向量的特征映射
与相关的物理和归一化内核
我们可以将(n, r)的核NDVI变换估计为:
kNDVI中所有的核都是正定的。通过构造φ可以得到一个正定核k。ψ中的特征映射之间的差异可能不会得到一个有效的核,因为S1.1中的核函数的第三个性质可能会违反,因为m原则上可以是负的。
由于核m((n, r), (n, r)) = m((r, n), (r, n))是对称的,并且由于φ(n) φ®, φ(n) φ® H = φ(n) φ® 2 H 0是正的。实际上,对于RBF核函数的特殊情况,我们有k(x, x) = 1,因此m((n, r), (n, r)) = 2(1 k(n, r)) 0从0 k(n, r) 1开始构造。当n = r时,m((n, r), (n, r)) = 0,因此k(n, r) = 1。按照类似的参数,求和特性map φ也会导致一个确定的内核和((n, r), (n, r)) = 2(1 + k(n, r)) 0。综上所示,所有定义的feature map φ, ψ和φ都需要分别生成正定的核k, m和,并且核的乘法(ratio)也是一个有效的核,因此kNDVI是一个有效的核。
核函数的选择
任何内核的核心方法,尤其是kNDVI,合适的核函数的定义,k (a, b)。受欢迎的例子有效繁殖线性内核,内核是k (a, b) = ab,多项式k (a, b) = (ab + 1) p, p Z +,和径向基函数(RBF)内核中,k (a, b) = exp(2σ12 (b) 2),σR +。
NDVI等价于具有线性核函数的kNDVI。在线性核中,相关联的RKHS为空间R, kNDVI平凡化简为标准的线性NDVI
更高的时刻内核。在p次多项式核中,kNDVI有效地只计算p阶的矩量
对于高斯核,RKHS具有无限维,而kNDVI测量了近红外和红色通道反射率之间的高阶光谱相关性。此外,需要注意的是,对于上述RBF核,自相似度k(a, a) = 1,因此kNDVI测度简化为
核参数的说明与解释
在内核方法中,设置内核参数是关键的,对解决方案有重要影响(25)。我们在所有的实验中都使用了RBF,并将长度尺度参数σ设置为近红外和红色之间的平均值,σ = 0.5(n + r)。σ是一个合理的选择;注意,σ应该反映输入数据之间的相似性概念(在我们的情况下,近红外和红色反射率)。在核方法文献中,习惯将其固定在物体之间的平均距离(这里是近红外和红色通道的反射率)。这种选择也可以解释为像素s反照率的粗略估计,见图S1:在裸土上自动选择较高的σ。
有趣的是,通过这种近似,简化后的kNDVI是NDVI的一个方便的双非线性变换,因为它简化为kNDVI = tanh(NDVI2)。首先对NDVI进行平方,然后用s形函数对结果进行压缩。一方面,(11)中提出NDVI的平方可以作为fAPAR乘以LUE的代表,因此对GPP的估计非常有用。另一方面,双曲函数可以提高在高值时的敏感性,如在管理的农田,并减少众所周知的NDVI在低值时的偏差,在低值时,光合活性低或不存在。
参数σ直接影响指标的非线性,对指标性能有较大的影响。然而,在我们的实验中,我们使用了非常有效的均值启发式。实际上,优化每个生物群落或气候区域的σ来近似GPP, LAI pr SIF并没有比提出的启发式方法提高多少(结果未显示)。原因是索引已经是像素化的了。不同的像素σ值证明了kNDVI对动态范围的高度适应,从而解决了干旱、干旱、植被密集和稀疏地区的挑战性情况。指定的参数扩展了预测以适应高动态范围(例如图3中的GPP估计和图S8中的LAI估计),同时减少了偏差和饱和问题。这种行为可以通过指数对NDVI的敏感性来解释,见S2和图S3。σ = 0.5(n + r)实际上对稀疏植被区(低NDVI,避免了偏置问题)几乎没有敏感性,在混合像元(中等NDVI)中,它与NDVI大致线性变化,而在高植被区(高NDVI,减少了NDVI饱和问题),其敏感性降低。这反过来对误差传播有积极的影响,见S2.5。
用核函数方法概化标准植被指数
核方法可以很容易地应用于现有文献中的任何植被指数,只要它可以表示为光谱通道之间的点积函数。表S1显示了一些内核化索引的示例.
首先,必须选择一个适当的核函数k(例如线性、多项式或RBF)。我们推荐高斯核- rbf核-函数,因为它捕捉了所涉及的光谱通道之间的所有高阶关系,并且只包含一个超参数可供选择,在许多应用中一般都能得到良好的结果。其次,必须选择或优化内核参数。这可能非常具有挑战性,并且取决于问题。对于kNDVI, σ参数作为近红外和红光反射率的平均值是可行的,但对于其他核化指标,由于所涉及的通道之间的关系,这可能会造成麻烦。
kNDVI的数学性质
我们给出了保证其通用性的核NDVI的一些数学性质:kNDVI概括归一化植被指数和NIRv,它捕获所有(无限)的高阶时刻NIR和红乐队使用RBF核函数时的关系,kNDVI适应sparsely-vs-densely植被地区通过内核参数,和传播指数谱带的不确定性。
核植被指数是对原始植被指数的概括。当使用线性核时,索引的内核版本减少到标准对应版本。例如,将线性核函数k(n, r) = nr和k(n, n) = nn代入式(1),很容易看出,kNDVI还原为标准NDVI。
(20)中的NIRv是kNDVI的一个特例。(20)中提出的NIRv指数偏离了标准的NDVI,假设像元反射率x由植被的一部分δ和土壤的1 δ组成,即对于每个波长λ, x = δxv + (1 δ)xs。然后,假设土壤组分在整个光谱中保持大致不变,即NIR,而植被组分的NIR反射率通常要高于红色反射率nv rv,可以得出NIRv = δnv NDVI n。现在,很容易表明,在提出的kNDVI中存在σ参数,得到了与NIRv相同的结果。本质上,在kNDVI中使用RBF核,并从方程中分离出σ
任何带高斯核的核化植被指数利用了所考虑光谱波段之间的所有关系。我们证明用核函数替换点积,特别是高斯RBF核函数,可以让我们考虑所有涉及光谱波段之间的高阶相似矩。假设核k(a, b) = φ(a), φ(b) = exp(γ(a b)2),为了简单起见,我们定义γ = 1/(2σ2) >0. 那么,显式特征图φ为无限维,可以表示为
图S2比较了SIF与不同指标(NDVI、NIRv和kNDVI的多项式和RBF核)之间的相关性。利用p = 1的多项式核函数恢复NDVI的解,而随着p的增加,红色和近红外波段之间的高阶关系被捕获。在极限下,使用RBF核利用了所有的高阶关系,并显示出最佳的相关性,比NIRv改善了结果
与遥感叶面积指数的相关性
**LAI是地球植被模拟和监测的重要生物物理参数。**许多研究报道了NDVI与LAI之间的非线性经验关系。然而,人们承认,这种关系随着植物和树木物候的发展以及环境条件的变化而在时间上发生变化(43)。本文给出了kNDVI与LAI的相关性,并与NDVI和NIRv进行了比较。
LAI数据和地表反射率
利用MCD43A4和MCD15A3H MODIS v006产品分别作为反射率数据和LAI估值。这两种卫星产品都提供500米的空间分辨率,并从Terra和Aqua航天器生成组合数据。它们由土地过程分布式活动存档中心(LP DAAC)分发,也可在谷歌地球引擎(GEE)上获得。MCD43A4提供每日全球双向反射分布函数(BRDF)产品,从七个MODIS陆地波段(红、近红外、蓝、绿、短波红外-1、短波红外-2和中波红外)的naddir视图。MCD43A2 MODIS产品包含相应MCD43A4产品的质量信息,也被用于避免低质量BRDF估计。MCD15A3H收集6产品每4天提供LAI估计值,并使用从三维辐射传输模型模拟的查找表(LUT)方法进行检索。该产品还提供了LAI估计的质量标志信息。
处理
我们使用GEE来处理2002年7月4日至2017年3月14日全球445个生物群落代表点的MODIS产品时间序列。所选的站点属于基准土地多站点分析和产品比较数据集(BELMANIP)(44)。它是利用现有实验网络(FLUXNET、AERONET、VALERI、BigFoot等)的420个站点建立的,并从GLC2000土地覆盖地图中选取了一些站点。更新后的BELMANIP2.1数据集补充了BELMANIP数据集,增加了25个站点,对应于裸土区(沙漠)和热带森林(图S5)。地点选择是通过保持所选地点内的生物群落类型比例与10宽纬带内的生物群落类型比例相同来进行的。注意到这些地点在10 - 10平方公里的面积上是均匀的,几乎是平坦的,城市地区和永久水体的比例最小。
由于使用的MODIS产品生产的时间频率不同,因此只选择其中符合的日期。用MCD43A4计算过滤无效像素后的指标。这是根据MCD43A2 MODIS产品提供的基于像素的质量标志进行的,排除了云、云阴影、雪以及质量较差的BRDF参数检索,MCD43A2 MODIS产品也可以在GEE中使用。此外,只使用MCD15A3H主算法提供的LAI估计值,并有意从备用算法中过滤估计值,因为备用算法内部使用NDVI和相关生物物理参数。因此,我们没有使用modis派生的LAI估计可能会受到NDVI的影响,以避免结果和结论的偏差。这产生了60078年的观察。LAI与kNDVI、NIRv和NDVI的相关性通过这些计算得到时域的观察。最后,也报告了全球生物群落的相关性
结果
我们在MODIS LAI估计的大数据集上评估了我们提出的作为LAI代理的kNDVI。结果表明,与NDVI (R= 0.74)和NIRv (R=0.76)相比,kNDVI (R=0.81)与MODIS LAI产品的相关性更好,详见表S4。这些结果在所有生物群落和条件下都可以观察到(图S6)。
每个生物群落类型的评估显示,kNDVI是与LAI最相关的指标(见图S6)。一般来说,相关性是高的,但EBF以上的相关性明显较低。这可能是由于在反射饱和度引起的EBF情况下,主算法的MODIS LAI反演率非常低(45)。此外,相关性的分布显示,kNDVI优于NDVI和NIRv(图S7)。
我们展示了栽培区和草本区考虑的指数和LAI的时间演化,见图S8。时间序列表明,kNDVI与LAI的时间行为相似,而NDVI表现较差,主要表现在稀疏期。该指数实际上更适应物候循环,对低植被也更敏感(见图S8)。当没有(或稀疏)植被时,kNDVI值接近于零,而NDVI系统地获得的值在0.2左右。这突出了在非常早期的物候阶段kNDVI的归一化能力,在土壤背景中呈现高亮度变异性。
GPP结果的附加分析
每个生物群落类型的塔级相关的量化
每个生物群落类型的评估显示,在7种考虑的生物群落类型中,kNDVI在预测GPP估计值方面通常优于其他VIs(见图S9)。在所有的生物群系中,相关性都是中等到高的,除了EBF生物群系类型,其中考虑的VI都没有充分发挥作用。这可以归因于反射饱和度问题(45)
辐射归一化GPP的线性化效应
在此,我们比较了用PAR标准化GPP对指标性能的影响。表S5显示了两种情况(GPP和GPP/PAR)下不同指数(NDVI、NIRv和kNDVI)之间的关联结果。在比较中,我们使用了线性和非线性的不同关联度量(即统计相关性);皮尔逊相关系数R;Spearman相关系数,RS (26);互信息MI (27);距离相关,直流(28)。必须进行这种分析,才能清楚地认识到标准化对各项指数的影响。
关于通过归一化的线性化与通过核的隐式线性化。
结果表明,通过PAR归一化GPP具有明显的线性化效果,因为独立于所使用的依赖度量,指数之间的差异更小(注意,虽然诱人,我们不应该将归一化和非归一化情况下获得的分数进行比较,因为应用了非线性变换,它们现在会产生不同的问题)。这种归一化对NDVI的影响最大,与NDVI几乎没有数值差异。
使用提议的kNDVI仍然可以获得一个明显的增益。毕竟,一般的核方法,特别是kNDVI,在一个特征空间中实现了NDVI的原始操作,其中NIR和red已经被映射到。kNDVI是该空间中的线性运算,而在原始(波段)输入空间中是非线性的。框架的简单性和优雅性允许我们隐式地完成一直寻求的线性化转换。这意味着不需要特别的参数转换,只需要内核技巧(25,46)。但是,这也意味着,当波段和感兴趣的参数之间的关系是线性的时,例如在PAR归一化之后或在更大的空间或时间尺度上工作(平均)时,几乎不会比其他指标获得任何增益(见S6.3)。我们的结果表明,kNDVI在所有情况下都改善了结果,但正如预期的那样,当域之前线性化时,增益是中等的。
线性与非线性的关系
GPP通常由卫星数据和光利用效率(LUE)模型估算(47、48、49、50)。它是一个简单的模型,由光合有效辐射(PAR)、植被吸收PAR的比例(fAPAR)和能量转换效率因子(LUE)组成。在LUE建模逻辑中,fAPAR(通常作为NDVI的线性函数计算)负责捕获光合生物量(绿叶、绿茎和嫩枝)的动态,而LUE和PAR变量提供GPP和光之间的关系。然而,卢模型假定GPP和吸收PAR之间的线性关系,这是有效的在一个广泛的生物群落和环境条件,但在高时间分辨率(日变化)由于非线性渐近的光饱和效应,这不是本研究的情况。这似乎就是为什么使用像kNDVI这样的高阶(非线性)方法似乎对每周的GPP/PAR没有很大帮助的原因。
SIF结果的附加分析
空间相关性
使用SIF进行的另一项研究计算了空间相关性和随时间变化的平均结果。506张图像(16- daily, 0.5o)的总体平均相关性(见表S6)显示,kNDVI (R = 0.84)优于NDVI (R = 0.69), NIRv (R = 0.81)的性能得到改善。kNDVI对所有植被类型的表征都很好(与NDVI相比R值为+21.7%,与NIRv相比R值为+3.7)。有趣的是,在针叶林中,kNDVI显著提高了NDVI(增益为+18.5%),但略低于NIRv(增益为-6.7%)。在不同纬度,kNDVI (R = 0.82)的精度也高于NDVI (R = 0.64)或NIRv (R = 0.80),但在高纬度(30o)更为显著。这与按气候带(Koppen地区)分类的结果相匹配:在寒冷地区,该指数实现了与NDVI的相关性平均提高+35%以上,与NIRv的相关性平均提高+3%左右。
月度和季节性相关性
图S10显示了2007- 2018年全年各指数与SIF的相关性,按月和季节分组。kNDVI和NIRv在所有情况下的表现相似,但明显优于NDVI。在SON月份和秋季可以观察到明显的收获。
时空尺度的影响
我们分析了SIF与不同时间尺度(双周、月、双月)和空间尺度(0.5、1,2)指标的相关性,见图S11。结果表明,在较好的时间分辨率上,kNDVI比NDVI(+15%)和NIRv(+4%)具有明显的优势,但在双月尺度上,这种优势消失了。更广泛的空间聚集倾向于改善所有指标的结果,kNDVI优于其他独立于空间尺度的指标。
辐射归一化SIF的线性化效应
在这里,我们研究了考虑由辐射归一化的SIF而不是原始SIF(以创建“SIF效率”的表达式)的影响。在我们的研究中,我们用cos(SZA)近似PAR,并研究了这种归一化(PAR/cos(SZA))对结果的影响。这背后的想法是“折扣”的联想由于季节性。在非归一化情况下,非线性相似度测度(Spearman、互信息、距离相关)与Pearson相关一致,有利于kNDVI,见表S7。当SIF归一化后,所有的测量结果仍然表明,建议的kNDVI排列更好,但结果被认为与NIRv相似。请注意,核方法通常,特别是kNDVI,解决非线性变换空间中的线性问题。由于SIF除以cos(SZA)的主要作用是使问题线性化,摆脱支配分布的强非线性季节循环,因此不期望NIRv有显著的改善。然而,尽管如此,对于所有衡量指标,该指数仍倾向于将两项指标一般化(改进)。这些结果在每个生物群系(见表S8)、气候带(见表S9)和纬度(见表S10)中也可以观察到。
叶绿素含量、叶面积指数与植被覆盖度的相关性
我们定量评估了kNDVI在实际的叶绿素含量(Chl-a)、叶面积指数(LAI)和植被覆盖度(FVC)测量中的表现。为此,我们将使用SPARC数据集(51,52)。bARrax运动光谱(SPARC)野外数据集包括不同的作物类型、生长阶段、冠层几何形状和土壤条件。SPARC-2003战役于7月12日至14日在西班牙La Mancha的Barrax进行(座标30 3 N, 28 6 W, 700米海拔)。对不同作物类型(大蒜、苜蓿、洋葱、向日葵、玉米、土豆、甜菜、葡萄园和小麦)共108个基本采样单元(ESUs)进行了生物地球物理参数测量。ESU是指与20 m左右的像素尺寸相匹配的地块。在分析中,没有对作物进行区分。
本研究中使用的数据是在西班牙巴拉克斯的两次陆地运动中获得的。试验区呈矩形,面积5 km ~ 10 km,形态平坦,土地利用单元面积大、均匀。该地区约有65%的旱地和35%的水浇地。使用了几种仪器来测量变量:校准的CCM- 200叶绿素含量仪用于Chl-a, LiCor LAI-2000用于LAI,用带有鱼眼镜头的数码相机拍摄半球形照片用于FVC。同时,我们使用CHRIS传感器的卫星图像。CHRIS测量的可见/近红外光谱范围为400至1050 nm。在这项研究中,我们使用了4天的模式1(62波段,全光谱信息)的CHRIS数据,其中地面性质的现场测量与卫星立交桥一起进行了测量。图像经过几何和大气校正。共收集了三组135次测量数据。结果如表S11所示,其中,与所采用的测量方法无关,kNDVI是不同的生物物理参数原位测量的更好代表:Pearson s相关R值较高;斯皮尔曼相关;互信息,心肌梗死;距离相关,直流;线性拟合的均方误差越小,性能越好。
区域作物产量预测
准确和及时的作物产量估算是目前农业研究的主要挑战之一,也是政府、公共行政部门和农场管理人员最关心的问题(53,54,55)。地球观测(EO)数据为高效的农业制图、作物监测和评估开辟了新途径,因为它允许获得空间明确和时间解析的生产和产量图(56,57)。利用EO数据进行作物估算的研究大多集中在可见光和红外传感器上。实际上,光学植被指数易于计算,可用于监测代表年内植被动态的植被数量、质量和行为(58,59,60)。NDVI在农业制图和监测中得到了广泛和成功的应用,并在许多作物产量研究中得到了应用(61、62、63、64、65)。
利用美国堪萨斯州玉米带5年的多角度成像光谱仪(MISR)数据,在县域尺度上获得了NDVI、NIRV和kNDVI的周平均时间序列。共选取了13个县域的79个同期产量序列。目标是从时间序列中估计玉米和小麦的作物产量。目标产量来自美国农业部(USDA)的记录。为了评估这些指标,我们开发了一个非常简单的作物产量估计模型:将指标时间序列作为特征向量来拟合线性回归模型。然后,我们计算了美国农业部估计和调查的作物产量之间的相关系数。我们还测量了每个指标和产量之间获得的最大相关性,作为估计能力的度量。结果见表S12。在这两种方法中,与其他指标相比,kNDVI改善了结果。
每个模型的均方根误差(蒲式耳/英亩)可以通过对种植面积进行归一化,转化为实际产量(蒲式耳)。从USDA.gov获得的信息。结果如表S13所示,线性预测模型中使用kNDVI获得的较低的误差,通常意味着与标准NDVI相比,产量估计较低(玉米约33 000蒲式耳/年,小麦约40 000蒲式耳/年)。
变化检测
本文介绍了植被指数在Sentinel- 2b多光谱影像变化检测中的应用效果。我们考虑了两个场景:2017年澳大利亚气旋黛比造成的自然洪水,以及美国加州山区野火的后果,见图S12。采用标准变化向量分析(CVA)方法,利用事件前后植被指数的绝对差值作为异常检测器。
图S13为指标的roc (Receiver Operating Curves)、曲线下面积AUC (area under the Curves)以及变化检测图。值得注意的是,与NDVI和NIRv相比,kNDVI实现了更好的检测性能,尤其是在假阳性率范围内。这可以在检测图像中得到证实,其中kNDVI提供了更清晰的检测图
源代码实现
基于核的植被指数易于编程和应用。在这里我们给出了标准编程语言的实现:MATLAB, R, Python, Julia, IDL和谷歌地球引擎(GEE)代码。在所有情况下,为了便于说明,我们在kNDVI中使用了标准的RBF核函数。
我们在下面的GEE链接中提供了一个简单的演示,该演示计算并比较了选定的感兴趣地区的NDVI、NIRv和kNDVI植被指数的时间序列。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。