赞
踩
目前为止,还没有可靠的物理模型来准确说明耀斑爆发的机制,但已经建立了很多数据驱动的模型来研究太阳耀斑并进行预测。本文讨论了太阳耀斑预测的现状,重点介绍了模型中的机器学习方法和数据处理技术。
通常基于数据驱动的模型的方法由以下三个步骤组成。
第一步是选择预测因素。普遍利用的两个因素是太阳黑子的分类信息和磁场的演化模式。虽然基于这两个因素的太阳耀斑预报取得了巨大的成就,但有必要提出新的前兆因素来反映太阳耀斑爆发的物理机制,以进一步提高预测精度。
第二步是在训练预测模型之前,对耀斑观测数据进行预处理。然而,在数据预处理中存在着不可忽视的问题。一方面,人造卫星工作的空间环境,如带电粒子、辐射和磁场,会在耀斑观测数据和图像中产生噪声。另一方面,由于耀斑爆发是一个小概率的事件,耀斑事件代表了样本数据中的少数类。耀斑样本数据的不平衡现象会给学习一个少数类的耀斑爆发模式带来困难。目前,大多使用重采样来解决。然而,重采样不能充分利用数据中的有效信息,它会给预测模型带来额外的误差。因此,迫切需要研究数据不平衡问题的预处理方法。
第三步是使用统计ML方法、深度学习方法或它们的组合来建立一个预测模型。单个模型和融合模型在预测任务中具有优势,对模型性能的评估需要对多个量化指标进行水平比较和分析。
后文的组织如下:
第一部分,分析了与太阳耀斑爆发密切相关的基本预测因素,如太阳黑子的分类信息和磁场的演变模式。
第二部分,介绍了耀斑样本及其预处理方法,主要包括样本标准化和归一化方法,以及样本的类不平衡处理方法,即数据预处理的重采样方法。
第三部分,从单一模型和融合模型方面回顾了耀斑预报所采用的典型模型结构,并分析了不同模型的预报性能。
最后,总结了目前太阳耀斑预报的研究,并概述了其发展趋势。
采用适当的预测因子可以显著提高耀斑预测模型的性能。由于太阳黑子的分类信息和磁场的演化模式与耀斑爆发有很强的相关性,因此将它们作为首选的预测因子。虽然其他参数与耀斑爆发有一定的相关性,并在一些研究中被用作预测因子,但其有效性仍需通过大量的实验来验证。
黑子参数
太阳黑子可以看做是太阳活动区域的良好标志,有助于活动区域的磁能积累,从而为耀斑爆发提供了条件。基于太阳黑子的直接观测量包括太阳黑子的数量、太阳黑子群的数量、太阳黑子群的面积、太阳表面的纵向延伸值以及太阳黑子的形态特征。
太阳黑子的形态和极性越复杂,耀斑爆发的可能性就越高。通过对太阳黑子的合理分类,研究人员可以更好地描述耀斑事件。根据太阳黑子的磁场极性和形态特征,太阳物理学家给出了以下三种分类方法。
Wilson Mountain magnetic classification:将太阳黑子组分为四个类型——αβγδ。取决于他们的极性,一个太阳黑子群可能同时对应于多个磁性分类。
McIntosh classification:使用三个字母表示一个太阳黑子群所属的形态类别,第一个字母被分类为七种类型:A、B、C、D、E、F和H。第二个字母表示最大的太阳黑子群的形态特征,包括六种类型:x、r、s、a、h和k。最后一个字母描述了太阳黑子的分布,并被记录为四种类型:x、o、i和c。
磁场参数
太阳磁场分为活动区、极区和宁静区磁场。磁场参数的主要来源是太阳光球层和色球层。太阳的物理状态、运动和演化与磁场密切相关,而磁场是太阳黑子和耀斑等太阳活动的直接驱动来源。
1具有较高耀斑爆发率的活跃区域表现出较大且显著变化的磁场梯度。
2光球磁场参数与耀斑日爆发率的统计关系,建立了M级和X级耀斑日爆发率预测模型。
3基于全太阳盘和矢量磁图的研究表明,耀斑爆发率与一系列描述光球磁场的非势性质和复杂性的物理量相关,如纵向磁场的最大水平梯度。
5不同能级耀斑活跃区域对应的涡量和磁通量差异很大,m级耀斑与大涡度相关,x级耀斑同时与大涡度和大磁通量相关。
6加权水平磁梯度(WGM)分析了耀斑爆发前活动区域的演化过程。通过研究两个典型的活动区域,可以观察到WGM及其时间序列特征与耀斑事件有很强的相关性。此外,磁螺旋度的演化与耀斑爆发密切相关。
7通过分析三个耀斑活动区域和三个非耀斑爆发活动区域,观察到耀斑爆发活跃区域的磁螺旋度演化具有明显的周期性,可能是耀斑爆发的一个有价值的前兆。
8使用12个月的矢量磁场数据提取四个物理参数作为耀斑预测因素,(1)纵向磁场的最大水平梯度,(2)中性线的长度,(3)奇点的数量,(4)光球磁自由能的总和
9强磁场区域的极性反转线(PIL)在耀斑活动中起着至关重要的作用。实验验证了仅使用视线磁图进行耀斑预测的可能性。
10提出了一个基于卷积神经网络(CNN)和与太阳活动区域物理参数相关的脉冲形态学解释的耀斑预测模型。
11kappa物理模型,该模型可以提前几个小时预测太阳耀斑的爆发。耀斑爆发的时间、位置和规模主要取决于太阳表面附近的磁通量密度。kappa方案通过分析与太阳耀斑相关的强磁场来做出预测。可以明确每次耀斑爆发的确切位置和尺度,并表明太阳黑子和活动区磁场演化特征作为耀斑预测的可行性。
历史耀斑事件
耀斑爆发是小概率事件,它们的爆发具有强周期性,具有局部特征。Park等人(2020)推断,成功预测耀斑爆发时间的关键是关注耀斑的平静和活跃阶段之间的过渡时期,他们提出了一种结合预测因子的方法来评估预测的准确性。实验表明,对于M级及以上的耀斑爆发,在预测过程中考虑时间积累或周期性,有助于提高耀斑的总体预测性能。
Roy等人(2020年)利用耀斑预测因子研究了太阳色球层的短期和长期波动。首先,他们获得了来自北半球、南半球和1976年1月至2014年12月的整个耀斑期间的数据,描述了耀斑爆发的周期性。惠特兰(2004)在预测模型中使用了活动地区耀斑爆发的历史信息。Nishizuka等人(2017)使用了2010-2015年的耀斑观测数据,提取了60个与耀斑相关的特征,包括磁中性线、电流螺旋度和历史耀斑率。实验表明,使用历史耀斑事件作为一个预测因子,可以提高预测性能。
其他因素
Aschwanden(2008)根据非线性科学的分形方法,研究了活动区域耀斑爆发的特定指标的分形维数与耀斑爆发率之间的相关性。
Yu等人(2009)基于粗糙集理论提出了预测因子组合的概念来选择基本的预测因子。他们解决了维度过多的问题,同时保留了尽可能多的关于数据的信息。
太阳10.7厘米的射电辐射流量突然增加的现象被称为射电爆发。恩达卡耶森加等人(2021年)进行了统计分析,并探讨了它们与太阳黑子数量的关系。实验表明,射电暴与太阳黑子的数量密切相关,其中65%与耀斑事件有关。
Panos & Kleint(2020)认为光球磁场数据不能完全满足耀斑预测的数据源,他们首次将耀斑预测的研究扩展到光谱数据。研究表明,仅从光谱数据中就可以生成性能良好的耀斑预测模型,从而证实了利用光谱数据进行耀斑预测的可行性。
由日本天空实验室项目进行的太空卫星观测已经确定了耀斑爆发的几个新特征。根据耀斑爆发的特点发现,提取耀斑相关的预测因素:日冕层的密度增加一到两个数量级的加速粒子释放热量,然后向太阳内部到达色球层。在色球层中,粒子释放的热量增加了等离子体气体的温度,并通过蒸发将其膨胀成一个等离子体环。随后,环状等离子体被能量传导和辐射冷却,并流回日冕层。通过对x射线的成像,观察到x射线通常是在闪光阶段从耀斑的底部发射出来的。从耀斑前阶段开始,覆盖耀斑的日冕流带通常以气泡的形式喷出,被称为日冕物质抛射(CME)。
归一化和标准化
由于太阳耀斑数据集中不同的预测因子具有不同的维度和数量级。当单个特征之间的数量级差异显著时,如果将原始指标直接输入模型,则数量级较大的特征在函数计算中占主导地位,值较小的特征会被忽略,这可能会导致大量的信息丢失。因此,为了保证结果的可靠性,对原始特征必须进行归一化处理。最常见的归一化方法是最小-最大归一化。
采用标准化方法进行预处理,如公式3所示,其中μ和σ分别表示样本数据的均值和标准差。转换后的样本数据的平均值为0,方差为1,这减轻了样本异常值对缩放结果的影响。
类不平衡处理方法
数据集的不平衡状态可分为两种类型:类间不平衡和类内不平衡。其中,类间不平衡是指数据集中不同类别之间的样本数量的不平衡。类内不平衡是指某一类样本空间内数据分布密度的不平衡。也就是说,有多个子类别具有相同的类别和不同的数据分布。耀斑爆发的频率随太阳周期的变化而变化,周期约为11年,活动期耀斑爆发的次数明显多于平静期。因此,在耀斑样本中也存在类内不平衡问题,但目前的研究大多集中在耀斑样本中的类间不平衡问题对模型预测精度的影响上。
解决类不平衡的重采样方法通常包括过采样、欠采样和混合抽样。传统的过采样或欠采样方法只是将样本的数量改变为一个平衡的比例。欠采样方法可能导致样本信息的丢失,过采样方法可能导致人为误差。同时,如果数据中的信息没有得到充分利用,给模型引入额外的误差。大多数研究使用基于重采样的方法来处理耀斑数据中的类别不平衡。
基于ML算法的耀斑预测模型主要依赖于从太阳活动区域提取或收集的太阳黑子形态和磁场演化参数等信息。预测模型的核心是建立耀斑爆发与所选参数之间的复杂非线性相关关系。
根据其结构特性,将模型分为静态、动态和自组织类型。静态模型的输出只与当前时刻的输入有关,即从当前时刻的观测结果中描述了预测期间的耀斑情况。动态模型引入了活动区域的演化信息,即基于活动区域的当前状态,也考虑了活动区域先前状态的影响。自组织临界性模型是基于自组织临界性理论,该理论假设当系统处于临界状态时,其所有组成部分的行为都是相互关联的。在耀斑活动中,这反映在磁重联事件中,通过释放磁场能量,使磁场梯度小于临界状态值。当加入一个新的磁场矢量时,就会重复这一过程,最终将磁场驱动到一个临界状态,从而导致耀斑爆发。
单个模型
Liu等人(2017a)利用SDO/HMI活动区域斑块(SHARP)提供的物理参数,训练了一个基于随机森林(RF)的耀斑预测模型。根据x射线耀斑产生的最大辐射强度,他们将耀斑爆发的活跃区域分为四类,以预测在24小时内特定活动区域内某一类型耀斑的爆发概率。实验结果表明,采用SDO/HMI参数训练的射频预测模型具有较高的预测率。这是射频首次被用来对太阳耀斑进行多级预测。同年,使用RF训练的模型预测给定活动区域24小时内特定强度的耀斑爆发。
斯坦尼斯拉夫斯基等人(2019年)通过对2017年7月至9月当前太阳活动最小时期观测到的软x射线发射数据进行分析,表明太阳耀斑的爆发或非爆发状态符合隐藏马尔科夫模型(HMM)。在接下来的一年里,他们提出了一种使用HMM来预测软x射线耀斑爆发的统计方法。
Falco等人(2019年)描述了一种基于太阳黑子群特征的耀斑预测工具,假设耀斑爆发的频率遵循泊松统计数据。该工具使用观测仪器收集太阳黑子群的形态属性,然后计算活跃区域耀斑爆发的概率。它结合太阳黑子形态参数和统计技术,具有较高的预测率,对高强度的耀斑爆发更敏感。为了进一步提高耀斑预测的准确性,Yuan等人(2016)提出了一种结合主成分分析(PCA)和SVM的耀斑预测模型,并综合考虑了太阳黑子参数和10.7 cm太阳射电通量等预测因素。首先对上述参数进行编码,对数据集进行预处理。随后,利用PCA提取主要特征,并应用SVM建立预测模型。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。