赞
踩
灰色关联度分析
桥梁监测数据预处理过程中,对数据进行可信度评估的研究不多,异常检测方法的研究很多,但依然存在一些问题,存在过度剔除的问题,数据插补技术创新不足。一般应用的方法都是通过历史数据趋势模型和传感器返回的状态进行评估。灰色关联度分析用定量的方法描述了数据序列之间的关联程度,而同截面同类型的传感器数据是具有关联性的,所以把灰色关联度理论应用于同截面同类传感器数据的可信度评估是可行的。用基于统计特征的方法设定阈值对异常数据进行剔除,避免过度剔除。时间序列模型预测的对连续异常值的预测存在相对较大的误差,本文提出基于绝对关联度分析的预测与时间序列模型预测结合的方法对数据进行预测,消除了时间序列模型的预测误差。
1. 灰色关联度分析
灰色关联度分析方法属于一种多参数统计分析方法,用灰色关联度来定量的描述事物或参数之间的相互关系或变化趋势。如果有桥梁监测数据的两数据序列变化的态势(方向、大小和速度等)基本相同,那么这个数据序列之间的关联度较大;否则关联度较小。虽然对事物之间的这种关联性用回归分析、相关性分析等统计分析方法也能做出一些描述,但这些统计分析方法对数据的特征分布有一定的要求,而且对那种多参数没有典型分布特征的情况的分析难度很大。桥梁监测数据的各参数的数据分布没有很明显的特征,用关联度分析桥梁各参数之间的变化态势正好比较适合,而且灰色关联度分析方法原理简单、工作量小、容易掌握、应用方便。
1.1灰色关联度理论介绍
灰色系统理论自从邓聚龙教师在 80 年代提出后就快速发展起来了,许多学者也对其研究热情也很大,它的应用范围也越来越来广了,其应用范围拓展到了自然科学和社会科学的各个方面,特别是在经济领域,如社会经济各部门的投资收益、区域经济分析和产业结构整合等方面,都有很可观的应用效果。灰色关联度分析是灰色系统的重要部分,随着灰色系统理论的发展,它的作用也越来越大。
关联度分析就是系统的对事物进行分析,用来来定量的描述事物或参数之间的相互关系或变化趋势,其思想是通过样本数据列和几个比较数据列的曲线几何形状相似程度来判断各个数据序列间联系的紧密性,它反映了数据序列间的关联程度。灰色关联度分析度量了一个系统发展变化态势,非常适合动态过程分析。灰色关联度就是灰色关联分析的衡量工具,用于度量事物之间的关联程度。灰色关联度分析的主要研究对象是离散的数据状态变量,比如时序数据。与传统的相关性分析不同的是这种离散数据中两两数据不能调换位置,更不能任意两两调换时间顺序,否则会改变原数据序列的性质。
灰色关联度分析本质上就是关联系数的分析。首先,求出各个数据序列与由最佳指标组成的理想数据序列的关联系数,由关联系数计算得到关联度,再根据关联度的大小进行比较分析,得到结论.这种方法优于经典的精确数学方法,通过把目标、想法和要求模型化,这样就可以使要研究的灰色系统从结构和关系上逐渐由模糊变清晰,使不明确的因素逐渐明确。这种方法打破了传统数学绝不能模棱两可的约束条件,也与传统的相关性不同,具有原理简单、计算简便、易于掌握、排序明确、对数据分布特征无明显要求等特点,因此具有非常大的研究和应用价值.尤其是在计算机技术发展的支撑下,这种分析方法的应用范围也越来越大。
灰色关联度分析的计算步骤不复杂,具体如下所示。
首先要确认母序列与子序列,也就是确定参考数据序列和比较数据序列。所谓的参考数据序列就是反映系统行为特征的数列。所谓的比较数据序列,就是影响系统行为的参数组成的数据序列。
由于系统中各参数的物理意义不同,导致系统中各参数数据的量纲和数量级也可能不相同,这样就不便于比较,也可能会在比较时难以得到正确的结论。所以为了科学的进行灰色关联度分析,一般对数据都要做无量纲化处理。无量纲化的处理方法有初值化、最小值化、最大值化、平移化、规格化、均值化等。
1) 初值化
(2.1)
思想是:用数据序列 X 除于数据序列的第一个数据,从而得到一个新的数据序列。
2) 最大值化
(2.2)
3) 最小值化
(2.3)
4) 规格化
规格化方法分两种:标准差规格化和极差规格化:
(2.4)
(2.5)
5) 平移化
(2.6)
式中 c 表示一个常数,就是给原数据序列每个数据加上一个固定的常数从而得到一个新的数据序列,实现平移化。
6) 均值化
(2.7)
从数学的几何角度上看,关联程度本质上是参考数列与比较数据序列曲线形状的相似程度。比较数据序列与参考数列的曲线形状越接近,两者间的关联度较大;如果曲线形状相差较大那么两者间的关联度较小, 因此,可用参考数列曲线与比较数列曲线间的差值衡量关联程度的大小。
(2.8)
因为关联系数就是比较数据序列每个时刻与参考数据序列在各个对应时刻(即曲线中的各点)的关联程度值,所以它数量很多,然而信息过于分散的话,不利于进行整体性分析评价。因此有必要将每个时刻的关联系数集合起来弄成一个值,即求其平均值,作为比较数据序列与参考数列之间的关联程度的度量值,关联度r0i可通过下面公式计算出:
(2.9)
其中r0i为第 i 个比较数列与参考数列的关联度。
2. 灰色关联度方法
关联度计算方法中最典型的是邓氏关联度,但是随着许多学者对灰色关联度分析研究,其他关联度计算方法也不断被研究出来。现在常用的灰色关联度计算方法主要有:邓氏关联度、灰色速度关联度、斜率关联度、灰色 B 型关联度、C 型关联度、绝对关联度、T 型关联度等。 ①邓氏关联度 邓氏关联度是最典型的关联度计算模型,最先提出这个模型的是邓聚龙教授,是目前主流的关联度计算模型之一。
1)关联系数计算
则关联系数的计算公式为:
(2.10)
式中:
ρ 为分辨系数,用来减弱最大值过大对关联系数失真的影响,可以提高关联系数之间的分辨力。ρ 取值区间为(0,1),通常ρ 取值 0.5。
2)关联度计算
关联度的计算公式为:
(2.1)
它反映的是比较序列与参考序列在整体上的接近程度。
②绝对关联度
绝对关联度表示的是两个因素在变化势态上的关联程度的大小。对于离散数据来说,绝对关联度表示两时间序列的曲线上在对应各点的斜率的接近程度,如果两曲线在各时刻点上的斜率相等或相差较小,则二者的关联程度就大;反之,关联程度就越小。
1) 计算差商求斜率,即求参考数据序列与比较序列几何曲线在各个时刻的斜率。
(2.12)
2) 计算关联系数
计算公式为:
(2.13)
3) 计算关联度
关联度的计算公式为:
(2.14)
从上面公式可以看出,绝对关联度有两个特点:唯一性和对称。对称性是指两数据序列互以对方为参考数据序列计算出来的关联度和关联系数是相同的的,唯一性是指在样本量发生变化时,计算出来的关联系数不会变。绝对关联度没有邓氏关联度中的 ρ(即分辨系数),有一定的改进,但没有体现负相关性。
3、斜率关联度
斜率关联度与绝对关联度的基本思想相同,都是表示两个因素在变化势态上的关联程度的大小。只是在关联系数的计算方法有区别。 关联系数计算方法为:
(2.15)
那么斜率关联度为:
(2.16)
《来源于科技文献,经本人分析整理,以技术会友,广交天下朋友》
石显:桥梁监测数据预处理简介及技术——时间序列分析zhuanlan.zhihu.comCopyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。