当前位置:   article > 正文

时序、谱域和时域特征汇总

时域特征是什么

统计域的时序特征

  1. 最大值(Maximum)

  • 最大值是序列中的最大数据点。它表示了数据集中的最大观测值。

  • 公式:

最小值(Minimum)

  • 最小值是序列中的最小数据点。它表示了数据集中的最小观测值。

  • 公式:

均值(Mean)

  • 均值是序列中所有数据点的平均值。它表示了数据的平均水平。

  • 公式:

中位数(Median)

  • 中位数是序列中的中间值,将数据集分成两半,一半大于中位数,一半小于中位数。

  • 公式:首先将数据排序,然后中位数是位于中间位置的值(如果数据点数为奇数),或者是中间两个值的平均值(如果数据点数为偶数)。

偏度(Skewness)

  • 偏度度量了数据分布的不对称性。正偏度表示数据分布右偏,负偏度表示数据分布左偏。

  • 公式:标准差

峰度(Kurtosis)

  • 峰度度量了数据分布的尖峰性或平扁性。高峰度表示数据分布尖峰,低峰度表示数据分布平扁。

  • 公式:标准差

直方图(Histogram)

  • 直方图是将数据分成若干区间,并统计每个区间中数据点的个数。它可以用于可视化数据分布。

  • 公式:通常通过分组数据并绘制柱状图来获得直方图。

四分位距(Interquartile Range)

  • 四分位距是数据的上四分位数和下四分位数之差,度量了数据的中间50%范围。

  • 公式:,其中是下四分位数,是上四分位数。

绝对误差均值(Mean Absolute Deviation)

  • 绝对误差均值表示数据点与均值之间的平均绝对偏差,度量了数据的离散程度。

  • 公式:

绝对误差中位数(Median Absolute Deviation,MAD)

  • 绝对误差中位数是数据点与数据集的中位数之间的差值的中位数。它用来衡量数据的离散程度。

  • 公式:

均方根(Root Mean Square,RMS)

  • 均方根是数据点的平方平均值的平方根。它用来衡量数据的均方根大小。

  • 公式:

标准差(Standard Deviation)

  • 标准差是数据点与数据集平均值之间的差值的平方的平均值的平方根。它衡量了数据的离散程度。

  • 公式:,其中是平均值。

方差(Variance)

  • 方差是数据点与数据集平均值之间的差值的平方的平均值。它是标准差的平方。

  • 公式:,其中是平均值。

经验分布函数百分位数(Empirical Distribution Function Percentile Count)

  • 经验分布函数百分位数是指在数据集中小于或等于某个特定百分位数的数据点的数量。

  • 公式:计算小于或等于百分位数p的数据点的数量。

经验分布函数斜率(ECDF Slope)

  • 经验分布函数斜率是经验分布函数的斜率,衡量了随机变量小于或等于某个值的概率随该值的变化情况。

  • 公式:ECDF斜率可以通过绘制经验分布函数并计算其斜率来估算。

谱域的时序特征

  1. 快速傅里叶变换(Fast Fourier Transform,FFT):

  • 快速傅里叶变换是一种用于将时域信号转换为频域的技术。它可以将时间序列数据分解为不同频率的成分。

傅里叶变换平均系数(FFT Mean Coefficient):

  • 傅里叶变换平均系数是傅里叶变换的结果中各频率成分的平均幅度。

  • 计算方法:对FFT结果中的幅度值进行平均,即,其中表示第i个时间点的FFT结果。

小波变换(Wavelet Transform):

  • 小波变换是一种多尺度分析方法,用于分析时间序列中不同尺度的特征。

小波绝对均值(Wavelet Absolute Mean):

  • 小波绝对均值是小波变换的结果中各尺度成分的平均幅度的绝对值。

  • 计算方法:对小波变换结果中的各尺度幅度值取绝对值并进行平均,即,其中表示第i个时间点的小波变换结果。

小波标准差(Wavelet Standard Deviation):

  • 小波标准差是小波变换的结果中各尺度成分的标准差。

  • 计算方法:对小波变换结果中的各尺度幅度值计算标准差,即,其中表示第i个时间点的小波变换结果,表示小波幅度的平均值。

小波方差(Wavelet Variance):

  • 小波方差是小波变换的结果中各尺度成分的方差。

  • 计算方法:对小波变换结果中的各尺度幅度值计算方差,即,其中表示第i个时间点的小波变换结果,表示小波幅度的平均值。

谱距离(Spectral Distance):

  • 谱距离是用于比较两个频谱之间的相似度的指标。

频谱基频(Spectral Fundamental Frequency):

  • 频谱基频是频谱中的主要频率成分,通常对应于信号的基本频率。

频谱最大频率(Spectral Maximum Frequency):

  • 频谱最大频率是频谱中具有最高幅度的频率成分。

频谱中频(Spectral Median Frequency):

  • 频谱中频是频谱中的中位数频率,即将频率成分按幅度排序后的中间值。

频谱最大峰值(Spectral Maximum Peaks):

  • 频谱最大峰值是频谱中的最高幅度峰值的数量。

时域的时序特征

  1. 自相关(Autocorrelation)

  • 自相关度量了时间序列与其自身在不同时间滞后下的相似性。它通常用来检测序列中的周期性和重复模式。

  • 公式:,其中是滞后步数,是时间序列的均值。

质心(Centroid)

  • 质心是时间序列的平均值,表示数据集中心的位置。

  • 公式:

差分均值(Mean Differences)

  • 差分均值表示相邻数据点之间的平均差异。

  • 公式:

差分绝对值均值(Mean Absolute Differences)

  • 差分绝对值均值是相邻数据点之间的绝对差异的平均值。

  • 公式:

差分中位数(Median Differences)

  • 差分中位数表示相邻数据点之间的差异的中位数。

  • 公式:计算差分序列的中位数。

差分绝对值中位数(Median Absolute Differences)

  • 差分绝对值中位数是相邻数据点之间的绝对差异的中位数。

  • 公式:计算差分序列的中位数。

差分绝对值之和(Sum of Absolute Differences)

  • 差分绝对值之和表示相邻数据点之间的绝对差异的总和。

  • 公式:

熵(Entropy)

  • 熵用来衡量时间序列的不确定性或信息量。较高的熵表示较大的不确定性。

  • 公式:,其中是时间序列中第个值的概率分布。

波峰与波谷距离(Peak to Peak Distance)

  • 波峰与波谷距离表示相邻波峰和波谷之间的距离。

  • 公式:根据时间序列的波峰和波谷位置计算距离。

曲线覆盖面积(Area Under the Curve)

  • 曲线覆盖面积表示时间序列曲线下的区域面积,通常用于积分分析。

  • 公式:通过数值积分方法计算。

最大峰值个数(The Number of Maximum Peaks)

  • 最大峰值个数表示时间序列中的最大峰值的数量。

  • 公式:根据峰值检测算法来计算。

最小峰值个数(The Number of Minimum Peaks)

  • 最小峰值个数表示时间序列中的最小峰值的数量。

  • 公式:根据峰值检测算法来计算。

跨零率(Zero Crossing Rate)

  • 跨零率表示时间序列中从正数值到负数值或从负数值到正数值的过渡次数。

  • 公式:根据时间序列的变化来计算。

推荐阅读:

我的2022届互联网校招分享

我的2021总结

浅谈算法岗和开发岗的区别

互联网校招研发薪资汇总

2022届互联网求职现状,金9银10快变成铜9铁10!!

公众号:AI蜗牛车

保持谦逊、保持自律、保持进步

305c3355e70b02ce12b219b09b368b52.jpeg

发送【蜗牛】获取一份《手把手AI项目》(AI蜗牛车著)

发送【1222】获取一份不错的leetcode刷题笔记

发送【AI四大名著】获取四本经典AI电子书

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/2023面试高手/article/detail/326697
推荐阅读
相关标签
  

闽ICP备14008679号