赞
踩
高炉是炼铁过程中最关键的设备。高炉的稳定运行是保证人员安全和生产效率的前提。因此,早期发现高炉异常是炼铁过程中的一项重要任务。然而,由于原料质量波动较大,运行条件动态,以及热风炉开关的影响,高炉的测量呈现出严重的非平稳特征。所有这些因素使得对高炉的监测成为一项具有挑战性的任务。本文提出了一种非平稳过程监测方法,称为一致趋势特征分析(CTFA),该方法可以提取与趋势相关的特征,并丢弃过程数据中的扰动。将提取的趋势的方向和幅度用于异常检测,并提出了一种基于局部学习的方法来确定时变控制极限。分析了该方法的检测性能,给出了可检测性的充分条件和必要条件。通过柳州某大型高炉的实测数据验证了该方法的有效性。
索引词 :Blast furnace(高炉 ) consistent trend feature analysis
(CTFA)一致趋势特征分析, ironmaking process(炼铁流程), nonstationary process monitoring(非平稳过程监测).
炼钢过程是炼钢的核心工序,涉及复杂的化学反应和能量转换。炼铁过程能耗约占钢铁制造总能耗的70%[1]。实现高炉炼铁过程的安全运行是钢铁工业节能、减排和提高质量的首要任务。保持炉内条件的平稳和稳定对高炉铁液的连续、高效生产是非常重要的。一旦出现异常,就会造成燃料比增加、铁水质量不达标、减震维修时间增加等问题,造成资源的重大损失,降低高炉的使用年限,甚至造成事故和人员伤亡。因此,对操作人员来说,尽早发现高炉中的异常是最值得注意的问题之一。如何对炼铁过程进行自动有效的监控,是关系到高炉安全高效运行的一个重要而现实的问题。
为了保证高炉的稳定运行,研究了一些高炉异常诊断方法。一般来说,这些方法可以分为两大类:专家系统方法和基于数据的方法。专家系统通常根据炼铁工艺知识和操作人员的经验建立规则库。然后,运用一套推理和决策方法对高炉异常进行诊断。一些专家系统已经被报道,如Go-Stop[2]、Sachem[3]、Rautaruukki[4]和VAiron[5]。然而,建立有效的专家系统规则库通常需要高质量的原材料,许多高炉难以满足这一条件。原料质量的波动会严重影响高炉专家系统的有效性。
近年来,许多研究都集中在基于数据的监测方法上[6]-[13]。人们对炼铁过程中基于数据的炼铁方法越来越感兴趣[15]。为了消除热风炉开关带来的干扰,文献[16]提出了一种两阶段PCA模型。为了解决高炉数据的非高斯性质,Zhou等[17]使用了传统的T2统计量。Shang等[19]基于递归变换的共凸壳检测逻辑取代了基于分量统计分析的检测逻辑[18],提出了一种基于增量的指标切换方案的高炉监测方法。然而,由于波动的过程监测已经出现。Vanhatalo采用了基于主成分分析(PCA)的多变量方法来监测实验高炉的热状态[14]。为了提高传统主成分分析的故障隔离性能,提出了一种结构化联合稀疏主成分分析方法。因此,多元统计建模方法在长期应用中可能难以获得满意的结果。一个主要原因是难以区分正常和异常波动。因此,对高炉的非平稳监测方法进行深入研究是十分必要的。
对于非平稳过程,现有文献中主要有两种解决方法,即自适应方法和基于协整的方法。自适应方法用新的数据更新监测模型以适应非平稳过程。Li等[20]提出了两种递归PCA算法用于自适应过程监控。Wang等[21]设计了一种快速移动窗口PCA (MWPCA)算法。为了进一步提高建模效率,开发了一种快速块自适应核主成分分析[22]。Jiang和Yin[23]致力于在线跟踪解决方案,提出递归总主成分回归,用于高效的数据驱动故障检测。为了减少误报,Wang等[24]提出了递归偏最小二乘法和自适应置信限。Yu和Zhao[25]提供了一种递归指数慢特征分析算法用于自适应监测。Zheng等[26]构建了一种用于自适应过程监控的递归高斯混合模型,并给出了带/不带遗忘因素的两种模型更新方案。然而,这种类型的方法可能容纳一些缓慢发生的故障。另一种非平稳过程监测方法是基于协整分析,它可以利用线性组合将非平稳变量积分为平稳变量。为了描述动态平衡误差,使用协整模型的残差序列进行状态监测和故障检测[27]。Li等[28]基于协整分析构建了非平稳过程的T2监测指标。文献[29]提出了一种采用协整分析和慢特征分析的非平稳动态化工过程全状态监测方法。Lin等人[30]开发了一个改进的共同趋势框架,用于监测具有序列相关和非平稳变量的工业生产系统。协整分析的前提是非平稳变量之间存在稳定的长期均衡关系。然而,在实际炼铁过程中,由于设备老化,生产计划变化和人工操作,这一先决条件很少得到满足。为了解决这个问题,Shang等人[31]提出了一种基于趋势的方法,称为主导趋势提取(DTE),用于非平稳过程监测。支配趋势的欧几里得范数被直接用于区分正常和异常情况。这种全局控制限制对于一些复杂的异常可能缺乏粒度,因为趋势的方向被忽略了。此外,利用乘数交替方向法求解优化问题,提取出趋势。因此,由于在线优化过程,DTE具有很高的计算复杂度。此外,高炉炼铁过程具有一些特殊的性质,这些特性可以直接反映在测量中。例如,热风炉的开关可能会产生一些特定的特性,这给非平稳过程监测方法带来了额外的挑战。
在本文中,我们提出了一种监测方法,可以很好地解决炼铁过程中热风炉的非平稳测量和开关。为了提取趋势特征,提出了一种一致趋势特征分析方法。提取的相邻时间间隔的特征尽可能保持一致,以便能够代表测量的趋势。然后,利用一致趋势特征来检测高炉的异常。为了确定不同趋势方向上的控制极限,提出了一种基于局部学习的方法生成时变控制极限。
本文的主要贡献如下:1)提出了一种提取非平稳数据中一致趋势特征的CTFA方法;2)基于提取的特征,提出了一种非平稳过程监测方法。考虑到不同趋势方向的异质性,设计了一种基于局部学习的方法来获得时变控制极限;3)分析所提出的监测方法的可检测性,给出必要条件和充分条件;并提供了一个长时间运行的高炉实例进行验证。通过比较,可以发现该方法比典型的非平稳过程监控方法具有更好的性能。
本文的其余部分结构如下。第二部分介绍了高炉及炼铁工艺数据的特点。第三节介绍了拟议方法的细节。在第四节中,对一个实际高炉进行了案例研究,以证明所提出方法的有效性。第五部分对本文进行总结。
炼铁过程是指使用铁矿石、燃料和氧气进行一系列还原反应以产生铁水。炼铁过程中涉及的设备包括鼓风炉和一些辅助设备,如热风炉、充电系统和烧结机。在炼铁过程中,高炉是最关键的设备,其示意图如图1所示。加料系统在高炉顶部交替给铁矿石和焦炭加料。热风炉加热的热风通过风口吹入高炉。在高温高压条件下,下降的炉料和上升的气相反运动并发生反应。这些反应产生的铁水滴在炉底,并定期通过出铁口排出[32]。
为了保证高炉内反应的顺利进行,必须保持高炉内气流、炉料分布、热力系统和炉内剖面的稳定。高炉常见的异常包括悬挂、窜槽和物料分布不均匀。挂炉是指炉料停止下降,后备线停滞的异常现象,会造成煤气分布紊乱。窜流是气流在高温高速下流经高炉某一局部横截面的异常现象,会带走高炉内部的大量热量。物料分布不均匀是指炉料表面不对称的异常,会造成风口工作不均匀,物料线较低的风口会被冷却并伴有炉渣。异常不仅会降低产品质量,增加生产能耗,还会损坏设备,引发事故。由于原料质量的波动、动态操作条件和热风炉开关的影响,炼铁过程的测量通常是非平稳的。在这里,我们在图2中绘制了从运行中的高炉收集的一些实际数据,以显示非平稳性。正常情况下采集热风压力、冷风流速和实际风速。很明显,所有这些变量都具有严重的非平稳性。非平稳的原因之一是由于热风炉切换引起的数据波动,另一个原因是由于高炉原料和生产计划的变化。为了适应这种变化,操作人员不断调整高炉的操纵变量,造成不同的运行条件。炼铁过程的非平稳性对有效的过程监控提出了挑战。
如第二节所述,炼铁过程数据存在严重的非平稳性。由于数据具有时变的统计特征,直接利用观测值构建统计特征是不可行的。要对非平稳过程进行监测,一个先决条件是正常运行状态下的数据变化与异常运行状态下的数据变化存在一定的差异。根据炼铁过程的实际观察,我们发现,虽然高炉的测量是非平稳的,但在正常情况下,它们的趋势通常在一定范围内。因此,利用趋势相关信息进行异常检测是可行的。考虑到这一点,我们在本节中引入了一种可以处理非平稳性的方法。所提出的监测方法的实质是检测数据趋势在其方向上是否超出正常范围。为了区分不同方向的趋势,提出了一种基于局部学习的控制极限确定方法。
趋势是时间序列的一个重要概念。然而,文献中对趋势的定义并不一致[33]。有一些定义,如平均值的线性增加或减少[34],内在拟合单调函数或在给定数据范围内最多可以有一个极值的函数[33],以及时间间隔唯一确定的连续事件序列,以显示质变状态的时间[35]。
一般来说,快速波动可以被认为是噪声或干扰,通常没有模式。相反,过程数据中可能有一些缓慢的变化,也可能有一些具有清晰模式的快速变化,这两种变化都可以用来帮助区分正常和异常的非平稳特征。从这个意义上说,对于正常条件下的过程测量,我们的目标是提取能够反映过程数据正常变化的趋势。此外,当出现异常时,通常会引起工艺数据的突变,相应的趋势是剧烈的。这种正常和异常情况下的差异可以帮助我们发现异常。
直觉上,人们希望时间序列的趋势是单调的,或者有尽可能少的极值。换句话说,相邻时间间隔的趋势应该尽可能一致。为了从测量中提取这种一致的趋势特征,在第III-B节中提出了一种称为CTFA的方法。注意,这里的一致趋势”并不是指数据需要保持固定的趋势(斜率恒定),而是作为一种原则,用于抑制噪声,提取能够反映正常变化的与趋势相关的特征。
考虑一组包含
n
n
n个样本的训练数据,表示为:
X
=
[
x
1
,
x
2
,
…
,
x
n
]
(1)
X=[x_1,x_2,\ldots,x_n]\tag{1}
X=[x1,x2,…,xn](1)
其中,
x
k
=
[
x
k
,
1
,
x
k
,
2
,
…
,
x
k
,
m
]
T
x_k=[x_{k,1},x_{k,2},\ldots,x_{k,m}]^T
xk=[xk,1,xk,2,…,xk,m]T表示从
m
m
m个传感器采集到的第
k
k
k个样本。对于炼铁过程,观测是非平稳的。也就是说,
X
X
X的每一行代表一个观测值的非平稳时间序列。因此,过程监测的第一个任务是寻求一组可以从
X
X
X中提取趋势相关特征的输入输出函数。为了涉及测量的动态,在一个窗口内增加样本,即
X
k
=
x
k
−
v
+
1
,
x
k
−
v
+
2
,
…
,
x
k
(2)
\mathcal{X}_k={x_{k-v+1},x_{k-v+2},\ldots,x_k}\tag2
Xk=xk−v+1,xk−v+2,…,xk(2)
其中
v
v
v表示窗口的大小。假设提取的一致趋势特征为:
Y
=
[
f
(
X
1
)
,
f
(
X
2
)
,
…
,
f
(
X
n
~
)
]
(3)
Y=[f(\mathcal{X_1}),f(\mathcal{X_2}),\ldots,f(\mathcal{X_{\widetilde{n}}})]\tag3
Y=[f(X1),f(X2),…,f(Xn
)](3)
其中,
f
(
X
k
)
=
[
f
1
(
X
k
)
,
f
2
(
X
k
)
,
…
,
f
q
(
X
k
)
]
T
(4)
f(\mathcal{X_k})=[f_1(\mathcal{X_k}),f_2(\mathcal{X_k}),\ldots,f_q(\mathcal{X_{k}})]^T\tag4
f(Xk)=[f1(Xk),f2(Xk),…,fq(Xk)]T(4)
f
i
:
R
m
×
n
→
R
f_i:\mathbb{R}^{m\times n}→\mathbb{R}
fi:Rm×n→R表示CTFA的输入输出函数,
q
q
q表示提取的特征数量,
n
~
=
n
−
v
+
1
\widetilde{n}=n-v+1
n
=n−v+1指特征的长度。为了简便,这里我们认为
f
i
(
X
k
)
f_i(\mathcal{X_k})
fi(Xk)是下列一组函数的加权和::
f
i
(
X
k
)
=
[
g
1
(
X
k
)
,
g
2
(
X
k
)
,
…
,
g
m
~
(
X
k
)
]
ω
i
(4)
f_i(\mathcal{X_k})=[g_1(\mathcal{X_k}),g_2(\mathcal{X_k}),\ldots,g_{\widetilde{m}}(\mathcal{X_{k}})]\omega_i\tag4
fi(Xk)=[g1(Xk),g2(Xk),…,gm
(Xk)]ωi(4)
其中
g
j
(
X
k
)
=
g
~
j
(
X
k
)
max
k
g
~
j
(
X
k
)
−
min
k
g
~
j
(
X
k
)
,
j
=
1
,
2
,
…
,
m
~
.
(6)
g_{j}(\mathcal{X}_{k})=\frac{\tilde{g}_{j}(\mathcal{X}_{k})}{\max_{k}\tilde{g}_{j}(\mathcal{X}_{k})-\min_{k}\tilde{g}_{j}(\mathcal{X}_{k})},\quad j=1,2,\ldots,\tilde{m}.\tag6
gj(Xk)=maxkg~j(Xk)−minkg~j(Xk)g~j(Xk),j=1,2,…,m~.(6)
g
~
i
:
R
m
×
v
→
R
\widetilde{g}_i:\mathbb{R}^{m\times v}→\mathbb{R}
g
i:Rm×v→R表示测量值的一个函数,由公式(6)归一化,
ω
i
∈
R
m
~
\omega_i\in\mathbb{R}^{\widetilde{m}}
ωi∈Rm
表示第i个特征的权重向量。需要注意的是
g
~
j
\widetilde{g}_j
g
j可根据特殊应用场景而设计,这将增加CTFA的灵活性。例如,通过设置
g
j
(
X
k
)
g_j(\mathcal{X}_k)
gj(Xk)为非线性函数,可以得到一个关于原始观测的线性拓展。为了便于表达,构建矩阵
Z
Z
Z,其中
z
j
k
=
g
j
(
X
k
)
z_{jk}=g_j(\mathcal{X_k})
zjk=gj(Xk)是第
(
j
,
k
)
(j,k)
(j,k)项,设置
y
i
=
[
f
i
(
X
1
)
,
f
i
(
X
2
)
,
…
,
f
i
(
X
n
~
)
]
T
y_i=[f_i(\mathcal{X_1}),f_i(\mathcal{X_2}),\ldots,f_i(\mathcal{X_{\widetilde{n}}})]^T
yi=[fi(X1),fi(X2),…,fi(Xn
)]T。这样,第
i
i
i个提取的趋势特征可被表示为:
y
i
=
Z
T
ω
i
(7)
y_i=Z^T\omega_i\tag7
yi=ZTωi(7)
如第III-A节所说,期望得到波动小的趋势特征。换句话说,在预期的趋势特征中,相邻采样间隔的增量应尽可能一致。基于这一原则,提出了一个指标来量化相邻增量的一致性。在这里,相邻趋势的一致性通过两个趋势向量之间的差异来量化。考虑一个提取的特征序列
y
=
[
y
1
,
y
2
,
…
,
y
n
~
]
T
y=[y_1,y_2,\ldots,y_{\widetilde{n}}]^T
y=[y1,y2,…,yn
]T,第
i
i
i 和第
i
+
1
i + 1
i+1个趋势向量的一致性可表示为
c
i
=
(
y
(
i
+
2
)
−
y
(
i
−
1
)
)
−
(
y
(
i
+
1
)
−
y
i
)
c_i=(y_{(i+2)}-y_{(i-1)})-(y_{(i+1)}-y_i)
ci=(y(i+2)−y(i−1))−(y(i+1)−yi)。然后整个序列的一致性被量化为
[
c
1
,
c
2
,
…
,
c
n
−
2
]
[c_1,c_2,\ldots,c_{n-2}]
[c1,c2,…,cn−2]的平方和。因此,趋势特征
y
y
y的一致性指数可被表示为:
C
(
y
)
=
∣
∣
D
y
∣
∣
2
2
(8)
C(y)=||D_y||^2_2\tag8
C(y)=∣∣Dy∣∣22(8)
其中
∣
∣
⋅
∣
∣
2
||\cdot||_2
∣∣⋅∣∣2表示欧几里德范数,
D
∈
R
(
n
~
−
2
)
×
n
~
D\in\mathbb{R}^{(\widetilde{n}-2)\times\widetilde{n}}
D∈R(n
−2)×n
是一个三对角Toeplitz矩阵。
D
=
[
1
−
2
1
0
⋯
0
0
0
0
0
1
−
2
1
⋯
0
0
0
0
0
0
1
−
2
⋯
0
0
0
0
⋮
⋮
⋮
⋮
⋮
⋮
⋮
⋮
0
0
0
0
⋯
1
−
2
1
0
0
0
0
0
⋯
0
1
−
2
1
]
.
(9)
\boldsymbol{D}=[1−210⋯000001−21⋯0000001−2⋯0000⋮⋮⋮⋮⋮⋮⋮⋮0000⋯1−2100000⋯01−21].\tag9
D=
100⋮00−210⋮001−21⋮0001−2⋮00⋯⋯⋯⋮⋯⋯000⋮10000⋮−21000⋮1−200001
.(9)
因此,
D
y
D_y
Dy表示
y
y
y的二阶差分向量。由(8)可知,
C
(
y
)
C(y)
C(y)越小,表明相邻趋势越一致。因此,通过最小化
C
(
y
)
C(y)
C(y),可以得到更一致的趋势表示。沿着这个方向,构造如下优化问题,提取测量中一致的趋势特征:
min
w
i
C
(
y
i
)
s.t.
1
n
~
−
1
∥
y
i
−
I
n
~
T
y
i
n
~
I
n
~
∥
2
2
=
1
(
y
j
−
I
n
~
T
y
j
n
~
I
n
~
)
T
(
y
i
−
I
n
~
T
y
i
n
~
I
n
~
)
=
0
,
1
≤
j
≤
i
−
1
y
i
=
Z
T
w
i
(10)
\tag{10}
wiminC(yi)s.t.yi=ZTwin~−11
yi−n~In~TyiIn~
22=1(yj−n~In~TyjIn~)T(yi−n~In~TyiIn~)=0,1≤j≤i−1(10)
其中,
I
n
~
∈
R
n
~
I_{\tilde{n}}\in\mathbb{R}^{\tilde{n}}
In~∈Rn~ 表示每个元素都等于1的向量。(10)中的第一个约束表明趋势
y
i
y_i
yi的样本方差为1,这是为了避免平凡解。第二个约束用于解相关。根据式(7)和式(8),优化问题(10)可改写为:
min
w
i
∥
D
Z
T
w
i
∥
2
2
s
.
t
.
1
n
~
−
1
w
i
T
Z
~
Z
~
T
w
i
=
1
w
j
T
Z
~
Z
~
T
w
i
=
0
,
1
≤
j
≤
i
−
1
(11)
\tag{11}
wimin
DZTwi
22s.t.n~−11wiTZ~Z~Twi=1wjTZ~Z~Twi=0,1≤j≤i−1(11)
其中,
Z
~
=
Z
−
Z
I
n
~
I
n
~
T
/
n
~
(12)
\tilde{\mathbf{Z}}=\mathbf{Z}-\mathbf{Z}\mathbf{I}_{\tilde{n}}\mathbf{I}_{\tilde{n}}^{\mathrm{T}}/\tilde{n}\tag{12}
Z~=Z−ZIn~In~T/n~(12)
(11)的最优解由下命题给出:
命题1:通过求解以下广义特征值分解,可以得到问题(11)的全局最优解:
A
W
=
B
W
Σ
(13)
AW=BW\Sigma \tag{13}
AW=BWΣ(13)
其中,
A
=
Z
D
T
D
Z
T
(14)
A=ZD^\mathrm{T}DZ^\mathrm{T}\tag{14}
A=ZDTDZT(14)
B
=
Z
~
Z
~
T
.
(15)
B=\tilde{Z}\tilde{Z}^\mathrm{T}.\tag{15}
B=Z~Z~T.(15)
Σ
\boldsymbol\Sigma
Σ一个包含
(
A
,
B
)
(\boldsymbol{A}, \boldsymbol{B})
(A,B)的非降序广义特征值的对角矩阵。
W
=
[
ω
1
,
ω
2
,
…
,
ω
m
~
]
\boldsymbol{W}=[\boldsymbol{\omega}_1,\boldsymbol{\omega}_2,\ldots,\boldsymbol{\omega}_{\tilde{m}}]
W=[ω1,ω2,…,ωm~],其中每行代表一个广义特征向量
(
A
,
B
)
(\boldsymbol{A,B})
(A,B)并被标准化后满足:
ω
i
T
B
ω
i
=
n
~
−
1
,
i
=
1
,
2
,
…
,
m
~
.
(16)
\boldsymbol{\omega}_i^T\boldsymbol{B}\boldsymbol{\omega}_i=\tilde{n}-1,i=1,2,\ldots,\tilde{m}.\tag{16}
ωiTBωi=n~−1,i=1,2,…,m~.(16)
证明:用广义瑞利商直接证明。
基于命题1,可由式(13)给出的广义特征分解得到
m
~
\tilde{m}
m~权重向量。相应的可得到
m
~
\tilde{m}
m~趋势特征,即:
Y
~
=
W
T
Z
(17)
\tilde{Y}=W^\mathrm{T}\mathbf{Z}\tag{17}
Y~=WTZ(17)
其中
Y
~
\tilde{Y}
Y~每一行代表一个趋势特征,并且趋势特征依据波动程度按非降序排列,即,
C
(
y
1
)
≤
C
(
y
2
)
≤
…
≤
C
(
y
m
~
)
C(y_1)\leq C(y_2) \leq \ldots \leq C(y_{\tilde{m}})
C(y1)≤C(y2)≤…≤C(ym~),
y
i
T
y_i^T
yiT是
Y
~
\tilde{Y}
Y~的第
i
i
i行。
为了降为和去噪,只有前几个趋势特征用于过程监测。其中,
C
(
z
j
)
,
=
1
,
2
,
…
,
m
~
C(z_j),=1,2,\ldots,\tilde{m}
C(zj),=1,2,…,m~被计算用于特征选择,其中
z
j
T
z_j^T
zjT表示
Z
Z
Z的第
i
i
i行。接着,前
q
q
q 个特征被选择用于过程监测,其中
q
q
q可以通过如下的试错法确定:
C
(
y
q
)
<
min
i
C
(
z
j
)
≤
C
(
y
q
+
1
)
.
(18)
C(y_q)<\min_iC(z_j)\leq C(y_{q+1}).\tag{18}
C(yq)<iminC(zj)≤C(yq+1).(18)
这样,用于过程监测的潜变量通过提取矩阵
Y
~
\tilde{Y}
Y~的前
q
q
q 行,用
Y
Y
Y 表示。
对于非平稳变量,统计特性是时变的。因此,基于平稳统计特性假设的监测指标不再适用,例如PCA的 Hotelling’s
T
2
T^2
T2统计量和 SPE 统计量。考虑到高炉异常状况会导致数据异常波动,每个采样区间趋势特征的一阶差分被用于过程监测,由下式获得:
h
˙
k
=
h
k
−
h
k
−
1
(19)
\dot{\boldsymbol{h}}_k=\boldsymbol{h}_k-\boldsymbol{h}_{k-1}\tag{19}
h˙k=hk−hk−1(19)
其中,
h
k
∈
R
q
h_k\in\mathbb{R}^q
hk∈Rq是
Y
Y
Y的第
k
k
k行。
从图2中考虑了热风振幅变化过程中微分特征向量的波动,可能会丢失一些对高炉监测有用的信息。从这个意义上说,最好在不同的方向上提供不同的控制限制。在这里,我们使用一个简单的二维示例来说明它。使用CTFA,从高炉炉膛收集的一组数据的趋势特征比其他时间的数据更不稳定。可以发现,这些波动具有一致的方向。例如,每个开关降低热风压力,增加冷风流量。因此,如果只考虑差分特征向量
h
˙
k
\dot{\boldsymbol{h}}_k
h˙k的幅值,可能会丢失一些对高炉监测有用的信息。从这个意义上说,最好在不同的方向上提供不同的控制限制。在这里,我们使用一个简单的二维示例来说明它。利用CTFA提取了一组正常条件下的高炉数据的趋势特征。假设保留前两个趋势特征以供监视。然后,我们将原点设置为hk的起点,并在图3中绘制终点。
可以观察到,在正常情况下,不同方向的趋势特征幅值差异较大。因此,用均匀的控制限很难获得满意的监测结果。为了说明在过程监控中考虑差分特征向量方向的重要性,图3中还绘制了一个在所有方向上均匀的控制极限。这
h
˙
k
\dot{\boldsymbol{h}}_k
h˙k的欧氏范数被用作检测指标。显然,忽略方向所得到的控制极限会导致误报和漏检,如图3所示的两个测试样本。
因此,我们提出了一种基于局部学习的监测方法,只使用与测试样本方向接近的训练样本来确定控制极限。对于测试样品
x
i
′
∈
R
m
,
z
i
′
x_i^{\prime}\in\mathbb{R}^m,z_i^{\prime}
xi′∈Rm,zi′由式(6)计算,其中第j个元素为
g
j
(
X
i
′
)
g_j(\mathcal{X}_i^\prime)
gj(Xi′)。趋势特征由下式计算:
h
i
′
=
W
q
T
z
i
′
(20)
\boldsymbol{h}_i^{\prime}=\boldsymbol{W}_q^\mathrm{T}\boldsymbol{z}_i^{\prime}\tag{20}
hi′=WqTzi′(20)
其中,
W
q
\boldsymbol{W}_q
Wq是由
W
\boldsymbol{W}
W前
q
q
q列组成。测试样本的差分特征向量由下式获得:
h
˙
i
′
=
h
i
′
−
h
i
−
1
′
.
(21)
\dot{h}_i^{\prime}=h_i^{\prime}-h_{i-1}^{\prime}.\tag{21}
h˙i′=hi′−hi−1′.(21)
单位向量的内积用来度量方向的相似性。使用阈值
θ
θ
θ选择局部学习的训练样本。对于测试样本
h
˙
i
′
\dot{h}_i^{\prime}
h˙i′,选取满足以下条件的训练样本
h
˙
k
′
\dot{h}_k^{\prime}
h˙k′:
h
˙
k
T
∥
h
˙
k
∥
2
h
˙
i
′
∥
h
˙
i
′
∥
2
>
θ
.
(22)
\frac{\dot{h}_k^\mathrm{T}}{\left\|\dot{h}_k\right\|_2}\frac{\dot{h}_i^{\prime}}{\left\|\dot{h}_i^{\prime}\right\|_2}>\theta.\tag{22}
h˙k
2h˙kT
h˙i′
2h˙i′>θ.(22)
为了检测异常,差分特征向量的欧氏范数
∥
h
˙
i
′
∥
2
\|\dot{h}_i^{\prime}\|_2
∥h˙i′∥2作为监测指标,根据所选的训练样本,采用显著性水平
α
α
α得到相应的控制极限
δ
δ
δ。与方向相关的控制极限比全局控制极限更精细,使监测方法对早期异常更敏感。即使对于趋势方向没有差异的过程,基于局部学习的方法也不会削弱检测性能。通过确定标准
∥
h
˙
i
′
∥
2
\|\dot{h}_i^{\prime}\|_2
∥h˙i′∥2是否超过控制限值来实现异常检测。具体的离线训练和在线监测实现步骤分别在算法1和算法2中给出。
为了说明所提出方法的有效性,本节基于实际数据进行了案例研究。数据集来自中国广西柳州钢铁(集团)公司2号高炉,该公司位于中国柳州,中国,非公开。2号高炉有效容积2650 m3,年铁产量约230万吨。在炼铁过程中配备了四个大功率顶火热风炉供热风。根据专家经验,选取9个变量进行炼铁过程监控,可以反映压力与流量的关系[31]。所选择的变量如表1所示。
表1中的变量均匀周期性采样,采样间隔为10 s。训练数据集包含2017年3月5日20:00:00至2017年3月9日7:40:54正常情况下的数据,共30000个样本。注意,适当的窗口大小对于监视算法非常重要。如果窗口过小,可能会提取噪声引起的趋势,难以获得准确的监测结果。另一方面,如果窗口过大,不仅会增加计算量,还可能降低对异常的敏感性。然而,由于实际工业数据的复杂性,很难给出一种定量的窗口大小选择方法。因此,采用试错法确定窗口大小。在本案例研究中,我们设置v = 20和
在实际应用中,应避免频繁的误报。在这里,我们首先使用正常条件下的两个测试数据集来评估所提出方法的虚警率(FAR)。测试数据集列于表二。
请注意,测试数据集1和2分别距离训练数据集5天和20天。它们可以用来测试一种方法是否可以处理非平稳过程。所提出的监测算法的关键参数如表3所示。
在本节中,将使用一些典型的方法进行比较。MWPCA [21] (广泛用于自适应过程监测)和协整分析[28]是监测非平稳过程的两种代表性方法。DTE[31]也是一种基于趋势的方法,设计用于非平稳过程监测。除了以上三种方法外,本文还比较了专门用于高炉监测的两级PCA[16]。对于MWPCA,使用90%的累积方差贡献率来选择主成分的数量。这些方法中涉及的窗口大小都设置为20。这些方法使用的数据均为原始数据,未消除热风炉开关的影响。各方法测定对照限的显著性水平均为1%。这些方法在正常测试数据集1和2上的监测性能分别如图4和图5所示。
从图4和图5可以看出,随着时间的推移,协整分析和两阶段PCA的FARs显著增加。也就是说,这两种方法可能不适应炼铁过程的非平稳特性。对于MWPCA来说,由于全局控制限制,它可能无法处理热风炉开关引起的波动。因此,虽然性能不会随着时间的推移而变差,但每次热风炉开关时都可能产生误报。在实际应用中,频繁的误报会分散操作人员的注意力,因此应避免。从这个意义上说,MWPCA、协整分析和两阶段PCA可能不适合非平稳炼铁过程的长期监测。相比之下,从FARs的角度来看,DTE和CTFA的性能更好。
现在我们重点讨论这些方法的异常监测性能。表4中列出了三个包含异常的测试数据集,用于评估检测能力。
检测结果如图6-8所示,表5所示。由于操作人员不断调整炉况,实际数据集中的炉况异常不会持续很长时间。测试数据集3和5中的异常炉况发生在两个热炉切换周期之间。然而,对于测试数据集4,异常炉况发生在热风炉切换后。因此,很难区分人工检测时间之前的报警是由于鼓风炉开关引起的虚警,还是由于炉况异常引起的早期报警。这些方法的检测性能分析如下。
在这个数据集中,有一个热风炉在350次采样瞬间切换。5种方法在热风炉开关附近均存在误报,其中二级PCA法的误报率最高,CTFA法的误报率最低。此外,协整分析在前100个采样瞬间很少有误报。对于MWPCA和DTE,在人工检测时间附近,检测指标都在控制范围内。通过协整分析、两阶段主成分分析和CTFA分析,发现异常炉况比人工检测时间更早。然而,两阶段PCA的结果中存在太多的虚警,这在实际应用中是不可接受的。
在该数据集中,在第130个采样瞬间和第500个采样瞬间发生了两次热风炉切换。两阶段PCA产生了大量虚警,如图7(d)所示。因此,虽然两阶段PCA的检测指标在人工检测时间附近超过阈值,但可能难以获得有效的检测结果。参照协整分析在测试数据集1上的表现,几乎每次热风炉切换都会产生虚警。因此,接近手动检测时间的告警有可能是虚警。在人工检测时间附近,MWPCA和DTE的检测指标均在其控制范围内。CTFA检测异常炉况,在此数据集上不产生假警报。
由于非平稳性,协整分析和两阶段主成分分析在异常炉况发生前的检测指标经常超过控制范围。MWPCA检测不到炉况异常和终端设备。对于CTFA,异常炉况的检测时间比人工检测时间提前280s。
综上所述,MWPCA和DTE不适用于三种异常炉况,因为它们的阈值在很大程度上是由热风炉的开关提高的。协整分析和两阶段主成分分析不适合长时间监测,因为测量值统计特征的变化会使监测性能变差。当测试数据集和训练数据集之间的时间接近时,可以使用协整分析和两阶段PCA来检测异常炉况。然而,当测试数据集和训练数据集相差较大时,会产生过多的虚警,无法获得有效的检测结果。相反,CTFA可以比人工检测更早地检测到测试数据集的所有异常,即使是长期监测。这表明CTFA可以有效地监测高炉。
本文提出了一种用于高炉监测的CTFA方法,该方法可以提取非平稳数据的一致趋势特征。为了处理不同趋势方向上的异构特征,在局部学习框架中使用提取的趋势特征,该框架同时考虑了趋势特征的方向和幅度。给出了CTFA可检测性的充分条件和必要条件。基于实际高炉数据的实例研究验证了所提出的炼铁过程非平稳监测方法。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。