基于PLS的热连轧过程故障检测与诊断
来源:张 飞,郭 强,中屠南凯 |浏览:次|评论:0条 [收藏] [评论]
基于PLS的热连轧过程故障检测与诊断
张 飞,郭 强,中屠南凯
(北京科技大学高效轧制国家工程研究中心,北京 100083)
摘 要:为了解决在生产过程中进行故障检测和诊断问题,讨论了基于主元分析(PCA)和偏最小二乘(PLS)的过程故障检测与诊断的原理,运用T2统计、Q统计方法结合贡献图对轧钢过程进行了分析。结果表明,PLS方法比PCA方法能更好地检测与诊断故障。
关键词:故障检测与诊断;偏最小二乘;主元分析;贡献图
中图分类号:TG335.11;TP274 文献标识码:A 文章编号:1003—9996(2008)06—0045—05
1 前言
在热连轧过程中影响带钢质量的因素较多,且相互关联,在对轧制过程进行在线监测时,很难及时有效地诊断轧制过程中出现的异常状况。本文通过计算过程变量数据项对于模型的Q统计量和Hotelling T2统计量,比较了主元分析PCA(Principal Components Analysis)与偏最小二乘PLS(Partial Least Squares)模型对热连轧生产过程中故障检测与诊断的能力。
在正常条件下,大多数传感器得到的测量值是高度相关的。这就为传感器故障诊断提供了宝贵的解析冗余。这些测量值的相关性主要源于支配过程运行的物理与化学原理,如质量与能量平衡等。某一故障传感器通常会破坏与其他传感器正常的相关性。当异常条件被检测到以后,此特性可用于故障传感器的辨识。文献[1]采用贡献图来辨识过程故障,即用每个传感器在每一样本点的残差来辨识有关的故障传感器。具有最大误差的传感器可被认为是发生了故障,因为它对故障检测的平方预报误差做出了最主要的贡献;文献[2]指出可由PCA收集的统计特性来追踪故障。然而,某一传感器故障可能导致对其他传感器的错误估计,以至在辨识阶段导致错误结论。为了消除故障传感器对其他传感器估计的影响,文献[3]采用自联想神经元网络来检验、辨识与重构故障传感器。此网络可看成是传统PCA方法的扩展。
PLS是近年产生和发展起来的一种具有广泛适用性的多元统计分析方法[4]。其由wold和A1ban于1984年提出,首先应用于化工领域,随后又在市场分析、资源分析、工程建模以及金融等领域广泛应用。近10年来,其在理论、方法和应用方面得到迅速发展。PLS是一种基于PCA方法的鲁棒多变量回归算法,其将数据矩阵分割成一系列“主元”。但与PCA不同的是,PLS在PCA的基础上同时考虑了输入、输出数据集,对X和Y同时进行正交分解。从而可用一个线性关系式来表示这两个主元变量集合。可认为开始的几个主元包含了大多数有用的预测数据,而剩下的则被认为是噪声的影响。因此,PLS与标准的多变量回归算法相比,其数据量减少,但鲁棒性增强。PLS方法能够通过成分提取和空间压缩技术克服噪声和变量的相关性,并根据正常工况的生产数据.准确捕捉质量变量与过程变量之间的关系.对生产工况进行有效监测。该方法不依赖过程机理模型,不需要故障样本;能够弥补PCA等其他统计方法无法考虑过程变量对质量变量影响的不足。因此,近年来在化工过程的质量控制和在线监测等方面得到了广泛重视和研究[5,6]。
2 基本算法
2.1 主元分析(PCA)
主元分析是实现对过程数据进行降维压缩的一种有效方法[7],对N个过程变量进行了n次独立采样,得到过程变量的检测数据阵X∈Rn×N。矩阵X可以表示为,”个向量的外积之和,即:
X=TPT+F (1)
式中,T=[t1,t2,…,tm],称为得分矩阵;P=[p1,p2,…,pm],称为负荷矩阵;F为误差矩阵。
由于误差矩阵主要是由测量误差引起的。所以将F忽略掉往往会起到清除噪声的效果[8]。
通常以计算主元个数对数据的累计解释程度作为选择主元个数的依据,即主元累计贡献率百分比原则[9]。主元的累计贡献率可由矩阵X协方差的前足个特征值之和除以其所有特征值之和求得,其中特征值由大到小进行排序:
式中,yk为前尼个主元的累计贡献率,其表示前k个主元所解释的数据变化占全部数据变化的比例;k为选取的主元个数;m为变量个数;λi为第i个主元所对应的特征值。
2.2偏最小二乘(PLS)
对N个过程变量进行了n次独立采样,得到过程变量的检测数据矩阵X∈Rn×N;同时对M个质量变量进行了相对应的n次独立采样,得到质量变量的检测数据矩阵Y∈Rn×N。PLS通过潜变量对两个数据块的关系进行建模,它将n×N零均值矩阵X和n×M零均值矩阵Y分解为如下形式:
X=TPT+F (4)
Y=UQT+G (5)
式中,T和U是由抽取的p个得分矢量组成的n×p矩阵;P和Q为负载矩阵;F和G为残差矩阵。
抽取T和U有多种方法。PLS的经典形式是基于非线性迭代偏最小二乘(NIPALS)算法。下面简要介绍通过矩阵本征值问题求解T和U的方法。
在偏最小二乘回归建模中,究竟应选取多少个成分,可通过考察增加一个新成分后,能否对模型的预测功能有明显改进来考虑。采用类似抽样测试法的工作方式,把所有n个样本点分成2部分:第1部分除去某个样本点i的所有样本点集合(共含n一1个样本点),用这部分样本点并使用h个成分拟合一个回归方程:第2部分是把刚被排除的样本点i代人前面拟合的回归方程,得到yi在样本点i上的拟合值。通过Y的预测误差平方和Y的误差平方和的比值来进行比较。一般认为,(PRESSh/SSh-1)≤0.952时,增加成分th是有益的。PRESSh与SSh的定义如下[11]:
2.3故障诊断方法
在利用PCA或PLS模型对生产过程进行故障检测与诊断时,可通过计算过程变量数据项对于模型的Q统计量或Hotelling T2统计量实现,如果统计量值超出界限值,即可认为生产过程出现了不正常情况[12]。其中Q统计量为平方预测误差,代表数据中未被主元模型解释的变化。即测量值偏离主元模型的程度;T2统计量代表测量点在变化趋势上和幅值上偏离主元模型的程度;通常各统计量控制限的计算,依照Jackson和Mudholkar提出的公式获得[13]。统计量的值可按下式计算,对于第i个采样点:
式中,Qi为第i个采样点的Q统计量,ei为误差矩阵F的第i行;Xi为检测数据;P为前k个主元所对应负荷向量矩阵;为第i个采样点的T2统计量,为得分向量的第i行;λ是由与前k个主元所对应的特征值组成的对角矩阵。若计算出的统计量值超出了控制界限值,即可认为过程出现异常。对于连续过程数据可将各采样点统计值绘制成统计控制图。通过观测统计量与控制界限值的大小判断生产过程中是否出现了异常的数据点,但不能对引起故障的原因给予解释,即不能确定导致生产故障的异常变量。此类问题可通过计算各变量对统计量的贡献值来解决。贡献值的大小代表了变量引起生产异常程度的大小,贡献值的绝对值较大者多是引起故障的原因,由贡献值得到的贡献图可明显观测出异常变量。设变量Xij为第j个过程变量在第i时的采样,则统计量Q的贡献值为:
3 预测模型的设计
图1所示为某热轧厂精轧区基础自动化系统示意图。精轧机组包括6架四辊轧机,每架轧机由自动位置控制(APC)系统控制液压压下,使辊缝达到要求的开度。APC首先作为自动厚度控制(AGC)系统的内环,执行AGC控制所要求的辊缝调节量。APC是AGC的执行机构,并进行轧辊的倾斜控制,其还用于轧辊精确预摆辊缝,实现轧辊的校平。通过调节相邻两架轧机之间的活套高度使带钢形成张力,当张力变小,则使活套升高,从而前一机架立刻降低速度,使张力变大。总之,套高控制通过调节活套高度使带钢张力达到设定值;速度控制通过调节前一机架的速度使活套高度达到设定值。
每根带钢从咬钢时刻(用A点表示)开始记录数据,直至抛钢带钢离开轧辊(用B点表示)。但由于带钢真正进入机架的时刻是B点而非A点,因此.数据长度从F1机架到F6机架再到测厚仪是逐渐减小的,因此数据长度以测厚仪测量值为准,各机架应截掉咬钢时头部多余的数据(可由前一根带钢计算得出),以后所述咬入时间均从B点开始计算。
结合轧钢过程,提取AGC控制中主要的过程变量13个,包括F1~F6的辊缝和轧制力12个以及咬入时间t。对PLS诊断方法,取精轧出口厚度矗作为因变量。采集这些过程变量在正常工作状态下的n(1800组左右,采样周期40ms)组数据组成样本矩阵Xn×13和Y n×1,考虑到数据尺度的影响,将数据矩阵作归一化处理,得到标准的数据矩阵X b和Yb,对其进行主元分析,建立主元模型。依据主元累计贡献率百分比原则确定主元个数。图2为主元模型中主元累计贡献率,从图2可看出,前5个主元对数据的解释程度可达77.42%。即前5个主元能说明数据77.42%的变化。预测误差平方和PRESSh与误差平方和SSh-1比值的平方根,即在成分数矗分别为2,3,4,5时,取值分别为1.5304,1.3095,1.3278,1.3594,均大于0.95,因此,为进行对比,PLS成分数也取为5。
选取前5个主元建立PCA模型,计算出各统计指标在95%的控制界限值,Q为3.7177,T2为6.2623;选取前5个成分建立PLS模型,计算出各统计指标在95%的控制界限值,Q为1.9920,T2为9.2032。若检测数据的统计量超出控制界限,可有95%的把握确信生产过程中出现了异常情况。
4 实验效果
为了验证模型的诊断能力,分别在16、32s时给F4、F6的辊缝反馈中加入8s故障信号,在36、52s时给F5的轧制力反馈中加入8s故障信号,故障信号为幅值是原始变量初始值2.5%的阶跃信号。由已确立的主元模型对其进行诊断分析。首先将该组数据进行标准化处理,标准化后分别计算数据相对于主元模型的Q统计量和T2统计量。图3为故障数据的Q统计量和T2统计量。从图中可以看到,对于Q统计量,该组数据在第16~第24s,第32~第44s,第52~第60s的统计量明显超出控制界限,从而可认定此时间段内生产出现异常;对于T2统计量,效果并不理想,这也是T2统计量很少应用的原因。对比PLS和PCA的诊断结果,可以看出PLS故障诊断能力更强。
如需确定引起工作异常的变量可通过求解各变量对故障数据的贡献值来完成。过程变量对Q和T2统计量的贡献值可由式(11)、(12)计算得出。对应于故障点数据,贡献值最大的变量往往是引起生产异常的主要因素。图4为PLS方法各变量对Q统计量的贡献,从图中可明显看出,正是引入噪声的变量在对应的时段发生了故障,且可辨别出在第36~第40s时存在两个传感器同时发生故障的情况。说明该方法可辨别多传感器故障。
长期以来PCA一直作为故障检测的主要方法,但其存在不少缺点。PLS的出现,为故障诊断提供了一种更灵敏、更有效的新方法,值得在该领域进行推广。但是,由于PLS方法是以历史测量数据集为基础的,因此它对故障的检测和诊断将局限于仅有的测量变量之中,无法对其他故障进行诊断。将PLS方法和基于过程动态模型故障诊断方法结合起来,对一些复杂故障和过程内部故障进行准确诊断,是今后研究的方向。
参考文献
[1]Macgregor J F,Jaeckle C,Kiparissides C,et a1.Process Monitoring and Diagnosis by Multiblock PLS Methods[J].AIChE J,1994,40(5):826—838.
[2]Tong H,Crowe C M.Detection of Gross Errors in Data Reconciliation by Principle Component Analysis [J].AIChE J,1995,41:1712—1722.
[3]Kramer M A.Autoassociative Neural Networks[J].Computers & Chemical Engineering,1992,16:313—328.
[4]Wegelin J A.A Survey of Partial Least Squares(PLS)Methods with Emphasison the Two—block Case[R].Seattle:Department of Statistics,University of Washington,2000.
[5]wise B M.Gallagher N B.The Process Chemometrics Approach to Process Monitoring and Fault Detection[J].Journal of Process Control,1996,6(6):329—348.
[6]Kruger U,Chen Q,Sandoz D J,et a1.Extended PLS Approach for Enhanced Condition Monitoring of Industrial Processes [J].AIChE J,200l,47(9):2076—2091.
[7]蒋浩天,E L拉赛尔.工业系统的故障检测与诊断[M].北京:机械工业出版社,2003.
[8]张杰,阳宪惠.多变量统计过程控制[M].北京:化学工业出版社,2000.
[9]Valle S,Li W,Joe Q S.Selection of the Number of Principal Components:the Variance of the Reconstruction Error Criterion with a Comparison to Other Methods[J].Ind Eng Chen Res,1999,38(11):4389 4401.
[10]Rosipal R,Trejo L,Matthews B.Kernel PLS-SVC for Linearand Nonlinear Classification[A].Proc of the 20th Int Conf on Machine Learning[C].Washington:2003.640 647.
[11]王惠文.偏最小二乘回归方法及其应用[M].北京:国防工业出版社,1999.
[12]Bhavik R B.Multiscale PCA with Application to Multivariate Statistical Process Monitring[J].AIChE J,1998,8:1596—1609.
[13]Jackson J E,Mudhalkar G S.Control Procedures for Residuals Associated with Principal Component Analysis[J].Technometrics,1979.21:341—349.
- [腾讯]
- 关键字:无