赢博体育

赢博体育

你的当前位置: 赢博体育 > 赢博动态

IM电竞APP基于DPCA-IM的动态过程监测方法

发布日期:2022-09-05 18:03:29 点击次数:

  收稿日期:20191024;修回日期:20191210基金项目:国家自然科学基金资助项目(61773225,61803214)作者简介:孟生军(1992),男,浙江绍兴人,硕士研究生,主要研究方向为数据驱动的工业过程监测;童楚东(1988),男(通信作者),湖北黄冈人,教授,硕导,博士,主要研究方向为数据驱动的工业过程监测(tongchudong@nbu.edu.cn).基于 DPCAIM的动态过程监测方法 孟生军,童楚东 (宁波大学 信息科学与工程学院,浙江 宁波 315211)摘要:动态主成分分析(DPCA)通过增广矩阵或向量的方式来挖掘采样数据间的时序自相关性。然而,DPCA对自相关的特征成分与残差直接实施监测是不合理的,故其故障检测效果较差。为了剔除采样数据的自相关性以提高故障检测效果,提出一种基于估计误差的动态过...

  收稿日期:20191024;修回日期:20191210基金项目:国家自然科学基金资助项目(61773225,61803214)作者简介:孟生军(1992),男,浙江绍兴人,硕士研究生,主要研究方向为数据驱动的工业过程监测;童楚东(1988),男(通信作者),湖北黄冈人,教授,硕导,博士,主要研究方向为数据驱动的工业过程监测(tongchudong@nbu.edu.cn).基于 DPCAIM的动态过程监测方法 孟生军,童楚东 (宁波大学 信息科学与工程学院,浙江 宁波 315211)摘要:动态主成分分析(DPCA)通过增广矩阵或向量的方式来挖掘采样数据间的时序自相关性。然而,DPCA对自相关的特征成分与残差直接实施监测是不合理的,故其故障检测效果较差。为了剔除采样数据的自相关性以提高故障检测效果,提出一种基于估计误差的动态过程监测方法。首先,通过逐个假设各个过程变量的测量数据缺失,并在已建立的 DPCA模型中引入迭代方法(IM)计算得到相应变量缺失数据的估计值。由于该估计值在仅缺失一个变量数据的条件下能较大程度地逼近原测量数据,两者之差(即估计误差)不再存在显著的自相关性,而且该估计误差的变化可直接反映出采样数据变化情况的异常,所以可利用估计误差监测动态过程。最后,通过两个动态过程实例,即动态数值仿真过程与田纳西伊斯曼(TE)标准测试平台的仿真结果表明,该方法能剔除采样数据间的自相关性,并能有效地提高故障检测效果,验证了该方法不仅可行,而且具有良好的优越性。关键词:动态主成分分析;估计误差;自相关性;缺失数据中图分类号:TP277文献标志码:A文章编号:10013695(2021)01035017504doi:10.19734/j.issn.10013695.2019.10.0634DynamicprocessmonitoringbasedonestimationerrorofmissingvariableMengShengjun,TongChudong(FacultyofElectricalEngineering&ComputerScience,NingboUniversity,NingboZhejiang315211,China)Abstract:Dynamicprincipalcomponentanalysis(DPCA)extractsthetimeserialautocorrelationinheritedfromsampleddatathroughenhancementmatrixorvector.However,thewayofmonitoringtheautocorrelatedfeaturesandresidualsdirectlyintheDPCAmodelisnotappropriate,giventhatthenegativeinfluencecausedbytheautocorrelationonthemonitoringstatisticsisignored.Therefore,onthebasisoftheDPCAmodelthatexactstimeserialautocorrelation,howtoeliminatetheautocorrelationinheritedinthesampleddataisfurtherrequired.Thispaperproposedadynamicprocessmonitoringmethodbasedonestimatederrors.Throughsequentiallyassumingthemeasureddataofeachprocessvariablewasmissing,itintroducedandincorporatedtheiterationmethod(IM)withthebuiltDPCAmodelsoastocalculatetheestimatesofcorrespondingvariable.Sincetheestimatescouldapproximatetheoriginalmeasureddatatoalargeextentwithonlyonevariablewasmissing,theinconsistencybetweenthetwo(i.e,estimationerror)nolongerexistedobviousautocorrelation.Moreover,thevariationoftheestimationerrorcoulddirectlyreflecttheabnormalvariationinthesampleddata,theestimationerrorcouldthusbeusedfordynamicprocessmonitoringpurposes.Finally,throughcomparisonsintwodynamicexamples,adynamicnumericalprocessandtheTennesseeEastmanbenchmarkprocess,thesuperiorityoftheproposedDPCAIMapproachoverotherdynamicprocessmonitoringmethodsarevalidated.Keywords:dynamicprincipalcomponentanalysis;estimationerror;autocorrelation;missingdata0引言过程监测作为保障工业过程生产安全与产品质量的核心技术之一,经历了从基于解析模型逐渐向基于数据驱动方法的转变。解析模型是基于系统过程状态参数实测值与估计值之间的误差来进行故障检测,该误差的变化幅度反映了工业过程实际运行状态是否出现异常。然而,随着工业过程规模与复杂度逐步提升,这使得建立符合精度要求的解析模型变得十分困难。由此,基于数据驱动的过程监测方法,尤其是多变量统计过程监测(multivariatestatisticalprocessmonitoring,MSPM)方法,已成为近年来研究的热点而得到越来越多的重视 [1~3] 。在多变量统计过程监测可使用的建模算法中,主元分析(principalcomponentanalysis,PCA)与偏最小二乘(partialleastsquare,PLS)是最常见的算法。PCA算法由于可以挖掘采样数据间的交叉相关性,已被广泛用于多变量共线] 。通常来讲,基于 PCA的过程监测方法常使用 T2 与 Q统计量分别监测特征成分与模型残差的变化情况。然而,现代工业过程采样时间间隔普遍较短 [5,6] ,使系统过程采样数据间存在显著的时序自相关性。由于时序自相关性特征的异常变化同样能反映出过程采样数据的异常,挖掘时序自相关性特征的动态过程建模与监测方法于近年来得到了广泛的关注。Ku等人 [7] 最早提出了 DPCA方法,其主导思想是通过为各个样本数据中引入延时测量样本来构建增广矩阵,从而将时序自相关性转换成交叉相关性,已成为实施动态过程监测的主流技术手段。虽然 DPCA能提取自相关的动态特征成分,但是 DPCA对特征成分的自相关性不具备可解释性,且特征成分与模型残差中存在的自相关性对于监测统计量的使用也会造成负面影响。这主要是因为监测统计量的实施通常要求被监测数据是独立采样的,即不存在显著的时序自相关性 [8,9] 。最近,Li等人 [10]提出了一种基于动态潜变量(dynamiclatentvariable,DLV)的动态过程监测方法。该方法先提取训练数据中时序自相关的动态成分,然后再对剩余残差部分进行 PCA建模,实现对静态特征的提取。类似地,Dong等人 [11] 在 DLV基础上提出了一种动态内部 PCA(dynamicinnerPCA)过程监测方法,也实现了对动态特征成分的提取。值得注意的是,DLV与 DiPCA在监测第 38卷第 1期2021年 1月计 算 机 应 用 研 究ApplicationResearchofComputersVol38No1Jan.2021 自相关的动态特征成分时,都采用自回归(autoregressive,AR)模型来过滤掉时序自相关性,再对 AR模型误差实施监测。相比于 DPCA通过时滞因子来提取动态特征成分,利用 AR模型来剔除自相关性具有良好的可解释性。然而采用此类方法实施过程监测,监测效果并没有比前者有明显的提升。为此,本文借鉴解析模型误差生成的思路,提出了一种基于DPCAIM的动态过程监测方法。该方法从纯采样数据的角度出发,结合使用 DPCA模型与处理缺失数据的迭代(iterationmethod,IM)方法生成各个测量变量的估计误差,并利用估计误差实施动态过程监测。相比于直接对自相关的动态特征成分实施监测而言,剔除自相关性后的误差能更好地反映出自相关性特征的变化情况,并能有效地提高模型的故障检测效果。具体来讲,在 DPCA模型已建立的基础上,逐个假设各过程变量的测量数据缺失,通过 IM方法推算出每个缺失变量的估计值 [12] 。若工业过程数据有 m个测量变量,就会产生 m个缺失变量的估计值,这一做法可以充分保证每个过程变量的重要性都是一样的。然后,可将原测量数据转换为估计误差。该做法的优势在于:生成的估计误差不存在显著的时序自相关性。这主要是因为缺失变量的估计值能较大程度地逼近其真实测量值,所以两者之差可以将该缺失变量中的时序自相关性特征剔除。此外,估计误差的变化大小可以反映出采样数据的异常变化程度,最后,利用该估计误差对在线过程数据进行监测。同时,通过对比实验在 TE仿线] 上验证了本方法的有效性与优越性。1基本方法介绍11DPCA算法DPCA通过为各个样本数据引入其前 l个时滞测量数据,从而将训练矩阵 X瓗 n×m (n为样本数,m为变量数)增广成如下所示的增广矩阵 :X d =x1+lxl x1x2+lx1+l x2  xnxn-1 xn-l瓗 (n-l)×(l+1)m (1)并对 Xd 进行奇异值(SVD)分解,即可得到其 DPCA模型,即X d =TPT +E(2)从 DPCA模型可以看出,DPCA算法是将过程数据中存在的时序自相关性和交叉相关特性混在一起考虑的。其中 xj 瓗 1×m (j=1,2,,n)表示 j时刻的样本数据;T瓗 n×k 、P瓗 m×k 和 E瓗 n×m 分别为得分矩阵、载荷矩阵和残差矩阵;主元个数 k可 通 过 采 用 方 差 贡 献 率 (cumulativepercentagevariance,CPV)原则来确定。在线故障检测时,对新采样数据xt 建立增广矩阵 x=[x t ,x t-1 ,,x t-l ]后,构建 T2 和 Q统计量来监测特征子空间和残差子空间,即T2 =x T P -1 P T x,Q=e T e=x T (I-PP T )x(3)其中:=diag{1,2 ,, k }。T2 和 Q的控制上限可利用文献[14]中介绍的核密度估计(kerneldensityestimation,KDE)方法来确定,以避免高斯分布的假设问题 [15] 。12DLV和 DiPCA算法DLV算法为了提取过程数据中时序自相关的动态成分,提出了一种结构化的 DPCA,即 SDPCA(structuredDPCA),其目标函数为maxw, wT (1 XT1 + + l XTl )( 1 X 1 + + l X l )ws.t.‖w‖ =1,‖‖ =1 (4)该目标函数通过求解权重向量 w和权重系数向量 =[1,2 ,, l ]来提取自相关特性的动态成分。与其类似,DiPCA算法通过求解如下目标函数:maxw, wT X Tl+1 ( 1 X 1 + + l X l )ws.t.‖w‖ =1,‖‖ =1 (5)来提取时序自相关的动态信息。两种算法的目标函数都是利用拉格朗日乘子法来求解,具体求解可参考文献[8,9]。DLV和 DiPCA算法分别按照式(4)与(5)提取过程数据中动态成分后,对动态成分建立 AR模型,来实现对自相关性的顾虑,并只利用 AR模型误差来反映自相关动态特征的变化情况。值得指出的是,DLV和 DiPCA皆使用 PCA算法进一步分解提取完动态特征后的残差信息,因此 DLV与 DiPCA皆涉及 T2d IM电竞APP、T2s 和 Q三个统计量来监测过程数据中自相关的动态特性和静态特性。2基于 DPCAIM的过程监测方法21基于 IM的估计误差生成策略通过逐一假设各个过程变量的测量数据缺失,然后利用IM即可生成各个过程变量对应的估计误差。以第 i个过程变量的测量数据缺失为例,可不失一般性地将数据向量表示为x=[x#i ,xi ](6)其中:x#i 为假设第 i个过程变量缺失;xi 表示剩下的过程变量的测量数据。由此可将 DPCA模型中的负载矩阵 P表示为P=P#iPi(7)其中:P#i 对应于缺失的第 i个过程变量;Pi 对应于剩余的可测量变量。基于 IM生成第 i个过程变量估计误差流程如图 1所示,具体步骤介绍如下:a)将增广矩阵 Xd 表示成 X d =[X#i ,Xi ],其中 X#i 表示第 i个过程变量缺失的测量数据,Xi 表示剩下的过程变量的测量数据。b)初始化第 i个过程变量对应的估计值为X^ #i =0。c)计算主成分的估计值:^t=X#i P#i +Xi Pi 。d)更新第 i个过程变量的估计值:X^ #i =tP#iT 。e)判断估计值X^ #i 是否收敛?若是,则得到第 i个过程变量在测量数据缺失情况下的估计值X^ #i ;否则返回步骤 c)继续迭代。f)计算相应缺失变量的估计误差:ei =X#i -X^ #i 。???????? ??? ? ? ? ? ? ?? ? ? ? ? ?????? ?? ? ??? ? ? ? ? ? ? ???? ? ? ? ???????????? ? ? ? ??? ?? ?? ? ? ????????? ? ? ?? ? ? ?? ? ? ????图 1基于 IM的误差生成方法Fig.1EstimationerrorgenerationbasedonIM22基于估计误差的动态过程监测221离线建模阶段a)对正常工况下的训练数据集X按1.1节构建增广矩阵Xd 。b)对 Xd 进行标准化,以消除变量间的量纲影响。c)对增广矩阵 Xd 建立 DPCA模型:X d =TPT +E。d)利用 2.1节的方法,产生每个变量对应的估计误差 ei ,对应得到估计误差矩阵:E=[e1 ,e 2 ,,e i ]。e)对误差矩阵 E进行 SVD分解:E=UVT ,得到转换矩阵:W=V-1 。f)根据 Q=diag{EWW T ET }计算训练数据的监测统计量Q,并利用 KDE法确定其控制上限 Qc ,其中 diag{}表示取矩阵 6 7 1 计 算 机 应 用 研 究 第 38卷 对角线在线故障检测阶段a)为最新采样时刻(即 t时刻)的样本数据 xt 引入其前 l个时滞测量数据,得到增广矩阵 x=[xt ,x t-1 ,,x t-l ]。b)逐个假设各个过程变量的测量数据缺失,并利用 2.1节中的 IM方法,推算各个过程变量的估计值,得到 m个变量的估计误差向量 f瓗1×m 。c)计算其监测统计量 Q,即:Q=fWW T fT(8)d)根据监测统计量 Q是否超出其控制限 Qc 来决策当前采样时刻是否发生故障。3仿线数值仿真实验首先,构造与文献[16]类似的动态数值仿真过程来验证DPCAIM方法的优越性,该数值仿真过程具体形式如下所示。z(k+1)=0.118 -0.1910.847 0. 264z(k)+1 2  3 -4u1 (k)u2 (k )y(k)=z(k)+(k)u(k+1)=0.811 -0.2260.477 0. 415u(k)+0.193 0.689-0.320 -0. 749w1 (k)w2 (k )(9)输入变量[w1 (k)w 2 (k)]T 是均值为 0方差为 1的随机信号,是均值为 0方差为 0.1的随机噪声,k为时刻。输入信号u、z以及输出信号 y皆为过程测量变量。根据式(9)产生 600个正常运行状态下的样本数据,以建立三种不同的动态过程监测模型:DPCA、DLV、和 DPCAIM,其中参数 l=1。为测试动态过程监测方法的性能,特设计两类非正常工况:case1:为 w1 和 w 2 引入幅度为 0.6(k201)的斜坡故障;case2:将矩阵 A4 中(2,2)元素变为 0.2。同样采集上述两类故障工况下的样本数据各 1000个,其中前 200个样本数据处理工况正常运行状态下,故障工况从第201个采样点后引入。表 1中详细统计了三种动态过程监测方法的故障检测率,其中 case0表示正常工况下的运行状态。从表 1中可以看出,三种方法针对正常工况下的采样数据实施监测时,都能很好地将误报率控制在置信限 =99%左右。此外,针对人为引入的两个故障工况,在 case1中 DPCAIM相较于其他两种模型,其故障检测率至少提高了 15%。在 case2中 DPCAIM的故障检测效果有进一步的提高,比其他两种动态过程监测模型提高了35%左右。这是因为基于 DPCAIM算法为各个过程变量逐个实施自相关性剔除,相应的估计误差中不再存在显著的自相关特性。如图 2所示,估计误差矩阵 E中各估计误差的自相关性示意图(以前六个过程变量为例)验证了 DPCAIM算法能够直接剔除采样数据间的时序自相关性,从而使估计误差中不再显著地存在自相关性。表 1数值过程的故障检测率Tab.1FaultdetectionratesinthenumericalexamplecaseDPCAT2QDLVT2dT2sQDPCAIMQ0 0.00 0.30 0.00 0.50 1.00 1.001 0.24 54.75 0.00 69.50 2.50 85.182 0.00 14.43 0.00 0.25 41.50 76.5032TE过程仿线)是建立在真实的化工过程基础上,已经作为化工过程监测的标准实验平台 [17~20] 。整个平台主要包括五个操作单元:反应器、冷凝器、循环压缩机、分离器和汽提塔。该过程可连续测量 22个过程变量和 12个操作变量,还可仿线] 。在本文 TE对比实验中,根据文献[11]选取其中的 33个变量作为过程变量。图 2误差矩阵 E中各列向量的自相关性Fig.2AutocorrelationplotsofthecolumnvectorsinresidualmatrixE???????????????????? ?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????? ?????????????????????????????????????????图 3TE过程结构Fig.3FlowsheetofTEprocess在离线建模阶段,使用无故障状态下的 960个训练数据建立 DPCA、DiPCA、DLV和 DPCAIM的四个动态过程监测模型。所有算法的置信度取 =99%,其中,DiPCA与 DLV算法都使用 T2d 、T2s 和 Q三个监测统计量,分别监测动态特征、静态特征与残差信息。DLV和 DiPCA算法的具体设置分别与文献[8,9]相同。在 DPCA和 DPCAIM模型中,根据文献[7]确定参数l=2,主元个数以 CPV85%确定,统一设置主元个数为 34。在线故障检测阶段,将四种动态过程监测模型应用于 TE过程的 21种故障工况。其中,21种故障工况对应 21个测试数据集,每个测试数据集中前 160个样本都是正常工况状态,第 161个样本开始为故障状态 [22] 。表 2中详细统计了每种故障对应的漏报率。根据文献[23~25]得出的结论,故障 3、9和 15无法有效地检测出故障信息,因此本实验未涉及这三种故障。表 2中粗体表示在四种动态过程模型中取得最低的漏报率。虽然故障 2和21,DPCAIM漏报率比 DPCA和 DLV高,但都控制在 2%以内,可以忽略不计IM电竞APP。表 2TE过程故障漏报率Tab.2FaultmissingalarmratesofTEprocessNo.DPCAT2QDiPCAT2dT2sQDLVT2dT2sQDPCAIMQ1 0.75 0.13 0.25 0.88 0.63 0.00 0.00 0.63 0.002 1.50 2.75 1.63 1.88 3.50 1.01 2.25 9.63 1.634 99.38 0.00 0.00 77.25 0.00 95.85 0.00 87.13 0.005 76.00 55.00 76.69 93.63 79.38 89.95 81.75 0.25 0.006 1.13 0.00 0.50 1.63 0.00 0.25 1.00 0.00 0.007 0.00 0.00 0.00 0.00 0.00 82.28 0.00 69.75 0.008 2.63 3.00 5.13 16.83 19.50 12.19 6.38 30.50 1.3810 75.13 48.88 83.33 97.25 40.63 94.22 90.50 37.50 11.1411 72.88 6.00 14.79 58.25 12.63 89.32 19.00 88.50 5.7612 0.88 17.38 8.15 21.00 9.88 19.72 9.00 17.38 0.0013 5.75 4.63 6.25 26.63 7.75 29.27 4.88 11.00 3.3814 0.13 0.00 0.00 12.75 0.00 0.00 0.00 11.25 0.0016 90.38 48.00 81.70 98.38 69.50 91.08 90.63 36.63 11.9017 22.75 2.25 11.53 33.13 3.25 31.28 5.13 6.25 1.8818 11.13 9.38 9.25 10.88 9.38 11.43 10.00 9.63 9.1519 77.25 33.38 60.53 82.25 72.63 90.58 81.13 37.00 8.2720 61.13 36.38 50.63 78.75 47.38 73.12 60.63 35.13 8.1521 54.25 49.50 73.56 78.13 74.63 92.4649.25 83.13 50.63AVE36.28 17.59 26.88 43.86 26.74 50.22 28.42 31.74 6.29 7 7 1 第 1期 孟生军,等:基于 DPCAIM的动态过程监测方法 由表2可见,DPCAIM在绝大数故障类型上都取得了最小的故障漏报率。这说明 DPCAIM的故障监测效果要优于其他三种动态过程监测算法,尤其是故障 5、10、11、16、19和 20的检测效果最为明显。为了证明 DPCAIM比其他三种方法有更好的优越性,由于本文重点研究的对象是估计误差,所以图 4和 5给出了故障16和20在 Q统计量上的过程监测效果图。从图 4中可看出,DPCAIM遇到故障数据就能立马发出故障警报,而其他三种方法并不能有效地检测出故障信息。针对图 5,虽然四种方法都是检测到故障数据,但是只有 DPCAIM能持续保持故障警报,其他三种方法存在比较大的故障漏报率。最后,可从表2中发现,DPCAIM在四种方法中取得了最低的平均漏报率。通过上述两个动态过程对象的对比验证实验,充分说明了DPCAIM方法的动态过程监测上的可行性与优越性。图 4故障 16的过程监测结果Fig.4Monitoringchartsoffault16图 5故障 20的过程监测结果Fig.5Monitoringchartsoffault204结束语本文受解析模型思想的启发,提出一种基于 DPCAIM动态故障检测模型。利用过程变量与缺失变量估计值之间的误差对故障进行在线检测。该方法的优势在于,保证了每个过程变量的重要程度都是一样的,同时生成的估计误差解耦了...IM电竞APP