非线性动态 WPLS 航煤干点软测量 ·...

4
非线性动态 WPLS 航煤干点软测量 (南京工业大学电子与信息工程学院,江苏南京 211816 针对炼油工业过程存在的多变量、非线性和数据动态性问题,提出一种自回归移动平均模型与径向基函数- 加权偏最小二乘相结合的非线性动态建模方法。首先建立基于径向基函数-加权偏最小二乘方法的软测量模型,然 后利用自回归移动平均模型对数据进行时序分析校正,将动态误差信息加入到模型中去,实现模型的动态装换。将 该方法应用到加氢裂化航煤干点的软测量建模中,从而获得比径向基函数-加权偏最小二乘算法更高的预测精度。 关键词径向基函数;自回归移动平均模型;偏最小二乘;干点;软测量 中图分类号TP273TE62O224O241.5 文献标志码A 文章编号1674-5124201403-0121-04 Soft sensing for dry point of jet fuel based on nonlinear dynamic WPLS ZOU Han College of Electronics and Information EngineeringNanjing Technology UniversityNanjing 211816China Abstract: A nonlinear dynamic modeling method combining auto-regressive and moving average and radial basis function -weighted partial least squares regression is presented to solve the problem according to the requirements for refining industrial processes with multivariablenonlinear and dynamic data. Firstlythis approach built RBF-WPLS model. ThenARMA models use the data correction timing analysisand dynamic error message will be added to the model to achieve a dynamic model. Finallythe proposed ARMA-RBF-WPLS was used to predict the dry point of jet fuel in hydrocracking unitand it obtained highly precise prediction results compared with RBF-WPLS methods. Key words: radial basis functionARMA modelpartial least squaredry pointsoft sensor 收稿日期2013-11-16收到修改稿日期2014-01-22 作者简介:邹 涵( 1990- ),男,江西丰城市人,硕士研究生, 专业方向为复杂过程的先进控制。 0 在炼油工业的生产过程中,干点是衡量分馏产品 质量的一个关键指标,直接影响到其质量和收率的 高低。但是,该指标是规格参数,无合适的在线分析 仪进行测量,只能离线分析且时间长。因此,建立性 能优良的干点软测量模型,可以实现干点质量指标 的预测,并为生产操作提供指导。目前,软测量已提 出很多方法,有多种全局多元线性回归方法 [1-3] ,具 有简洁明确的表达形式,但难以描述非线性系统。为 了处理非线性问题,又提出了多种非线性软测量方 [3-4] ,然而由于过程生产中自身控制要求的改变、本 身特性的变化以及现场环境对其影响,使得过程生产 通常处于动态,利用静态建模方法难以体现动态特 性,造成模型预测精度低且不能持续使用。所以仅仅 考虑非线性特性是不够的,需要将对象的动态信息融 合到模型中去。 本文提出一种自回归移动平均( autoregression- mnving averageARMA )模型与径向基函数-加权偏 最小二乘( Radial basis function-Weighted partial least regression,RBF-WPLS )相结合的软测量方法。该方法 首先建立基于 RBF-WPLS 的软测量模型,即将具有 非线性样本数据映射到高维特征空间中,在高维特征 空间中建立 WPLS 线性回归模型;然后,利用 ARMA 模型对数据进行动态估计,通过增加动态校正环节, 实现了对静态模型的动态校正。 中国测试 CHINA MEASUREMENT & TEST Vol.40 No.3 May2014 40 卷第 3 2014 5 doi10.11857/j.issn.1674-5124.2014.03.032

Transcript of 非线性动态 WPLS 航煤干点软测量 ·...

Page 1: 非线性动态 WPLS 航煤干点软测量 · 了处理非线性问题,又提出了多种非线性软测量方 法 ... 加权偏最小二乘回归 ... arma(2n+2,2n+1)模型残差平方和,q1

非线性动态WPLS航煤干点软测量

邹 涵(南京工业大学电子与信息工程学院,江苏 南京 211816)

摘 要院针对炼油工业过程存在的多变量、非线性和数据动态性问题,提出一种自回归移动平均模型与径向基函数-加权偏最小二乘相结合的非线性动态建模方法。首先建立基于径向基函数-加权偏最小二乘方法的软测量模型,然

后利用自回归移动平均模型对数据进行时序分析校正,将动态误差信息加入到模型中去,实现模型的动态装换。将

该方法应用到加氢裂化航煤干点的软测量建模中,从而获得比径向基函数-加权偏最小二乘算法更高的预测精度。

关键词院径向基函数;自回归移动平均模型;偏最小二乘;干点;软测量

中图分类号院TP273曰TE62曰O224曰O241.5 文献标志码院A 文章编号院1674-5124渊2014冤03-0121-04

Soft sensing for dry point of jet fuel based on nonlinear dynamic WPLS

ZOU Han(College of Electronics and Information Engineering,Nanjing Technology University,Nanjing 211816,China)

Abstract: A nonlinear dynamic modeling method combining auto-regressive and moving averageand radial basis function -weighted partial least squares regression is presented to solve theproblem according to the requirements for refining industrial processes with multivariable,nonlinear and dynamic data. Firstly,this approach built RBF-WPLS model. Then,ARMA modelsuse the data correction timing analysis,and dynamic error message will be added to the model toachieve a dynamic model. Finally,the proposed ARMA-RBF-WPLS was used to predict the drypoint of jet fuel in hydrocracking unit,and it obtained highly precise prediction results comparedwith RBF-WPLS methods.Key words: radial basis function;ARMA model;partial least square;dry point;soft sensor

收稿日期院2013-11-16曰收到修改稿日期院2014-01-22作者简介:邹 涵(1990-),男,江西丰城市人,硕士研究生,

专业方向为复杂过程的先进控制。

0 引 言在炼油工业的生产过程中,干点是衡量分馏产品

质量的一个关键指标,直接影响到其质量和收率的

高低。但是,该指标是规格参数,无合适的在线分析

仪进行测量,只能离线分析且时间长。因此,建立性

能优良的干点软测量模型,可以实现干点质量指标

的预测,并为生产操作提供指导。目前,软测量已提

出很多方法,有多种全局多元线性回归方法 [1-3],具有简洁明确的表达形式,但难以描述非线性系统。为

了处理非线性问题,又提出了多种非线性软测量方

法[3-4],然而由于过程生产中自身控制要求的改变、本

身特性的变化以及现场环境对其影响,使得过程生产

通常处于动态,利用静态建模方法难以体现动态特

性,造成模型预测精度低且不能持续使用。所以仅仅

考虑非线性特性是不够的,需要将对象的动态信息融

合到模型中去。

本文提出一种自回归移动平均(autoregression-mnving average,ARMA)模型与径向基函数-加权偏

最小二乘(Radial basis function-Weighted partial leastregression,RBF-WPLS)相结合的软测量方法。该方法

首先建立基于 RBF-WPLS 的软测量模型,即将具有

非线性样本数据映射到高维特征空间中,在高维特征

空间中建立 WPLS 线性回归模型;然后,利用 ARMA模型对数据进行动态估计,通过增加动态校正环节,

实现了对静态模型的动态校正。

中国测试CHINA MEASUREMENT & TEST Vol.40 No.3May,2014第 40 卷第 3 期2014 年 5 月

doi院10.11857/j.issn.1674-5124.2014.03.032

Page 2: 非线性动态 WPLS 航煤干点软测量 · 了处理非线性问题,又提出了多种非线性软测量方 法 ... 加权偏最小二乘回归 ... arma(2n+2,2n+1)模型残差平方和,q1

中国测试 2014 年 5 月中国测试

1 径向基函数-加权偏最小二乘回归1.1 加权偏最小二乘回归

加权偏最小二乘回归方法是对偏最小二乘回归

方法的改进算法。下面对 PLS 原理[5]做简单描述:

设样本容量为 n,自变量数据矩阵 X为 n伊p(n跃p)维,因变量数据矩阵 Y 为 n伊q(n跃q)维,提取 PLS 主

元采用 NIPALS 算法[6]。设 T 是前 t 个 PLS 成分组成

的 n伊t 维隐变量矩阵,且有 T=XU,则 PLSR 模型

Y=TC+E=XUC+E (1)式中:U———p伊t 维转换矩阵;

C——— t伊q 维回归系数矩阵;

E———n伊q 维的残差矩阵。

在 NIPALS 算法中可同时计算出 C 与 U,则 q 个

因变量的预测值可以如下回归方程计算:

y赞 =CUx (2)现实情况中,由于每个样本贡献率不同,导致其

权重也不同。为了体现这种情况,可以采用加权回归

方法[7],即对各个样本赋予不同的权值,权值回归模

型为

WY=WXUC+E (3)式中:W———权值系数。

权值大小需根据样本和预测对象之间的欧氏距

离来分配大小。欧式距离与预测能力呈负相关关系[7]。即样本与预测对象的欧式距离越大,所分配的权值将

越小。确认权值系数有很多种方法,本文采用一种较

简单的方法。设权值分配参数为 m(m 为正整数),则

与预测对象欧式距离最近的前 m 个样本权值为 1,其余样本权值为 0。1.2 径向基函数-加权偏最小二乘回归

径向基函数-加权偏最小二乘回归算法是在加

权偏最小二乘算法之前进行径向基函数的非线性变

换。通过输入空间映射到一个新的空间,输出层在新

的空间中进行线性组合,从而将线性不可分问题转

化为线性可分[8]。本文采用最常用的高斯径向基函数

做为隐含层节点的径向基函数。其隐含层节点的加

权输出为

f(x)=m

i = 1移姿iexp(- 椰 xi-c i椰 2

滓i2 ) (4)

式中:姿i———隐含层输出的权值系数;

m———径基个数;

ci,滓i———第 i个是高斯函数的中心和宽度参数;

椰·椰———欧式范数。

RBF 网络中需要学习 3 个参数,即高斯函数的

中心 c i、宽度 滓i 以及隐含层输出的权值系数 姿i。高斯函

数的中心 ci 和宽度 滓i 可以采用 K-均值聚类方法 [9]

确定,权值系数 姿i 可以采用偏最小二乘方法算出。

2 ARMA模型ARMA 模型 [10]是研究时间序列、用于平稳时间

的重要方法。即序列的当前值除了与自身的过去值

存在关系,并且还与其以前进入系统的外部干扰存在

一定的依赖关系,则该模型在表现刻动态特性时,模

型中既包括自身的滞后项,也包括过去的外部干扰误

差项。通常 ARMA 模型可表示为

X t-m

k - 1移准kX t - k=at-

n

k - 1移兹kat - k (5)

对其引入后向算子 B 有:Bxt=xt-1,B2X t=X t-2,(c 为

常数)。对于上述 ARMA 模型表达式,分别令:

准(B)=1-准1B-准2B2-…-准pBp

兹(B)=1-兹1B-兹2B2-…-准pBq

则式(5)转变为如下表达式:

准(B)xt=兹(B)at (6)式中:xt———正态、平稳的时间序列;

at———随机干扰误差项;

B———延迟算子;

准(B),兹(B)———算子多项式。

模型称为 p 阶自回归、q 阶滑动平均模型,记作

ARMA(p,q)。ARMA(n,n-1)模型具有将随机平稳系统逼近到

任意精度的功能,通过递增法逐步逼近,需找适合的

n 值,确定模型阶数 n。同时,n 以 2 为递增量,不需

要对 ARMA(n,n-1)((q屹p-1))模型的讨论,从而降

低复杂度[11]。对于 ARMA(n,n-1)模型阶次的确定,利用 F校

验方法来判定。从 n 取 1 开始逐渐增大取值,直到

获得满意的模型阶次。设 H0:准2n + 2=0,兹2n + 1=0,Q0 为ARMA(2n+2,2n+1)模型残差平方和,Q1 为 ARMA(2n,2n-1)模型残差平方和,则:

F=Q1-Q0

sQ0n- r

(7)

式中:s———被校验参数的个数;

r———模型参数的总个数;

n———样本长度。

若 F跃Fa,则 H0 不成立,模型将继续增加阶次;否

则,ARMA(2n,2n-1)是合适的模型。而 Fa 的值可由

F分布表和预先给定的置信度 a来确定。

3 ARMA-RBF-WPLS算法首先利用 RBF-WPLS 算法建立软测量预测模

型,将该模型训练输出值y赞 m 与真实测量 ym 值相减,

122

Page 3: 非线性动态 WPLS 航煤干点软测量 · 了处理非线性问题,又提出了多种非线性软测量方 法 ... 加权偏最小二乘回归 ... arma(2n+2,2n+1)模型残差平方和,q1

第 40 卷第 3 期

得到一个关于输出值误差 驻ym 的时间序列值,利用

ARMA(n,n-1)模型对该时间序列进行建模,得到关

于预测误差的 ARMA 模型。将以上两个模型相结合

进行模型预测时,RBF -WPLS 模型输出值减去

ARMA 模型的误差值,即得到输出变量的预测结果。

该模型结构框图见图 1。

其实现过程步骤如下:

(1)将每个训练样本作为 RBF 的基向量(ci=xi,i=1,2,…,n),使得隐含层节点个数等于样本数。对

输入矢量 x 执行非线性变换,得到隐含层输出矢量

R i(x)(i=1,2,…,n),即

R i(x)=exp(- 椰xi-c i椰 2滓i

2 ) (8)滓i 中的元素计算如下:

滓i1=滓i2=…=滓ip= en

n

i = 1移椰 x-xi椰,

i=1,2,…,n (9)式中:e———大于 0 的常数。

将得到的输出矢量 R i(x)组成 n伊n 维的隐含层

输出矩阵 Ri(x)。(2)采用 WPLS 回归方法,假定提取的主元个

数为 t(t=1,2,…,p);权值分配参数为 m(m=t+1,t+2,…,n-1)。

(3)利用舍一交叉验证的思想,在所有样本 n 中

选出一个样本来,设为 xi(i=1,2,…,n)。将其作为测

试样本,剩余 n-1 个样本均作为训练样本。并且在训

练集中,将与测试样本距离最近的 m 个样本权值设

为 1,其余样本权值设为 0。构建权值矩阵 W。

(4)分别对自变量矩阵 X 和因变量矩阵进行加

权处理,得到 m伊p 维的自变量矩阵 Xm=WX 和 m伊q维的因变量矩阵 Ym=WY。

(5)通过 NIPALS 算法,从自变量矩阵 Xm 中提

取 t 个主元,构建 m伊t 维隐变量数据矩阵 Tm,t 同时

计算对应的 p伊t 维转换矩阵 Um,t 和 t伊q 维回归系数

矩阵 Cm,t。

(6)采用相对误差平方和 Em,t 来确定 m 和 t 的

值,Em,t=n

j = 1移 q

l = 1移( yjl-y赞 jl

yjl)2。对于 1 到 n 记录每个

Em,t 的值。其中y赞 j 为测试样本 xj 的预测矢量,y赞 j=C Tm,t

UTm,txj;y赞 jl 为其第 l 个分量;yjl 为第 j 个实际测量值。

(7)构建相对误差矩阵 R,将每个 Em,t 值对应输

入其中,并在矩阵其他没有对应的位置添入+肄。当

误差矩阵中 Em,t 取最小值时,即为 Em,t 的最优目标

值,对应行列分别记为 m0 和 t0。(8)对于预测对象,将权值分配参数取为 m0,提

取的主元个数取为 t0,按(2)耀(6)步骤建立回归模型。

(9)将训练样本集经过 WPLS 模型处理后,得到

一组模型输出值y赞 m,将其与真实测量值 ym 相减,得

到关于训练输出值误差时间序列值 驻ym,对该时间序

列进行 ARMA 建模,确定 ARMA(n,n-1)模型阶数。

模型阶数 n 的确定采用递增系列法逐步逼近,找到

最合适的 n 值。

(10)利用上述两个模型对测试样本进行仿真,

软测量模型最终的输出值即为

y赞(t)= y赞 m(t)-驻 y赞 m(t) (10)4 仿 真

以某石化公司加氢裂化装置为研究背景,经现场

了解工艺情况及相关性分析后发现:航煤干点主要

受 10 个变量的影响:航煤抽出量 x1,回流温度 x2,回流量 x3,轻石脑油抽出量 x4,重石脑油抽出点温度

x5,重石脑油抽出量 x6,进料量 x7,进料温度 x8,塔釜

温度 x9,塔顶压力 x10。现将 10 个变量作为模型的输

入变量,以分馏塔的航煤干点作为输出变量,对现场

数据进行采集,并剔除病态数据,共采集了 174 组数

据。将其中的 124 组作为训练数据,其余的 50 组作

为测试数据,采用 ARMA-RBF-WPLS 方法建立航

煤干点软测量模型。根据上述 ARMA-RBF-WPLS建模步骤,需要寻找 Em,t 的最小值来确定权值分配

参数和主要个数。由趋势性分析得到 Em,t 取最小值

时,分别对应的权值分配参数 m 为 93,主元个数 t为 8,并选出与预测对象之间欧氏距离最小的 93 个

样本,其权值分配为 1,剩余样本权值分配为 0,得到

加权样本。

ARMA 模型参数阶数的确定,从 ARMA(2,1)模型开始,以 2 为步长,建模 ARMA 模型,每当 n 增加

时,通过 F准则去检验判定。当模型增加到 ARMA(5,4)时,与 ARMA(4,3)对比发现在预定的显著误

邹 涵:非线性动态 WPLS 航煤干点软测量

图 1 基于 RBF-WPLS 和 ARMA 的软测量模型结构

WPLS径向基函数

左xm渊t冤

x2渊t冤x1渊t冤

+-

ARMA

y赞渊t冤

驻y赞m渊t冤-

y赞m渊t冤

驻y赞m渊t-1冤Z-1

Z-1

Z-1

驻y赞m渊t-2冤

驻y赞m渊t-k冤

123

Page 4: 非线性动态 WPLS 航煤干点软测量 · 了处理非线性问题,又提出了多种非线性软测量方 法 ... 加权偏最小二乘回归 ... arma(2n+2,2n+1)模型残差平方和,q1

中国测试 2014 年 5 月中国测试

差水平上 F值下降不显著,所以模型阶数应停止增

加,选择 ARMA(4,3)为航煤干点的软测量模型。

图 2 给出了 ARMA-RBF-WPLS 模型预测值与

工厂实际值对比曲线。

为做对比,采用相同数据用 RBF-WPLS 方法建

立干点预测模型。图 3 给出了 RBF-WPLS 模型预测

值与工厂实际值对比曲线。从表 1 和图 2~图 3 可以

看出,ARMA-RBF-WPLS 模型与 RBF-WPLS 模型

相比,结构更加精确,误差更小,更好地反映了航

煤干点的变化趋势。在 50 组检验样本中,采用

ARMA-RBF-WPLS 模型的均方差为 1.226 8益,82%的样本误差小于依1益,98%的样本误差小于依2益;采

用 RBF-WPLS 模型的均方差为 1.651 4益,70%的样

本误差小于依1益,90%的样本误差小于依2益。ARMA-RBF-WPLS 模型与 RBF-WPLS 模型对比,显示出更

高的拟合精度。

5 结束语通过利用 RBF-WPLS 和 AMRA相结合的方法实

现了系统动态过程的非线性软测量建模,利用AMRA模型克服了 RBF-WPLS 算法难以描述动态特性的

缺点,利用历史输出值对当前时刻的影响实现了预

测误差的动态估计,体现了系统的动态特性。将该方

法应用于加氢裂化第一分馏塔航煤干点的预测,仿

真结果验证了该方法与 RBF-WPLS 软测量模型相

比具有更高的预测精度。

参考文献[1] Bastion P,Esposito V V,Michel T. PLS generalized

linear regression [J]. Computational Statistics and DataAnalysis,2005,48(1):17-46.

[2] 石琳,汤佳佳,于涛,等. 基于样条变换的非线性 PLS 的

反应高炉炉温的参数预测[J]. 钢铁研究学报,2013,25(2):22-25.

[3] 蔡华斌. 基于神经网络的电机转矩软测量研究[J]. 中国

测试技术,2007,33(2):50-52.[4] Nicolai B M,Theron K I,Lammertyn J. Kernel PLS

regerssion on waveler transformed NIR spectra for pre原diction of sugar content of apple[J]. Chemoertrics andIntelligent Laboratory Systems,2007,85(2):243-252.

[5] 颜学峰. 基于径基函数-加权偏最小二乘回归的干点软

测量[J]. 自动化学报,2007,33(2):193-196.[6] 计智伟,吴耿锋. 基于层次聚类算法和偏最小二乘的特征

选择[J]. 计算机工程与设计,2009,30(21):4931-4935.[7] 刘海涛,魏汝禅,蒋国萍. 基于加权偏最小二乘回归的软

件成本估算方法[J]. 计算机工程,2012,38(21):36-39.[8] 贾明兴,赵春晖,王福利,等. 基于 RBF 神经网络的非线性

主元分析方法[J]. 仪器仪表学报,2008,29(3):453-457.[9] 韩敏,刘晓欣. 基于互信息的分布式输入变量选择多元

序列预测研究[J]. 自动化学报,2012,38(6):999-1006.[10] 阎平凡,张长水.人工神经网络与模拟进化计算[M].北京:

清华大学出版社,2000:46-48.[11] Ives A,Abbott K C,Ziebarth N L. Analysis of ecological

time series with ARMA(p,q) model[J]. Ecology,2010,91(3):858-871.

比较项目 ARMA-RBF-WPL 模型 RBF-WPLS 模型

均方差 1.226 8益 1.651 4益依1益 82% 70%依2益 98% 90%

表 1 ARMA-RBF-WPL 模型和 RBF-WPLS 模型的结果比较

图 2 ARMA-RBF-WPLS 模型预测结果与实际值对比

0 10 20 30 40 50样本序号

ARMA-RBF-WPLS预测值实际值

269267265263261259257

图 3 RBF-WPLS 模型预测结果与实际值对比

0 10 20 30 40 50样本序号

RBF-WPLS实际值

269267265263261259257

124