一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于catboost算法的汽轮机背压趋势预测方法与流程

2022-07-30 13:06:58 来源:中国专利 TAG:


1.本发明涉及机器学习领域,属于电厂运维技术,具体涉及一种基于catboost算法的汽轮机背压趋势预测方法。


背景技术:

2.随着电力工业的迅速发展,越来越多的大型机组陆续投入运行,机组容量的增大使其结构和系统日趋复杂,如何保证这些机组能安全可靠地运行,对国民经济的发展具有十分重要的意义。
3.从某种意义上来说,趋势预测是现场生产更为迫切需要的一项功能,与故障诊断相比,现场人员更关心的是机组继续运行下去是一种什么状态,希望能预知未来趋势。因此了解设备将来的发展趋势对企业更为重要。趋势预测技术可以在分析设备当前运行状态的基础上了解其未来状态发展趋势,在设备发生缺陷前采取一些预防措施避免发生,提高设备运行的安全性、稳定性和可靠性,另外借助于趋势预测技术,还有利于及时调整运行方式,提高机组经济性。机组的状态检测与趋势预测和机组的维修是分不开的,提高机组的可用率以降低发电成本是实现这一目标的主要措施之一,因此趋势预测技术的研究具有重要的科学意义和研究价值。
4.随着科学技术的发展,趋势预测的方法越来越多,同时预测精度也越来越高。但每一种趋势预测方法均有其优缺点,catboost是俄罗斯的搜索巨头在2017年开源的机器学习库,也是boosting族算法的一种,它依然是在gbdt算法框架下的一种改进实现,是一种基于对称决策树算法的参数少、支持类别型变量和高准确性的gbdt框架, catboost是处理梯度偏差以及预测偏移问题,提高算法的准确性和泛化能力。
5.catboost算法相比于其他网络模型,有明显优点,首先可以避免像人工神经网络模型训练速度慢且训练过程中需要人为设置以及大量超参的调整。其次catboost算法采用默认参数也可以获得非常好的结果,减少在调参上面花的时间,同时它可以基于gpu的梯度提升算法(如图3所示)来训练你的模型,并支持多卡并行。catboost,和所有标准梯度提升算法一样,都是通过构建新树来拟合当前模型的梯度。然而,所有经典的提升算法都存在由有偏的点态梯度估计引起的过拟合问题。许多利用gbdt技术的算法(例如,xgboost、 lightgbm),构建一棵树分为两个阶段:选择树结构和在树结构固定后计算叶子节点的值。为了选择最佳的树结构,算法通过枚举不同的分割,用这些分割构建树,对得到的叶子节点中计算值,然后对得到的树计算评分,最后选择最佳的分割。两个阶段叶子节点的值都是被当做梯度或牛顿步长的近似值来计算。catboost第一阶段采用梯度步长的无偏估计,第二阶段使用传统的gbdt方案执行。
6.在火力发电设备中,汽轮机为重要设备,对汽轮机的维护保养需要及时,而汽轮机背压对汽轮机的影响尤为重要,而现在电厂中对背压的监测只能实时进行检测获取背压数据,背压一旦超出预期汽轮机可能已经受到损坏,如果能够提前预测汽轮机背压变化情况,在背压发生变化前停机检修,便能够避免汽轮机严重损伤。而现有技术中对汽轮机背压的
预测几乎没有相关技术。


技术实现要素:

7.为了解决现有技术中的不足,提供一种能够实现对汽轮机背压趋势预测的方法,本发明所采用的技术方案是:
8.一种基于catboost算法的汽轮机背压趋势预测方法,包括以下步骤:
9.s1、准备与背压相关的汽轮机历史运行数据;
10.s2、对上述历史运行数据进行预处理;
11.s3、将各预处理后的历史运行数据通过特征工程升维处理重新构造为多个特征;
12.s4、对重采样后的历史运行数据进行分析,筛选出与汽轮机背压关联度较大的变量;
13.s5、确定模型可调参数,可调参数包括损失函数、最大树数、学习率、正则参数、样本率,利用catboost进行建模,采用筛选后的历史运行数据通过模型预测未来某段时间内的背压。
14.s6、将线下训练好的模型进行部署,且开始定时任务训练模型,当训练好的模型与当前运行模型不一致时对运行模型进行替换。
15.进一步,步骤s1中与背压相关的汽轮机历史运行数据包括有:机组负荷、环境温度、风机功率、给水流量、冷段再热母管蒸汽压力、主汽门前蒸汽压力、汽轮机背压。
16.进一步,步骤s2的预处理包括缺失值、异常值、噪音、及归一化及重采样处理。
17.进一步,所述的缺失处理采用拉格朗日插值,异常值处理采用拉伊发达法则,噪声处理代用五点三次平滑滤波。
18.进一步,步骤s6中可调参数包括损失函数、最大树数、学习率、正则参数、样本率。
19.采用上述方法,能够实现对汽轮机背压进行预测,从而提前获知汽轮机背压趋势变化,为电厂运行人员提供参考,本发明方案简洁,可操作性强,计算机程序实现方便,且易于现场部署,可以有效的对汽轮机背压发展趋势进行预测,具有较大的推广和利用价值;
20.采用catboost算法进行建模相比于其它神经网络算法表现出更好的鲁棒性且具有较快的训练速度和预测速度,根据预测的背压趋势可以为电厂运行人员提供指导;
21.在模型预测时对预备的模型不断训练,能够及时替换预测不准的模型,提高预测精度和预测效率。
附图说明
22.图1为本发明中基于机器学习模型的汽轮机背压趋势预测方法的流程图。
23.图2为本发明中汽轮机背压趋势预测结构流程图。
24.图3为本发明中梯度决策树基本原理流程图。
25.图4为实施例某电厂600mw机组某时间背压趋势预测图。
具体实施方式
26.为了能够更好的理解本发明技术方案,下面对该技术方案做进一步详细的说明:
27.该预测方法是基于catboost算法对汽轮机背压趋势进行预测,参考图1包括以下
步骤:
28.s1、准备与背压相关的汽轮机的历史运行数据;这些历史运行数据包括机组负荷、环境温度、风机功率、给水流量、冷段再热母管蒸汽压力、主汽门前蒸汽压力、汽轮机背压等数据,全部由传感器实时采集的历史记录数据。
29.s2、对上述历史运行数据进行预处理;预处理包括缺失值、异常值、噪音以及归一化处理,通过预处理剔除数据中不具备参考价值的数值,对预处理后的数据进行重采样处理(在固定时间间隔下取出来的不同变量的历史数据,要进行插值把数据补齐即重采样,重采样时间间隔为1分钟),且保证处理后的数据至少大于6万条。
30.s3、将各预处理后的历史运行数据通过特征工程升维处理重新构造为多个特征。
31.例如:将各历史运行数据进行特征工程升维处理重新构造为5个特征,筛选的历史运行数据为s个,则趋势预测模型的输入变量为5
ꢀ×
s个。
32.s4、对重采样后的历史运行数据进行分析,筛选出与汽轮机背压关联度较大的变量。
33.s5、确定模型可调参数,可调参数包括损失函数、最大树数、学习率、正则参数、样本率,利用catboost进行建模。
34.采用筛选出升维处理后的数据预测未来某段时间内的背压。
35.以预测未来30分钟背压为例,假设筛选的辅助变量为{q1, q2,

,qs},重采样后的数据共计n条,则构造后的输入训练数据如图所示:
[0036][0037]
其中q11、q12、q13、q14、q15代表的是以辅助变量q1特征工程后的升维为5个特征的辅助变量,同理qs1、qs2、qs3、qs4、qs5 代表的是以辅助变量qs特征工程后的升维为5个特征的辅助变量。 q1-1、q1-2分别代表辅助变量q1的第一个数据、第二个数据其它以此类推。
[0038]
而背压历史运行数据通过特征工程升维处理重新构造为30个特征后的输出训练数据如图所示:
[0039][0040]
其中背压1、背压2、背压3

背压30代表的是以背压特征工程后的变量,同理qs1、qs2、qs3、qs4、qs5代表的是以辅助变量qs 特征工程后的辅助变量。背压-6、背压-7分别代
表背压的第六个数据、第七个数据其它以此类推。
[0041]
参考上面两组表格,当利用输入训练数据和背压1的数据作为模型的训练数据时,将得到未来第1分钟汽轮机背压预测模型,以此类推,分别得到未来第2

30分钟的汽轮机背压预测模型,例如需要得到未来30分钟的汽轮机背压预测模型,则输入训练模型和背压30的数据作为模型训练数据。
[0042]
s6、参考图2将线下训练好的模型进行部署,且开始定时任务训练模型,当训练好的模型与当前运行模型不一致时对运行模型进行替换。
[0043]
下面对数据选择、预处理以及数据筛方法选做进一步详细说明:
[0044]
选择的历史运行数据s={k1,k2,

,kn,b},其中k1,k2,
……
, kn,b为多维向量随时间的正向排序;
[0045]
处理异常值时首先计算数据的标准偏差σ,再按照统计理论将偏差大于3σ的数据剔除。
[0046]
处理数据噪音时公式如下:
[0047][0048][0049][0050][0051][0052]
式中:yk为当前需要处理的数据,y
k-1
、y
k-2
为当前数据前面的两个数据,y
k 1
、y
k 2
为当前数据前面的两个数据,该公式要求节点个数 k大于等于5个,当节点个数大于5时,待处理数据的两端分别用公式1,公式2,公式4,公式5外,其余待处理数据全部都使用公式3 进行数据处理,达到对称的目的。
[0053]
数据归一化处理公式如下:
[0054][0055]
式中:xn为归一化后的数据,x0为原始数据,x
max
为样本取值范围内的最大值,x
min
为样本取值范围内的最小值。
[0056]
在进行主成分分析时按以下步骤:
[0057]
对于利用偏最小二乘回归进行主成分分析,首先设定m个自变量 x1,x2,
……
xm以及p个因变量y1,y2,
……yp
,在自变量集中提取第一成分u1,同时在因变量集中也提取第一成分v1,然后建立因变量 y1,y2,
……yp
与u1的回归,如果拟合结果达到预期值,则终止该算法,否则继续提取第二成分,直到获得足够的精度为止。在提取这两个成分时,为了回归分析的需要,有如下两个要求:
[0058]
(1)从变量集中所提取的成分要尽可能大的携带各自集里的信息。
[0059]
(2)v1和u1的相关程度能达到最大。
[0060]
假设p个因变量y1,y2,
……yp
和m个自变量x1,x2,
……
xm均为标准化变量,并且自变量组合因变量组的n次标准化数据矩阵如下:
[0061][0062]
偏最小二乘回归分析的具体步骤如下:
[0063]
(1)分别提取两变量组的第一成分u1和v1,u1是自变量集 x=[x1,

,xm]
t
的线性组合:
[0064]
u1=α
11
x1

α
1m
xm=ρ
(1)t
x
[0065]
v1是自变量集y=[y1,

,y
p
]
t
的线性组合:
[0066]
v1=β
11
y1

β
1pyp
=γ
(1)ty[0067]
可以从两组变量的标准矩阵a和b中计算第一对成分的得分向量:
[0068][0069][0070]
可以根据第一对成分的得分向量的内积来计算u1和v1的协方差 cov(u1,v1),因此上述两个要求可转换为具有数学条件的极值问题:
[0071][0072][0073]
这个问题的解决办法只需利用拉格朗日乘数法,问题将被转化为求单位向量ρ
(1)
和γ
(1)
,使达到最大,从而通过计算m*m 矩阵m=a
t
bb
t
a的特征向量和特征值,且m的最大特征值为相应的单位特征向量就是所求的解ρ
(1)
,而γ
(1)
可由ρ
(1)
计算得到。
[0074][0075]
(2)构建y1,y2,
……yp
对u1的回归及x1,x2,
……
xm对u1的回归。假定回归模型为:
[0076][0077]
其中σ
(1)
=[σ
11
,


1m
]
t
,τ
(1)
=[τ
11
,


1p
]
t
分别是多对一的回归模型中的参数
向量,a1和b1是残差阵。回归系数向量σ
(1)
,τ
(1)
的最小二乘估计为:
[0078][0079]
(3)用残差阵a1和b1代替a和b重复以上步骤。如果矩阵b1中的元素绝对值接近于0,则认为用第一个成分建立的回归方程已满足需要,并可以停止提取成分。否则用矩阵a1和b1代替a和b重复以上的步骤得:
[0080]
ρ
(2)
=[α
21
,


2m
]
t
[0081]
γ
(2)
=[β
21
,


2p
]
t
[0082]
而为第二对成分的分向量为第二对成分的分向量分别为x,y的第二对成分的向量,这时有:
[0083][0084]
(4)设n*m数据阵a的秩为r,则存在r个成分u1,u2,
……
, ur,使得:
[0085][0086]
把uk=α
k1
x1

α
km
xm(k=1,2,
……
,r)代入y=u1τ
(1)


urτ
(r)
,即p个自变量的偏最小二乘回归方程式:
[0087]
yj=c
j1
x1

c
jm
xm[0088]
对于单个或多个自变量的回归建模,并不需要使用所有成分进行回归建模。到目前为止,在实际的分析及经验中可以知道第一个主要成分是最重要的,可以得到很多来自原始数据的信息。随着主成分数量的增加,成分的重要性依次减小。一般来说,偏最小二乘法并不需要选用存在的r个成分u1,u2,
……
,ur来建立回归式,但是和主成分分析一样,只选用前l个成分,即可得到预测能力较好的模型。对于建模所提取的成分个数l,可以通过交叉有效性检验来确定。每次舍去第i个观测数据,对余下的n-1个观测数据都通过偏最小二乘回归方法建模,并抽取h个成分后拟合的回归式,然后把舍去的自变量组的第i个观测数据代入所拟合的回归方程式,得到yj在第i个观测点上的预测值
[0089]
对于i=1,2,3
……
n重复以上的验证,即抽取h个成分时第j 个因变量yj的预测误差平方和为:
[0090][0091]
y=[y1,

,y
p
]
t
的预测误差平方和为:
[0092][0093]
此外在采用所有的样本点,拟合含h个成分的回归方程。这时,记第i个样本点的预测值为则可以定义yj的误差平方和为:
[0094][0095]
定义误差平方和为:
[0096][0097]
当press(h)达到最小值时,对应的h即为所求的成分个数l。通常,总有press(h)大于ss(h),而ss(h)则小于ss(h-1)。因此,在提取成分时,总希望比值press(h)/ss(h-1)越小越好,一般设置限定值为0.05
[26]
,即:
[0098]
press(h)/ss(h-1)≤(1-0.05)2=0.952[0099]
为此定义交叉有效性为:
[0100][0101]
通过这种方式,在每个建模步骤结束前,均进行交叉有效性检验,如果在第h步有则模型精度满足要求,并且可以停止提取成分。
[0102]
采用上述方法预测模型对汽轮机背压进行预测后,预测背压趋势变化与实际背压趋势变化对比如图4所示可以看出,背压预测的趋势基本和实际背压趋势吻合,完全能够达到预测背压的要求。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献