一种基于TimeGAN数据增强和MSGNet的引风机运行状态智能监测方法
- 国知局
- 2024-07-30 14:31:01
本发明涉及火电机组引风机智能运维,具体来讲涉及一种基于timegan数据增强和msgnet的引风机运行状态智能监测方法。
背景技术:
1、引风机是火电机组生产运行中不可缺少的设备之一。引风机通过排出锅炉内燃烧后的废气,使得锅炉炉膛内的压力保持在合理区间内。锅炉是否能够正常运行很大程度上依赖于引风机的工作状态。在火电机组的实际生产过程中,引风机所输送的气体温度高且含有较多杂质导致其摩擦腐蚀严重。此外引风机工作时间长且和很多电气设备相连或集成。因此,引风机是火电机组风机系统中最容易发生故障的设备之一。引风机发生故障会影响电力生产,致使火电机组发电量减少,耗能增多;同时可能会引发其他设备出现故障,甚至影响现场人员的生命安全。因此,对引风机运行状态进行实时监测十分重要。
2、状态监测就是通过各种分析与监测方法,通过与正常运行状态下的各个参数数值进行对比,从而评价设备的运行状态是否正常。在之前的研究中,传统的机器学习和统计方法已被广泛应用于设备的状态监测中。但是传统的机器学习和统计方法在处理海量数据时,由于预测精度低和收敛速度慢而受到限制,并且由于数据之间的结构很复杂,传统的机器学习和统计方法很难有效地挖掘这些数据特征。近年来,深度学习技术在状态监测领域得到了广泛的应用和研究。深度学习方法采用反向传播算法,自适应地优化具有强大非线性表示能力的模型参数以构建设备的状态监测模型。基于深度学习的状态监测方法在众多工业应用领域中取得了较大的成功。
技术实现思路
1、本发明的目的是提供一种基于timegan数据增强和msgnet的引风机运行状态智能监测方法,可以在运行数据分布不均或欠缺的情况下对引风机进行更为准确的状态监测,实现引风机的运行状态的智能监测。首先,根据引风机各状态变量的运行数据,对获取的数据进行预处理并进行标准化处理,将标准化处理后的数据作为timegan网络的输入,实现运行数据的数据增强。其次,将数据增强后的数据集作为msgnet网络的输入,构建引风机的状态监测模型。最后,基于jrd距离构建引风机健康度指标,通过计算模型输出值和运行数据真实值之间的jrd距离得到引风机的实时健康度并在健康度低于设定阈值时对引风机进行预警,以此实现某火电机组引风机的运行状态智能监测。
2、本发明的目的是提供一种基于timegan数据增强和msgnet的引风机运行状态智能监测方法,具体按照以下步骤实施:
3、获取某火电机组引风机的实时运行数据。
4、对运行数据的缺失值和异常值进行预处理。
5、对运行数据中不同数量级的状态变量进行最大最小标准化,公式如下:
6、
7、其中,i为运行数据中的一个状态变量或一列。xmin和xmax为状态变量i所有值的最小值和最大值。
8、采用滑动窗口将标准化后的运行数据重新划分作为输入。
9、采用timegan网络对原始数据集进行数据增强,扩充原始数据集以缓解原始数据的分布不均。
10、timegan主要由自编码器和生成对抗网络中的嵌入网络、复现网络、生成器和判别器四个部分组成。
11、假设引风机的静态特征和时间特征为s和x,一组(s,x1:t)具有某种特征的联合分布p,t为其时间序列长度。
12、嵌入函数定义为:
13、
14、其中,es和ex分别为静态特征和时间特征的嵌入网络。hs和ht为静态特征和时间特征对应的潜在空间。
15、复现函数将静态特征和时间特征重建为和定义为:
16、
17、其中,γs和γx分别为静态特征和时间特征的复现网络。
18、生成函数定义为:
19、
20、其中,gs和gx分别为静态特征和时间特征的生成网络。和为经过生成器后的静态特征和时间特征。
21、判别函数定义为:
22、
23、其中,和为静态特征和时间特征对应的判别结果。和分别为前向和后向隐藏状态的序列。和为递归函数,ds和dx为输出层函数。
24、因此,在网络的整体训练中,首先,运用数据重构损失实现自编码器编码解码的优化,生成更高效的数据低维潜在表征,其重构损失为:
25、
26、其次,引入真实多元数据作为生成器的监督项,通过定义生成器与真实数据之间的有监督损失,评价生成器对体现时序相关性的潜在表征和真实数据特征的学习能力,其有监督损失为:
27、
28、最后,定义无监督gan的对抗损失,实现对生成器的反馈,其对抗损失为:
29、
30、其中,ys,yt和分别为静态和时间特征原始数据和生成数据间的判别结果。
31、模型在各网络联合训练实现三大误差最小的基础上,完成对嵌入空间下序列相关性的学习,从而生成符合真实时序分布的引风机运行数据对原始数据集进行扩充。
32、采用msgnet网络构建引风机的状态监测模型。msgnet网络主要由一个嵌入层和几个scalegraph块组成,并通过残差连接的方式连接各scalegraph块。
33、首先,同样采用最大最小归一化对长度为l的输入xt-l:t进行归一化处理得到然后,采用一维卷积层将投影到dmodel维矩阵中;最后,加上输入xt-l:t的位置嵌入(pe)和全局时间戳嵌入(se)得到最终的嵌入向量xemb,公式如下所示:
34、
35、其中,α为平衡因子,用于调整标量和局部/全局嵌入之间的大小。为输入的位置嵌入。为一种有限大小(大小为p)的科学系全局时间戳嵌入。
36、将嵌入层的输出xemb作为scalegraph块的输入。msgnet中第l层的输入为则残差连接的公式如下:
37、xl=scalegraphblock(xl-1)+xl-1
38、其中,scalegraphblock表示构成msgnet核心功能的操作和计算模块。xl-1为第l-1个scalegraphblock模块的输出,xl为第l个scalegraphblock模块的输出。
39、msgnet中的每个scalegraph块均包含四个部分:用于多尺度数据识别的fft模块、用于时间尺度上序列间相关性学习的多尺度自适应图卷积模块、用于捕捉序列内相关性的多头注意力模块和用于自适应地聚合来自不同尺度表示的softmax函数。
40、fft模块的公式如下:
41、f=avg(amp(fft(xemb)))
42、
43、其中,fft(·)和amp(·)分别表示fft和振幅值的计算。向量表示每个频率的计算振幅,并通过函数avg(·)在模型维度上对其进行平均。argtopk(·)用于选取f中最大元素的索引。si为所选取的不同时间尺度。
44、多尺度自适应图卷积模块的公式如下:
45、
46、其中,为张量xi经过线性变化后的投影。为xi对应的一个可学习的权重矩阵。为图学习过程的两个可训练的参数。ai为所获得的自适应邻接矩阵。表示在尺度i下融合后的输出。σ(·)为激活函数。超参数p是一组整数邻接幂的集合。(ai)j表示学习的临界矩阵ai乘以自身的j倍。||表示列级连接,用于连接每次迭代期间生成的中间变量。
47、利用多层感知机将投影回3d张量
48、多头注意力模块用于捕捉序列内的相关性。对于每个时间尺度张量,在张量的时间维度上应用多头注意力,公式如下:
49、
50、其中,mha(·)为多头注意力函数,可将大小为b×dmodel×si×fi的输入张量重塑为大小bfi×dmodel×si(b为批量大小)。
51、为了过度到下一个scalegraph层,需要根据它们的振幅将k个不同尺度的张量进行积分,公式如下所示:
52、
53、其中,为使用fft计算的每个标度相对应的振幅。
54、最后,msgnet网络利用时间和空间维度上的线性投影将转换为公式如下:
55、
56、其中,和为可学习的参数。n为变量的数量,l为输入序列的长度,t为预测的范围。
57、根据专家经验选取关键状态变量作为模型的输出,构建多入多出的msgnet网络拓扑结构。
58、通过迭代训练得到使平均绝对误差最小的模型作为最终的引风机状态监测模型。
59、基于rényi散度的jrd距离是反映设备被监测状态变量的实际值与模型输出值之间分布相似性的一种度量单位。jrd距离越大说明其真实值与模型输出值的分布差异越大。
60、rényi熵的公式如下:
61、
62、其中,rα为在离散概率分布p={p1,p2,…,pn}上计算出的α阶rényi熵;α为熵指数,它管理rα对概率分布p的响应性。
63、假设引风机真实的状态变量分布为p,模型输出的状态变量分布为p',则两者的rényi散度表示为:
64、
65、jrd距离为:
66、
67、其中,为pi和p'i的平均概率。
68、基于jrd距离构造引风机的健康度指标(hd)如下:
69、
70、其中,b为超参数,可用于设定健康度的敏感程度。
71、采用基于rényi散度的jrd距离构建引风机健康度,通过将状态监测模型输出值与运行数据真实值间的jrd距离带入健康度中,计算出引风机的健康度,实现引风机的运行状态智能监测。
72、其中健康度hd越大表示设备越健康;当hd低于所设定的阈值时,判断引风机状态异常并对其进行预警。
本文地址:https://www.jishuxx.com/zhuanli/20240729/167146.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。