一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种跨风电机组的迁移故障诊断方法与流程

2022-02-22 06:33:09 来源:中国专利 TAG:


1.本发明涉及一种跨风电机组的迁移故障诊断方法,属于风电机组故障诊断技术领域。


背景技术:

2.随着“碳中和”战略的提出,清洁能源特别是风能在世界各地得到了广泛应用,促使风电机组的故障诊断和状态监测事业蓬勃发展。传统风电机组状态监测和诊断预测的深度学习模型默认接受的一个主要假设是:训练数据和测试数据服从相同的分布。但由于风力发电受到气候、环境、地理位置等多因素影响,且同一类型不同型号的风电机组拥有不同的控制策略,使得不同机组数据采集与监视控制(supervisory control and data acquisition,以下简称scada)系统所采集的监测数据存在复杂的分布差异。这就导致传统的诊断模型泛化能力极差,无法适应新的机组,漏报误报频发。此外,收集足够的带标样本数据困难,意味着重新学习新诊断模型代价高昂。
3.迁移学习为解决这些问题提供了一种新的工具,并在各个领域证明了其广泛的适用性。迁移学习框架注重利用源域的可迁移特征或知识来提高模型性能,减少目标领域所需样本的数量。目前较为新颖的方法是将深度学习与一种领域自适应算法相结合,在故障诊断领域取得了较大的突破。但不同的领域自适应方法对数据差异的侧重是不同的,包括概率分布适配、共享特征选择、子空间学习等方向。单一的度量准则对不同数据可迁移适配较弱,需要人为的选择最优的自适应度量准则,增加模型训练的代价。考虑将多种领域自适应方法集成在一个迁移框架之中,对多个度量准则进行加权处理,多准则联合对齐数据差异,提高故障诊断模型的泛化能力。


技术实现要素:

4.本发明的目的是提供一种跨风电机组的迁移故障诊断方法,解决由于风电机组受环境、地理、控制策略等多种因素影响,监测数据存在多方面复杂分布差异,造成传统故障诊断模型泛化能力差以及数据依赖性高的问题。
5.为了实现上述目的,本发明采用的技术方案是:
6.一种跨风电机组的迁移故障诊断方法,包括以下步骤:
7.步骤s1:利用风电机组自带的scada系统采集多组同风场同类型的风电机组scada数据,并进行数据预处理及数据打标;
8.步骤s2:将机组划分源域机组和目标域机组,源域机组scada数据和少量目标域机组scada数据作为训练集,其余的目标域scada数据按比例划分验证集和测试集;
9.步骤s3:针对风电机组scada数据设计深度卷积神经网络特征学习模块,进行特征的融合提取,得到不同机组scada数据的深层特征;
10.步骤s4:构建瓶颈层和分类层,用于集成多种领域自适应方法,多准则加权联合度量,对齐机组scada数据的差异,并将计算得到的多种迁移损失加权作为联合正则项参与神
经网络的反向传播过程,提高对不同机组scada数据的泛化能力;
11.步骤s5:将步骤4中分布对齐后的特征输入到分类层中,输出得到目标域风电机组scada数据的故障类型。
12.本发明技术方案的进一步改进在于:所述步骤s1的具体步骤为:
13.步骤s11、scada数据包含v个变量、s个单点样本,标注每个样本的故障类型(0/1标签),对数据进行最大最小值归一化处理,计算公式如下:
[0014][0015]
其中y
ij
是标准化处理后的多变量时间序列中变量j的第i个值,x
ij
是原始多变量时间序列中变量j的第i个值,min(xj)和max(xj)分别是变量j的最小值和最大值;
[0016]
步骤s12、将步骤s11处理后的数据分批进行加载以供后续建模使用,最终得到的数据大小为:
[0017]m×1×
v,m表示batch的大小,v表示变量数。
[0018]
本发明技术方案的进一步改进在于:所述步骤s2包括如下具体步骤:
[0019]
步骤s21、将机组划分目标域机组和源域机组,构建跨机组的场景,利用源域scada数据和少量目标域scada数据训练高泛化能力的模型;
[0020]
步骤s22、将目标域scada数据按2:1:7的比例随机拆分为目标域训练集、目标域验证集和目标域测试集。
[0021]
本发明技术方案的进一步改进在于:所述步骤s3包括如下具体步骤:
[0022]
步骤s31、针对scada数据设计深度卷积网络特征学习模块,卷积层选取relu激活函数,并内置dropout层和批标准化层以提高模型的训练效果,从而获得信号的空间特征;深度卷积神经网络共有2个卷积层和1个线性层,卷积层的卷积核大小为1
×
f,数量为n;
[0023]
步骤s32、设计全连接层,输出scada数据的深层特征,并返回输出节点数;卷积模块和全连接层共同构成迁移框架的基础网络。
[0024]
本发明技术方案的进一步改进在于:所述步骤s4包括如下具体步骤:
[0025]
步骤s41、搭建瓶颈层;瓶颈层包括线性层、批标准化层、relu激活以及dropout层;
[0026]
步骤s42、设计迁移学习领域自适应框架;设计集成领域自适应中常用的三种距离度量:考虑数据边缘分布的最大均值差异mmd、考虑数据边缘分布和条件分布的联合最大均值差异jmmd以及综合考虑均值和方差对齐源域和目标域二阶统计量的coral关联对齐法。
[0027]
步骤s43、多准则加权联合度量;集成mmd、jmmd和coral三种准则加权联合度量,将瓶颈层输出的数据特征进行数据分布自适应对齐,减小机组数据间多方面的分布差异;训练过程中实时输出三种距离度量值的加权和,返回网络框架的联合迁移损失,最终的优化函数如下:
[0028][0029]
其中,表示联合迁移损失,表示mmd损失,表示jmmd损失,表示coral损失;σ1、σ2、σ3分别是三种距离度量的加权参数,通过设计程序随模型迭代训练自动更新优化;w表示深度训练的权重参数。
[0030]
本发明技术方案的进一步改进在于:所述步骤s5包括如下具体步骤:
[0031]
步骤s51、设计分类层,输出跨机组故障诊断结果,计算交叉熵损失;分类层包括两个线性层以及内置的relu激活函数和dropout层,前一个线性层用于连接瓶颈层,输入经过对齐后的特征,末端的线性层用于输出目标域的分类结果,返回交叉熵损失;
[0032]
步骤s52、交叉熵损失在联合迁移损失正则项的约束下,作为最终目标函数共同参与网络的反向传播,通过训练的迭代优化跨机组迁移框架的性能,目标函数表达式如下:
[0033][0034]
其中,表示最终目标函数,表示交叉熵损失,表示联合迁移损失,λ是联合迁移正则项系数,作为超参数进行手动调节;σ1、σ2、σ3分别是三种距离度量的加权参数,w表示深度训练的权重参数。
[0035]
由于采用了上述技术方案,本发明取得的技术效果有:
[0036]
本发明针对风电机组因环境、地理位置、控制策略等多因素影响使得监测数据存在多方面复杂分布差异,导致传统故障诊断模型无法广泛适用的问题,制定多准则加权联合对齐策略,设计集成式深度自适应迁移诊断框架,减小跨机组数据分布异构,提高风机故障诊断模型对新的目标机组的泛化能力,有效减小模型训练的代价以及对工业打标数据的依赖性。
[0037]
本发明能够多准则加权联合度量,自适应减小机组间数据多元分布异构,提高模型对不同风机数据的泛化能力以及在新目标机组的故障诊断精度。
附图说明
[0038]
图1是本发明诊断流程示意图;
[0039]
图2是本发明数据集划分示意图;
[0040]
图3是本发明卷积网络特征提取示意图;
[0041]
图4是本发明领域自适应集成结构示意图。
具体实施方式
[0042]
下面结合附图及具体实施例对本发明做进一步详细说明:
[0043]
一种跨风电机组的迁移故障诊断方法,如图1所示,包括以下步骤:
[0044]
步骤s1:利用风电机组自带的scada系统采集多组同风场同类型风机的scada数据,进行数据预处理及数据打标,具体方法如下:
[0045]
步骤s11、scada数据包含v个变量、s个单点样本,标注每个样本的故障类型(0/1标签),对数据进行最大最小值归一化处理,计算公式如下:
[0046][0047]
其中y
ij
是标准化处理后的多变量时间序列中变量j的第i个值,x
ij
是原始多变量时间序列中变量j的第i个值,min(xj)和max(xj)分别是变量j的最小值和最大值。
[0048]
步骤s12、将步骤s11处理后的数据分批进行加载以供后续建模使用,最终得到的数据大小为:
[0049]m×1×
v,m表示batch的大小,v表示变量数。
[0050]
步骤s2:如图2所示,按机组划分源域机组和目标域机组,源域机组数据和少量目标域机组数据作为训练集,其余的目标域数据按比例划分验证集和测试集,具体包括以下步骤:
[0051]
步骤s21、按照机组划分目标域机组和源域机组,构建跨机组的场景。目标是利用源域数据和少量目标域数据训练高泛化能力的模型,可以直接用于目标域机组的故障诊断。
[0052]
步骤s22、根据迁移学习的思想及要求划分数据集。将目标域数据按2:1:7的比例随机拆分为目标域训练集、目标域验证集和目标域测试集。源域数据和目标域训练集共同作为迁移学习框架的训练集数据进行模型的训练。目标域验证集和目标域测试集分别用于选择最优模型以及模型在目标机组上的验证。
[0053]
步骤s3:如图3所示,针对风电机组scada数据设计深度卷积神经网络特征学习模块,进行特征的融合提取,得到不同机组数据的深层特征,具体包括以下步骤:
[0054]
步骤s31、针对scada数据设计深度卷积网络特征学习模块,卷积层选取relu激活函数,并内置dropout层和批标准化层以提高模型的训练效果,从而获得信号的空间特征;深度卷积神经网络共有2个卷积层和1个线性层,卷积层的卷积核大小为1
×
f,数量为n;
[0055]
步骤s32、设计全连接层,输出scada数据的深层特征,并返回输出节点数。卷积模块和全连接层共同构成迁移框架的基础网络。
[0056]
步骤s4:如图4所示,构建瓶颈层和分类层,用于集成多种领域自适应方法,多准则加权联合度量,对齐跨机组数据的差异,具体包括以下步骤:
[0057]
步骤s41、搭建瓶颈层。瓶颈层包括线性层、批标准化层、relu激活以及dropout层。瓶颈层可以将源域和目标域机组数据的高维特征降维,使跨机组数据特征嵌入同空间,方便进行距离计算。
[0058]
步骤s42、设计迁移学习领域自适应框架。设计集成领域自适应中常用的三种距离度量:考虑数据边缘分布的最大均值差异(maximum mean discrepancy,mmd)、考虑数据边缘分布和条件分布的联合最大均值差异(joint maximum mean discrepancy,jmmd)以及综合考虑均值和方差对齐源域和目标域二阶统计量的(correlation alignment,coral)关联对齐法。
[0059]
步骤s43、多准则加权联合度量。集成mmd、jmmd和coral三种准则加权联合度量,将瓶颈层输出的数据特征进行数据分布自适应对齐,减小机组数据间多方面的分布差异。训练过程中实时输出三种距离度量值的加权和,返回网络框架的联合迁移损失,最终的优化函数如下:
[0060][0061]
其中,表示联合迁移损失,表示mmd损失,表示jmmd损失,表示coral损失;σ1、σ2、σ3分别是三种距离度量的加权参数,通过设计程序随模型迭
代训练自动更新优化;w表示深度训练的权重参数。
[0062]
步骤s5:将步骤4中分布对齐的特征输入到分类层中,输出得到目标域风电机组数据的故障类型,具体步骤如下:
[0063]
步骤s51、设计分类层,输出跨机组故障诊断结果,计算交叉熵损失。分类层包括两个线性层以及内置的relu激活函数和dropout层。前一个线性层用于连接瓶颈层,输入经过对齐后的特征,末端的线性层用于输出目标域的分类结果,返回模型的交叉熵损失。
[0064]
步骤s52、交叉熵损失在联合迁移损失正则项的约束下,作为最终目标函数共同参与网络的反向传播,通过训练的迭代优化跨机组迁移框架的性能,目标函数表达式如下:
[0065][0066]
其中,表示最终目标函数,表示交叉熵损失,表示联合迁移损失,λ是联合迁移正则项系数,作为超参数进行手动调节;σ1、σ2、σ3分别是三种距离度量的加权参数,w表示深度训练的权重参数。
[0067]
从以上分析可以看出本实例提出一种跨风电机组的迁移故障诊断方法,针对scada数据设计深度卷积网络空间特征提取模块,充分提取深度时空特征。针对风电机组因环境、地理位置、控制策略等多因素影响,使得监测数据存在多方面复杂分布差异,导致传统故障诊断模型无法广泛适用的问题,制定多准则加权联合对齐策略,设计集成式深度自适应迁移诊断框架,减小跨机组数据分布异构,提高风机故障诊断模型对新的目标机组的泛化能力,有效减小模型训练的代价以及对工业打标数据的依赖性。
[0068]
原理及过程:
[0069]
本发明是基于迁移学习领域自适应的思想,利用源域机组数据和少量目标域机组数据训练具有强泛化能力的故障诊断模型来诊断新的目标机组故障,减小模型训练代价和对目标机组数据的依赖性。首先利用风电机组scada系统采集多组同风场同类型(双馈式或直驱式)的机组多变量时间序列数据,按机组划分源域机组和目标域机组,并进行数据打标及预处理;其次利用源域机组数据和少量目标域机组数据,设计深度卷积神经网络特征提取模块进行scada数据特征提取;基于多种距离度量准则设计集成式的领域自适应框架,多准则加权联合对齐源域机组和目标域机组的特征级差异;通过最小化交叉熵损失和联合迁移损失训练深度卷积网络模型,实现跨风电机组的迁移学习故障诊断。本发明能够多准则加权联合度量,自适应减小机组间数据多元分布异构,提高模型对不同风机数据的泛化能力以及在新目标机组的故障诊断精度。
[0070]
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献