基于数据增强和胶囊神经网络的风机故障可迁移诊断方法

2022-07-17 00:17:49 来源：中国专利 TAG：

1.本发明涉及风力发电技术领域及故障诊断技术领域，具体是涉及一种基于数据增强和胶囊神经网络的风机故障可迁移诊断方法。

背景技术：

2.近年来，世界各国都在通过对可再生能源的支持和投资来应对气候变化和化石能源的濒临枯竭，其中风力发电因为其天然可再生，对环境无污染的特点而受到了极大关注。随着风力发电机数量的持续增长，风力发电机的运行和维护成本越来越高，于是人们开始将注意力转移到开发风机状态监测和预防性维护技术上来。
3.现有的风力发电机故障诊断方法可以大致分为两类：基于数学模型的传统机器学习方法和数据驱动的深度学习网络方法。前者在构建数学模型解决问题时需要掌握大量的风力发电机有关的先验知识，入门门槛高，且由于新采集的数据可能不遵循与模型训练数据相同的分布，因此无法保证所学习模型的泛化能力。后者的深度神经网络具有学习复杂非线性函数的优越能力，并且随着可支持训练数据量的增长，其性能(在精度方面)优于传统的学习模型。虽然第二种方法对人类专业知识的要求不高，但它需要大量的工业现场数据作为支撑。此外，由于风力发电机往往安装在气候恶劣、地势险峻的位置，风能公司无法经常派相关人员前往巡检风机运行状况，只能定期巡检记录关键部件的运行状态，因此只能提供发现故障的日期，而不是故障开始的日期，从而导致故障数据有限。

技术实现要素：

4.针对现有技术的不足，本发明公开一种基于数据增强和胶囊神经网络的风机故障可迁移诊断方法，具体技术方案如下：一种基于数据增强和胶囊神经网络的风机故障可迁移诊断方法，该方法包括如下步骤：s1：对采集到的风机振动信号数据进行预处理，检测并剔除异常值；s2：等距划分信号频带，计算每个风机振动信号样本在子频带上的平均功率谱密度强度值并绘制出时序曲线，选取方差最大的时序曲线所对应的频带为故障最佳特征频率带；s3：计算每个风机振动信号样本在故障最佳特征频率带上的平均功率谱密度强度值，并将其作为训练后的一类支持向量机的输入进行故障退化检测，从而确定故障初始失效发生点；s4：将s1剔除异常值后的风机振动信号根据故障初始失效发生点重新划分为故障数据和正常数据，并打上标签，构建训练数据集；s5：初始化胶囊神经网络的网络超参数，将训练数据集中的一维的振动信号转换为二维信号输入到胶囊神经网络中并进行训练；s6：将目标风机的振动信号数据输入训练好的胶囊神经网络，即可获得诊断结果。
5.进一步地，所述s1中的异常值剔除过程为：根据拉依达准则对采集到的振动信号数据中存在的异常值进行检测和剔除，拉依达准则的公式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中，x
t
为第t个风机振动信号，代表该段振动信号的平均值，是该段信号的标准差，n表示该段信号内的采样点总数；当数据满足拉依达准则时，该数据会被当作异常值直接删除。
6.进一步地，所述s2包括以下步骤：s21，对每个振动信号数据求功率谱密度，将时域信号转换到频域上；s22，等距划分振动信号整个频率带，得到若干个子频带；s23，根据下述公式计算每个振动信号在对应子频带上的平均功率谱密度强度值，并按照时间顺序绘制一维时序曲线；
ꢀꢀ
(2)其中f
khb
和f
klb
分别表示第k个子频带的上限频率值和下限频率值；psd(f)表示频率f对应的功率谱密度值；s24，计算各子频带对应的平均功率谱密度强度曲线的方差值，选取方差最大的子频带作为故障最佳特征频率带。
7.进一步地，所述的s3包括以下步骤：s31，构建训练集：将每个振动信号在故障最佳特征频率带上计算得到的平均功率谱密度强度值以及衡量信号本身分布陡缓程度的峭度值作为一类支持向量机模型的输入，训练集包括健康数据和少量故障数据；s32，一类支持向量机模型的目标函数和约束条件如下：
ꢀꢀ
(3)
ꢀꢀ
(4)其中，f表示输入特征空间；ω和ρ分别代表超平面的权重向量以及偏置量；ξi是非零的松弛变量；φ(.)代表核函数；xi表示一类支持向量机模型的第i个输入；v为训练集中异常值存在的比例值的上限，v∈(0,1)；通过求解上述优化问题，得到决定超平面的ω和ρ，最终的分类器表达式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中x
΄
表示待分类的振动信号；sgn(x)表示符号函数，当x》0时输出1，反之输出0；
s33，使用训练好的一类支持向量机模型来判断振动数据是故障还是健康，如果输出为0，表示该数据为故障数据，否则为健康数据，以此来确定故障初始失效发生点。
8.进一步地，所述s4根据故障初始失效发生点将s1剔除异常值后的风机振动信号重新划分成健康数据和故障数据，并通过下采样的方式平衡两个类别的数据；将相同量级的故障数据和健康数据打包成数据集，并对数据集内的数据进行打乱操作。
9.进一步地，所述s5中的胶囊神经网络包含三个部分：卷积层、初始胶囊层和故障胶囊层；在卷积层中，一维的振动数据信号被处理成二维数据作为输入，大小为32
×
32，采用的卷积核大小为3
×
3，深度为10，步长为1，同时使用relu激活函数；在初始胶囊层中，采用大小为3
×
3、深度为20、步长为1的卷积核，对得到的特征图进行展平，得到16个20维向量的初级胶囊；故障胶囊层中的输出胶囊个数为2，维度为10，由初始胶囊层的胶囊向量通过动态路由算法以及非线性激活函数得到。
10.进一步地，所述的动态路由算法过程如下：s51，每个初级胶囊乘以一个独立的权重矩阵来预测每个故障胶囊，计算公式如下；
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中ui为第i个初级胶囊，w
ij
为权值矩阵，表示输入为ui时的预测向量；s52，将每个预测向量和对应的耦合系数h
ij
相乘后求和得到故障胶囊层的输入，计算公式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)其中耦合系数h
ij
满足，由softmax函数求出，如下式所示：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)其中b
ij
是先验概率的对数表示，初始值为0；s53，将故障胶囊层的输入qj通过非线性激活函数squashing得到故障胶囊层的输出，计算公式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)其中fs为非线性函数，确保向量方向不变的情况下将向量长度压缩到0到1之间；s54，通过测量输出向量与预测向量的一致性，并借助该测量的一致性迭代地更新耦合系数，计算公式如公式（10）；然后返回步骤s52进行下一次迭代，经过r次迭代过后获得故障胶囊层的最终输出
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)本发明的有益效果如下：
（1）本发明通过频域特征提取、时域信号重组的方式挖掘了故障特征，并确定了故障初始失效点，有效扩充了故障样本数量，平衡了训练数据样本类别。
11.（2）相比于传统神经网络中输出标量的神经元，本发明引入了输出向量的胶囊结构，可以提取多维特征和更丰富的空间信息，从而能够在更少数据的情况下获得较好的故障诊断性能。
12.（3）本发明相比于传统深度神经网络避开了繁杂的卷积计算以及网络优化，简化了计算过程，可以实现风机实时状态监测；此外训练好的网络可以迁移到另一台具有相同故障模式的风机数据集上，提高了模型的通用性。
附图说明
13.图1为本发明实施例的整体流程图。
14.图2为胶囊神经网络结构示意图。
15.图3为动态路由算法示意图。
具体实施方式
16.下面根据附图和优选实施例详细描述本发明，本发明的目的和效果将变得更加明白，应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
17.本发明的基于数据增强和胶囊神经网络的风机故障可迁移诊断方法，具体流程图如图1所示，具体包括如下步骤：s1：对采集到的风机振动信号数据进行预处理，依据拉依达准则检测并剔除振动信号数据中的异常值。
18.拉依达准则的公式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中，x
t
为第t个风机振动信号，代表该段振动信号的平均值，是该段信号的标准差，n表示该段信号内的采样点总数；当数据满足拉依达准则时，该数据会被当作异常值直接删除。
19.s2：通过matlab里的pwelch函数计算每个风机振动信号样本的功率谱密度，将时域信号转换到频域上；等距划分振动信号整个频率带，得到若干个子频带；根据平均功率谱密度强度计算公式计算每个子频带上的强度值并按照时间顺序绘制出一维时序曲线；计算每个子频带对应平均功率谱密度强度曲线的方差值，选择方差最大的曲线所对应的频带为故障最佳特征频率带。平均功率谱密度强度计算公式如下：
ꢀꢀ
(2)其中f
khb
和f
klb
分别表示第k个子频带的上限频率值和下限频率值；psd(f)表示频
率f对应的功率谱密度值。
20.s3：计算每个风机振动信号样本在故障最佳特征频率带上的平均功率谱密度强度值，并将其作为一类支持向量机的输入进行故障退化检测，从而确定故障初始失效发生点。
21.将每个振动信号在故障最佳特征频率带上计算得到的平均功率谱密度强度值以及衡量信号本身分布陡缓程度的峭度值作为一类支持向量机模型的输入，训练集由健康数据和少量故障数据组成，比例为100：1。
22.一类支持向量机模型的目标函数和约束条件如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中，f表示输入特征空间；ω和ρ分别代表超平面的权重向量以及偏置量；ξi是非零的松弛变量；φ(.)代表核函数；xi表示一类支持向量机模型的第i个输入；v为训练集中异常值存在的比例值的上限，v∈(0,1)；通过求解上述优化问题，得到决定超平面的ω和ρ，最终的分类器表达式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中x
΄
表示待分类的振动信号；sgn(x)表示符号函数，当x》0时输出1，反之输出0；使用训练好的一类支持向量机模型来判断振动数据是故障还是健康，如果输出为0，表示该数据为故障数据，否则为健康数据，以此来确定故障初始失效时间点。
23.s4：将s1剔除异常值后的风机振动信号根据故障初始失效发生点重新划分为故障数据和正常数据，并打上标签，构建训练数据集。
24.根据故障初始失效发生点将s1剔除异常值后的风机振动信号重新划分成健康数据和故障数据，打上对应的标签，并通过下采样的方式平衡两个类别的数据；将相同量级的故障数据和健康数据打包成数据集，并对数据集内的数据进行打乱操作。
25.s5：初始化胶囊神经网络的网络超参数，将一维的振动信号转换为二维信号输入到胶囊神经网络中并进行训练。
26.如图2所示，胶囊神经网络包含三个部分：卷积层、初始胶囊层和故障胶囊层；在卷积层中，一维的振动数据信号被处理成二维数据作为输入，大小为32
×
32，采用的卷积核大小为3
×
3，深度为10，步长为1，同时使用relu激活函数；在初始胶囊层中，采用大小为3
×
3，深度为20，步长为1的卷积核，对得到的特征图进行展平，得到16个20维向量的初级胶囊；在故障胶囊层中，由于是二分类问题，即只需要区分故障和健康两种状态，所以该层输出胶囊个数为2，维度为10，由初始胶囊层的胶囊向量通过动态路由算法以及非线性激活函数得到。
27.动态路由算法过程如图3所示，具体步骤如下：s51，每个初级胶囊乘以一个独立的权重矩阵来预测每个故障胶囊，计算公式如下；
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中ui为第i个初级胶囊，w
ij
为权值矩阵，表示输入为ui时的预测向量。
28.s52，将每个预测向量和对应的耦合系数h
ij
相乘后求和得到故障胶囊层的输入，计算公式：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)其中耦合系数h
ij
满足，由softmax函数求出，如下式所示：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)其中b
ij
是先验概率的对数表示，初始值为0。
29.s53，将故障胶囊层的输入qj通过非线性激活函数squashing得到故障胶囊层的输出，计算公式如下：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)其中fs为非线性函数，确保向量方向不变的情况下将向量长度压缩到0到1之间。
30.s54，通过测量输出向量与预测向量的一致性，并借助该测量的一致性迭代地更新耦合系数，计算公式如公式（10）；然后返回步骤s52进行下一次迭代，经过r次迭代过后获得故障胶囊层的最终输出。
31.ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)s6：将目标风机的振动数据信号输入训练好的胶囊神经网络，即可获得诊断结果。
32.为了验证本发明的优越性，将本发明的方法和现有的svm、lstm、cnn等其他常用机器学习方法进行故障诊断性能的对比。数据集由两台风力发电机的数据混合而成，由于两台风机的故障模式不同，混合数据包含三种不同的运行状况状态，即健康样本、故障类型i样本（齿轮箱前箱体卡死）和故障类型ii样本（齿轮箱高速轴轴承损坏和行星级齿轮损坏）。数据表1记录了上述所有方法的故障诊断结果，可以看出，本发明的方法在准确率和评分方面始终优于其他所有机器学习模型。此外为了证明本发明的可迁移性，采用了两个具有相同故障模式的风机数据集，其中一个数据集用来训练，另一个数据集用于测试。对比模型选用了lstm方法，数据表2记录了两者的故障诊断结果，可以看出，本发明的方法可以直接迁移到另外一台具有相同故障模式的风机数据集上，而不用重新训练模型。
33.表1 不同机器学习方法诊断结果对比
表2 不同机器学习方法诊断结果对比本领域普通技术人员可以理解，以上所述仅为发明的优选实例而已，并不用于限制发明，尽管参照前述实例对发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实例记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在发明的精神和原则之内，所做的修改、等同替换等均应包含在发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于额外成本的流量质量的度量方法与流程

基于数据增强和胶囊神经网络的风机故障可迁移诊断方法

相关文献

最热文献