一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于动态可分离卷积神经网络的故障诊断方法及设备与流程

2022-11-23 22:05:22 来源:中国专利 TAG:


1.本发明涉及机械故障诊断技术领域,尤其是一种基于动态可分离卷积神经网络的故障诊断方法及设备。


背景技术:

2.滚动轴承作为旋转设备重要部件,经常处于高负荷,强噪声环境中运行,如果缺乏必要的监管与维护,则有可能造成轴承失效,设备停运,带来较大经济损失,因此在滚动轴承早期进行故障诊断是非常重要的。
3.传统的故障诊断技术主要基于信号处理的方法,比如快速傅里叶变换(fast fourier transform,fft)、短时傅里叶变换(short-time fourier transform,stft)、小波变换等;近些年随着机器学习的发展,常用信号处理方法提取特征,然后送入特定的分类器模型进行分类,比如支持向量机(svm)、人工神经网络等。但是此类方法往往依赖人工手段提取特征以及专家经验,并且往往是浅层学习,缺乏大规模数据处理的能力。为了摆脱人工提取手段对于结果的影响,端到端的深度学习算法开始在滚动轴承故障诊断中发挥作用。如卷积神经网络、深度置信网络等等,但其在轴承实际运行的强噪声环境下对特征的辨识性差,难以充分挖掘数据故障信息,造成诊断性能下降。


技术实现要素:

4.针对现有技术的不足,本发明提供一种基于动态可分离卷积神经网络的故障诊断方法及设备,目的是提高在强噪声环境下对特征的辨识性,以提高轴承故障诊断性能。
5.本发明采用的技术方案如下:
6.一种基于动态可分离卷积神经网络的故障诊断方法,对采集到的轴承振动信号以故障类型进行分类标注,生成数据样本,并划分训练集、验证集和测试集;将训练集和验证集输入卷积神经网络中进行训练,形成振动数据和故障标签的恒等映射,保存对应的网络参数;将测试集输入训练好的模型中进行网络测试;将实际振动信号输入训练并测试好的卷积神经网络进行故障预测,所述卷积神经网络能够进行多时间尺度特征信息提取,并通过计算注意力的概率分布对关键性输入特征分配更多的权重,实现对数据中的固有时间特征信息的准确提取,获得对应的故障诊断结果。
7.所述卷积神经网络的结构包括一维卷积层、特征提取模块、最大池化层、全局平均池化层和softmax分类器;
8.所述特征提取模块所述特征提取模块包括多尺度分支动态可分离卷积、通道卷积注意力模块、全连接层和残差模块,所述多尺度分支动态可分离卷积可直接从一维时序振动信号中提取设备的多时间尺度特征,获得初始特征集。
9.所述多尺度分支动态可分离卷积包括多个并行的一维动态可分离卷积,所述一维动态可分离卷积层通过对包含通道卷积和点卷积两步卷积的深度可分离卷积网络改进后而获得,改进方法为:将所述通道卷积和点卷积分别使用动态卷积替代,依次对改进后的通
道卷积和点卷积的卷积核进行参数更新以完成对应特征的提取。
10.对改进后的通道卷积层的卷积核进行参数更新,包括:
11.对输入进行一次注意力操作,然后学习得到每个卷积核的权重,将学习到的权重分别叠加到对应的卷积核上,实现卷积核的动态叠加。
12.对改进后的点卷积的卷积核进行参数更新,包括:
13.对输入进行一次注意力操作,卷积核之间进行相互自适应加权后,进行自适应动态卷积。
14.所述通道卷积注意力模块设置在动态可分离卷积层之后,捕捉在多尺度分支动态可分离卷积后局部通道的互补的特征,通过计算注意力的概率分布对关键性输入特征分配更多的权重,以提取初始特征集中不同时间尺度的所有故障判别信息。
15.所述初始特征集中不同时间尺度的所有故障判别信息被连接到所述全连接层的前馈神经网络中,引入残差学习。
16.所述全连接层设置在所述通道卷积注意力模块之后,用于将通道维度上的特征进行整合,所述残差模块设置在所述全连接层之后,防止网络的梯度消失和爆炸。
17.一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现所述的基于动态可分离卷积神经网络的故障诊断方法。
18.一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现所述的基于动态可分离卷积神经网络的故障诊断方法。
19.本发明的有益效果如下:
20.本技术卷积神经网络中的特征提取模块由多尺度分支动态可分离卷积、通道卷积注意力模块、残差模块和全连接层组成,多尺度分支动态可分离卷积在一维时序振动号中提取有效的辨识信息,能充分识别原始信号蕴含的固有多时间尺度特征信息,引入通道注意力机制对通道特征进行自适应加权,为重要的通道特征分配更为重要的权重,进一步优化模型的分类能力,并在最后引入残差学习机制,保证了所提方法的有效性,可以实现强噪声环境下滚动轴承故障的有效诊断。
21.本技术的多尺度分支动态可分离卷积是在传统的深度可分离卷积基础上经过动态卷积改进而获得,可以在降低数据参数的情况下有效提取测试数据中的固有时间特征信息,实现高噪声和复杂工况下高精度的轴承故障诊断。
22.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
附图说明
23.图1为本发明实施例的方法流程图。
24.图2为本发明实施例卷积神经网络的结构示意图。
25.图3为本发明实施例卷积神经网络的特征提取模块的结构示意图。
26.图4为本发明实施例卷积神经网络的特征提取模块的一维动态可分离卷积结构示意图。
27.图5为动态卷积原理图。
28.图6为本发明实施例卷积神经网络的特征提取模块的通道卷积注意力模块的结构示意图。
具体实施方式
29.以下结合附图说明本发明的具体实施方式。
30.参见图1,本技术的一种基于动态可分离卷积神经网络的故障诊断方法,对采集到的轴承振动信号以故障类型进行分类标注,生成数据样本,并划分训练集、验证集和测试集;将训练集和验证集输入卷积神经网络中进行训练,形成振动数据和故障标签的恒等映射,保存对应的网络参数;将测试集输入训练好的模型中进行网络测试;将实际振动信号输入训练并测试好的卷积神经网络进行故障预测,所述卷积神经网络能够进行多时间尺度特征信息提取,并通过计算注意力的概率分布对关键性输入特征分配更多的权重,实现对数据中的固有时间特征信息的准确提取,获得对应的故障诊断结果。
31.所述卷积神经网络为动态可分离卷积神经网络(dynamically separable convolutional neural networks,ds-cnn),参见图2,所述卷积神经网络的结构包括一维卷积层(conv1d)、特征提取模块(mbafem)、最大池化层(maxpooling)、全局平均池化层(globalaveragepooling)和softmax分类器,输出层使用softmax函数输出分类标签,图中输出结果为故障分类c0、c1、c2……
c9。
32.参见图3,所述特征提取模块由多尺度分支动态可分离卷积(包括多个并行的一维动态可分离卷积(multiscalc1d-dscnn)、通道卷积注意力模块(eca-efim)、残差模块和全连接层组成,所述多尺度分支动态可分离卷积可直接从一维时序振动信号中提取设备的多时间尺度特征,获得初始特征集。所述通道卷积注意力模块设置在动态可分离卷积层之后,捕捉在多尺度分支动态可分离卷积后局部通道的互补的特征,通过计算注意力的概率分布对关键性输入特征分配更多的权重,以提取初始特征集中不同时间尺度的所有故障判别信息。所述初始特征集中不同时间尺度的所有故障判别信息被连接到所述全连接层的前馈神经网络中,引入残差学习。所述全连接层设置在所述通道卷积注意力模块之后,用于将通道维度上的特征进行整合,所述残差模块设置在所述全连接层之后,防止网络的梯度消失和爆炸。图3中“fnn”代表全连接层的前馈神经网络。
33.参见图4,为所述一维动态可分离卷积层的结构,所述一维动态可分离卷积层(multiscalc1d-dscnn)通过对包含通道卷积和点卷积两步卷积的深度可分离卷积网络改进后而获得,改进方法为:将所述通道卷积和点卷积分别使用动态卷积替代,先后对改进后的通道卷积和点卷积的卷积核进行参数更新以完成对应特征的提取。图4中,第一个圆圈代表改进后的通道卷积(d-dconv),第二个圆圈代表改进后的点卷积(s-dconv),c
l
代表输入的长度,l即代表输入的通道数,ck代表通道卷积的卷积核的大小,n代表点卷积的卷积核的数量,卷积核的大小为1*1。
34.对改进后的通道卷积层的卷积核进行参数更新,包括:
35.对输入进行一次注意力操作,然后学习得到每个卷积核的权重,将学习到的权重分别叠加到对应的卷积核上,实现卷积核的动态叠加。
36.对改进后的点卷积的卷积核进行参数更新,包括:
37.对输入进行一次注意力操作,卷积核之间进行相互自适应加权后,进行自适应动
态卷积。
38.改进后的通道卷积和点卷积都采用了动态卷积的方式进行卷积核更新,通过融合注意力机制,动态聚合多个并行卷积核。
39.如图5所示为动态卷积的原理图,动态注意力分支从输入x的平均池化(gap)开始,然后是两个全连接(fc)层,它们之间有一个relu激活层,然后是一个softmax,用于为k个卷积核生成归一化的注意力权重。遵循cnn的经典设计,动态卷积层还包括批量归一化和聚合卷积之后的激活(例如relu)层。
40.本技术的一维动态可分离卷积层的卷积方法是将动态卷积和深度可分离卷积结合起来的卷积方法,分别使用动态卷积的方法代替常规的深度可分离卷积中标准的通道卷积和点卷积,动态卷积在不明显增加参数数量情况下,显著改善模型效果。与传统的静态卷积(每层单个卷积核)相比,基于注意力的多个卷积核的动态叠加不仅显着提高了表达能力,而且附加的计算成本很小。提升模型表达能力,使用通道卷积和点卷积的组合卷积可以有效的减少网络的参数数量和模型的存储成本。
41.参见图6,为本技术的通道卷积注意力模块的结构示意图。最左边是初始输入特征,直接对输入序列进行全局平均池化(gap),通过自适应选择大小为k的快速一维卷积有效地捕获局部跨通道交互信息,从而有效地捕获所有特征而无需降维。然后使用sigmoid函数生成每个通道的权重比,将初始输入特征与通道权重相结合,得到具有通道注意力的特征。
42.本技术通道卷积注意力模块的数学模型如下:
[0043][0044]
式中,avgp(f)表示平均池化;maxp(f)表示最大池化;mlp()表示多层感知机;σ表示sigmoid激活函数;mc(f)表示通道注意力矩阵。
[0045]
以下以具体计算实例进一步说明本技术卷积神经网络模型的建立方法及其有效性进行进一步说明。
[0046]
采用凯斯西储大学轴承故障数据集,取驱动端数据为例,数据覆盖全载荷范围:包括四种载荷0hp、1hp、2hp、3hp,分别对应1797(r/min)、1772(r/min)、1750(r/min)、1730(r/min)。滚动轴承故障位置包括滚动体故障(ball)、外圈故障(outerrace)、内圈故障(innerrace),每种故障位置包含三种故障尺寸:7mil、14mil、21mil。轴承故障分为9类故障状态和1类正常状态。
[0047]
基于以上数据采用本技术的故障诊断方法对滚动轴承进行故障诊断,包括:
[0048]
在全载荷范围内进行采样,设置数据采样频率12khz,对数据进行异常值处理、缺失值填充等预处理;
[0049]
针对每种故障状态取1200个点为一个序列,并进行滑窗处理,每个窗口有1200点,并进行平移600个点,保证相邻子样差异性和完整性,并随机打乱,进而划分为训练集、测试集和验证集,训练集、测试集、验证集的比例分别为60%、15%、25%;
[0050]
在划分好的样本中添加高斯白噪声,使得样本的信噪比保持在-6db,然后添加好噪声的训练集和验证集的样本输入卷积神经网络中,设置初始参数,并进行模型训练,训练
采用adam优化器,学习率为0.001,mini-batch大小为64,损失函数为交叉熵损失函数当训练集和验证集损失函数值都较小且趋于稳定时停止迭代。当迭代收敛时,完成网络参数训练,并保存网络参数模型,将测试集送入模型中计算模型准确率;
[0051]
将所述测试集的样本输入到训练好的网络中,得到测试集故障诊断结果。
[0052]
为了验证本技术的ds-cnn模型及方法的有效性,采用三个常用于故障诊断的模型作为对比,分别是ms-cnn(multi-scale cnn)、cnn和svm。将相同的测试数据分别输入三个网络模型中,将诊断结果进行对比。
[0053]
其中ms-cnn直接将128*1200的序列输入到相对应的1d-cnn模型中,网络层数与ds-cnn保持一致。
[0054]
表1为本技术的模型与三个对比模型的准确率。可以看出,在多尺度动态可分离卷积、通道注意力机制和残差模块的加持下,测试集上的准确率有到98.24%,与采用多尺度普通卷积神经网络相比准确率提高了16%,验证了发明所提方法的有效性。
[0055]
表1
[0056]
模型训练集准确率测试集准确率ds-cnn0.98990.9824ms-cnn0.86280.8211cnn0.67920.6929svm0.45270.5602
[0057]
由表1可知,ms-cnn、cnn和svm的故障诊断准确率相对较低,都在90%以下,原因主要ms-cnn在抗噪方面,故障特征辨识度不高,多工况下,无法很好的提取故障的共性能力;cnn模型一般为单一尺度卷积核,无法很好的获取信号的多尺度信息;svm为传统机器学习模型,该类模型的学习能力对所提取特征有较强的依赖而人工提取特征又难以挖掘出信号更全面、更深层的信息,这也突出了基于深度学习自动提取特征的优势。在ds-cnn与ms-cnn模型的对比中可以看出,使用动态可离卷积的网络模型,能够更好的提取设备的固有时间尺度信息,其对时间序列分类结果要优于ms-cnn直接分类的结果,说明利用动态可分离卷积可以更有效地提取原始数据特征,可以通过数据点之间的关系反映出不同故障的特点。
[0058]
表2所示为本技术的动态可分离卷积(ds-cnn)和标准卷积(standard convolution)、深度可分离卷积(dsc)的模型参数数目和所占内存大小。
[0059]
表2
[0060][0061]
由表2可知,可以看出本技术的动态可分离卷积(ds-cnn)比标准卷积(standard convolution)的模型参数数量上有一定程度的减少,且性能有所增加,动态可分离卷积(ds-cnn)比深度可分离卷积(dsc)更有效的提升模型性能。
[0062]
本技术还提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现所述的基于动态可分离卷积神经网络的故障诊断方法。
[0063]
本技术还提供一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现所述的基于动态可分离卷积神经网络的故障诊断方法。
[0064]
本领域普通技术人员可以理解:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献