一种GAN数据增强的链传动轴承故障诊断方法
- 国知局
- 2024-08-08 16:53:18
本发明涉及算法、神经网络的,应用于链传动滚动轴承领域,特别涉及一种基于生成对抗网络的的小样本链传动滚动轴承的故障诊断方法。
背景技术:
1、随着科技的进步,链传动机械在实际应用中的比例大幅度增加,例如叉车、汽车发动机、制糖工业等。链传动机械主要由链条,链轮,滚动轴承和密封件组成。而其中尤为关键的部件就是滚动轴承。
2、滚动轴承的主要作用是减少摩擦并使元件平稳运行,它广泛应用于几乎所有类型的链传动机械,所以链传动机械的正常运行高度依赖滚动轴承的健康状态。然而滚动轴承的工作条件十分恶劣,例如高温,高转速和高负载。据研究表明,链传动机械的故障约41%是由滚动轴承故障引起的。并且无法获取足够的故障样本。因此对滚动轴承的小样本故障诊断是十分重要的。
3、链传动机械的滚动轴承故障直接影响了整体机械的工作情况,而且一旦发生故障则会造成无法挽回的结果,为了能够获取足够故障样本并且能及时发现故障问题,提出一种关键技术对链传动滚动轴承进行小样本故障诊断研究。
4、现有技术中,针对滚动轴承的故障诊断的方法主要有信号分析法、机器学习法和深度学习法。信号分析方法是通过对采集的振动信号进行时频域分析达到故障诊断要求,但是该方法需要先获取大量的先验知识,再人为设计模型来进行故障诊断,这既耗时又耗力。机器学习方法可以直接从先验知识中学习故障特征从而达到故障诊断,但是该方法还是依赖于人工选择有价值的特征。深度学习方法可以在没有先验知识的情况下,从输入的数据直接学习数据的特征来进行故障诊断,但是该方法是基于大量的输入样本来获取充足的故障特征,在实际应用中,难以收集大量的故障样本,会导致提取的特征不充分从而导致诊断准确性较低。因此,对滚动轴承进行小样本故障诊断难以实现。
技术实现思路
1、本发明要克服轴承故障收集困难,一维振动信号提取故障特征复杂,计算复杂的问题,提供一种链传动滚动轴承的小样本故障诊断方法。本发明具有设计简单,基于操作,可解释性强的优势。本发明建立链传动滚动轴承小样本故障诊断的模型及关联函数体系。
2、本发明的一种基于gan数据增强的链传动轴承故障诊断方法,包括几个步骤:
3、1)收集轴承故障振动信号,收集滚动轴承的时域下的一维振动信号,将时间作为横轴,振动信号的幅值作为纵轴。时间是指振动信号采集的时刻或时间序列中的时间点,表示了信号采集的顺序和时间间隔。振动信号的幅值表示了在特定时间点或时间段内的振动强度或振幅。
4、2)对收集的故障一维振动信号进行数据增强,使用的是生成对抗网络,具体流程如下:
5、(1)给定真实数据x~pdata和随机噪声z~pz,构建生成对抗网络的目标函数,可以表示为:
6、
7、其中g(z)表示生成的样本。
8、(2)加入类别标签c,构建条件生成对抗网络,针对于收集的故障样本有不同的类别,所以可以在gan中加入条件c形成cgan,c可以是任何类型的辅助信息,最常见的就是标签信息。与上述gan相比,cgan是将条件c和噪声z送入生成器中,并且条件c可以和真实、合成样本同时送入判别器中,因此cgan的目标函数可以表示为
9、
10、(3)使用wasserstein distance来代替传统gan模型中所用的kl散度和js散度。
11、(3.1)传统gan模型中所使用的kl散度可以表示为:
12、
13、p表示数据的真实分布,q表示生成数据的分布。当kl散度在两个分布完全一致时可取得最小值为0,并且从式(1)中可以看出kl散度是非对称的,即kl(p||q)≠kl(q||p)。
14、(3.2)js散度的数学表达式为:
15、
16、式(2)是kl散度的一种变形,不同于kl散度,js散度的值域范围是[0,1],真实数据和生成数据分布一致时是0,不同时则是1.而且js散度是对称的,即js(p||q)=js(q||p)。
17、上述所介绍的上述所介绍的kl散度和js散度存在一定的局限性。当训练过程中js散点为0时,生成的样本与真实样本相同,模型达到最优结果。但是,当生成的样本与真实样本无重叠部分时,js始终等于log2,kl为无穷大。对于梯度下降法,此时梯度为0,因此gan模型在训练过程中存在不稳定性。
18、(3.3)提出wasserstein距离来解决上述问题,构成条件wasserstein生成对抗网络。该距离可以反映生成样本和真是样本之间的距离,不论他们之间的重合度是多少,它的数学表达式为:
19、
20、inf表示真是样本和生成样本的联合概率分布的下界,e表示真实样本和生成样本之间的期望距离。
21、(4)使用一维卷积层,同时加入注意力机制,构建注意力条件wasserstein生成对抗网络。这样的gan可以在识别一维振动信号的同时,还可以生成一维振动信号。一维卷积能够有效捕捉局部特征,然而该一维振动信号是长序列,所以在此基础上加入注意力机制。可以有助于捕捉长距离的依赖关系,使生成对抗网络生成与真实数据更相似的合成数据。
22、注意力机制的主要流程可以分为三个部分:
23、(4.1)对输入权重进行分配,通过计算查询所有键的点积来得到相似度得分,数学表达式可以表示为:
24、score(q,ki)=vttanh(wqq+wkki)⑹
25、其中q表示输入的目标,ki与输入序列的每个元素相关联。wq和wk是可学习的权重矩阵,v是另一个可学习的权重向量,用于tanh激活函数的输出转换为分数,tanh是激活函数,用于增加非线性。
26、(4.2)使用可学习的权重和激活函数计算每个输入位置的权重,即应用softmax函数计算出每个键对查询的相对权重,数学表达式可以表示为:
27、
28、(4.3)根据计算出的权重对所有值进行加权求和,得到加权的输出向量,表示为:
29、
30、其中vi是与第i个键相关的向量。
31、3)通过对信号的时域和频域分析,将生成对抗网络生成的数据来进行质量评估。
32、时域分析关注数据随时间变换的特性,适用于时间信号,在时域分析中,直接观察和比较信号的波形,即在不同时间点的信号强度或振幅来揭示信号的瞬时特性。通过将生成的信号与真实信号的时域波形进行对比,直观的评估它们之间的相似度。
33、频域分析通过查看信号在不同频率上的表现来理解其特性,将信号通过傅里叶变换从时域转换到频域来实现。使用快速傅里叶变换(fft)将时域信号转换成频域信号。fft是一种高效的离散傅里叶变换(dft)算法,能够快速计算序列或信号的离散傅里叶变换。
34、4)根据生成对抗网络生成的故障样本,获取足够的故障样本之后,使用该样本来训练故障诊断模型,该诊断模型使用小波变换和残差网络来构建,具体流程如下:
35、(1)收集生成之后质量合格的一维时序信号样本;
36、(2)使用小波变换将收集的一维时序信号样本转换成频域信号样本,来同时关注时域和频域上的故障特征。
37、本发明研究的是一维时域振动信号,使用小波变换对数据进行处理,可以将时域信号转换成频域信号,便于同时在时域和频域进行信号分析。只是进行时域分析的情况下,只能关注信号在时间轴上的变化,对于一些故障特征主要体现在特定的频率上,时域分析是无法捕捉这些频域特征的。而且时域分析对非平稳信号的适应性较差,但是引起故障的信号大多是非平稳的。
38、小波变换是一种对信号进行多尺度时间-频率分析的方法,通过将信号分解为不同频率的小波系数来实现。小波分解能够同时提供信号在时间和频率上的信息,小波分解的核心在于使用一组小波基函数对信号进行表示。这些基函数通过对一个母小波函数进行缩放和平移操作生成的。母小波是指一个固定的小波函数,通过对其进行伸缩和平移操作生成所有其他小波基函数。
39、离散小波变换采用一种分层分解的方法,它将信号分解为一系列低频和高频部分,在每一级分解中,信号都通过低通滤波器和高通滤波器进行过滤,然后下采样,这一过程迭代多次,从而得到多级分解的结果。它的数学表达式为:
40、低频部分:
41、高频部分:
42、其中cak+1[n]是第k级的低频系数,cdk+1[n]是第k级的高频系数。h[m]和g[m]分别是低通和高通滤波器的系数,这些系数取决于所选择的小波基。k是分解的级数。通过这样的迭代,离散小波变换能够有效的捕捉信号的时间和频率信息,尤其适用于非平稳信号的分析。
43、(3)使用输入层,卷积层,归一化层和全连接层来构建残差网络;
44、本发明研究小样本下的故障诊断,使用残差网络来进行故障诊断。随着神经网络层数的不断加深,训练卷积网络模型(cnn)的难度也会逐渐增加。针对深度卷积网络模型训练的难度,提出了残差网络(resnet)模型。resnet模型通过设计基于普通cnn的身份映射,进一步降低了深度神经网络的训练难度。resnet通过引入残差学习的概念来解决深度网络训练过程中的梯度消失问题,它的核心思想是让网络层学习输入与输出之间的残差,而不是直接学习映射关系,这样可以有助于训练非常神的网络结构,极大的提高了训练网络的效率和效果。resnet通常由输入层、一系列卷积层(conv)、批量归一化(bn)、全连接层等组成。与标准卷积模块类似,resnet也有基本的残差块。主要操作路劲为“bn-relu-conv-bn-relu-conv“然后添加到跨层路径中形成完整的基本残差块。
45、残差块是resnet中的基本构建模块,它的基本公式可以表示为:
46、y=f(x,{wi})+x⑾
47、如果考虑激活函数σ的作用,公式11可以拓展为:
48、y=σ(f(x,{wi})+x)⑿
49、其中,x是输入特征,f(x,{wi})是要学习的残差映射,即输入x通过一系列层侯得到的输出,{wi}表示这些层的权重。y是残差块的输出特征,σ是激活函数。
50、在残差网络中,f(x,{wi})+x的设计直接将输入x通过一个“快捷连接”加到了输出上,这使得网络学习的目标变为残差f(x,{wi})。如果输出和输入是相同的,则理想的f(x,{wi})应为0.这可以极大的减轻梯度消失的问题,因为梯度可以通过快捷连接直接传播回较浅的层,从而使得深度网络的训练变得更加高效和稳定。值得注意的是,当输入x和输出y的维度不一致时,残差块会通过一个线性变换ws调整维度,以便进行相加操作,即:
51、y=σ(f(x,{wi})+wsx)⒀
52、其中ws是一个线性投影,用于匹配维度。
53、(4)将收集到的时域和频域的故障特征送入残差网络中进行故障诊断。
54、本发明提供了一种链传动滚动轴承的小样本故障诊断方法,建立链传动滚动轴承的故障样本增强模型;对增强后的数据进行质量评估,当达到与真实样本在时频域下的分布相近后,收集生成样本;利用生成样本来训练故障诊断模型,并使用真实样本评估诊断模型的准确率;方法应用于链传动滚动轴承模型,通过收集少量故障样本,经过数据增强模型和故障诊断模型达到故障诊断结果。
55、本发明的有益效果在于:
56、(1)设计简单、容易理解、实用性强、实用性广;
57、(2)具有极强的可解释性;
58、(3)与传统小样本故障诊断模型相比,使用生成对抗网络进行数据增强能有效的增加输入样本数量为后续故障诊断打下良好基础。
本文地址:https://www.jishuxx.com/zhuanli/20240808/271004.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。