一种基于深度自编码器的飞机供电系统运维数据异常检测方法与流程
- 国知局
- 2024-08-22 14:25:11
背景技术:
1、随着大数据时代的到来,各个领域都在致力于数据融合的开发与利用,通过数据挖掘技术和人工智能技术发现潜在信息甚至进行预测的数据驱动的装备预先性维修保障技术应时而生。将数据智能融入各级装备保障业务,优化装备维修保障业务工作统筹,实现数据的增值增效,具有重要的工程意义和应用价值。
2、供电系统是飞机上的重要系统之一,为飞机上的各种设备和系统提供电力。供电系统是一个复杂的系统它涉及到高压电力设备和敏感电子设备等,一旦出现故障,可能会导致关键设备失效,影响其他系统的正常工作,甚至会影响飞机的正常飞行和安全。因此,及时检测供电系统的异常非常关键,能够帮助飞行人员和维护人员及早发现和解决问题,确保飞机的可靠性和安全性。从数据获取方面来说,相较于其他系统,飞机供电系统的异常检测技术可以利用大量的实时数据进行分析。供电系统涉及到电压、电流、频率、温度等一系列参数,这些参数可以通过传感器实时获取。通过对这些数据进行分析,可以发现供电系统中的异常变化,并与正常工作条件下的数据进行比较。这种数据分析的优势为异常检测实际应用提供了天然优势。
3、飞机设备运维数据异常检测技术的研究一直备受关注,关于持续改进和优化异常检测技术的文献数量也在不断增加。liansheng liu在《improving egt sensing dataanomaly detection of aircraft auxiliary power unit》中提出了一种基于高斯过程回归和核主成分分析的数据驱动排气温度(egt)检测框架,论证了egt传感数据是辅助动力装置(apu)异常检测技术中的关键参数。l basora等人在《aircraft fleet healthmonitoring with anomaly detection techniques》使用欧洲某主要航空公司的现代宽体飞机的冷却单元系统上的传感器数据,重点研究了半监督异常检测方法在真实飞机系统健康监测中的可行性和潜力。d gorinevsky在《aircraft anomaly detection usingperformance models trained on fleet data》描述了在飞行操作质量保证(foqa)数据上应用分布式舰队监控(dfm)实现大规模多级回归模型拟合,将飞机制造商在飞行测试中确定的气动系数和其他飞机性能参数作为回归参数,证明dfm能有效发现关于计算变量错误值的异常,如飞机重量和攻角,以及飞行传感器和执行器中的故障、偏差和趋势。tgpuranik在《anomaly detection in general-aviation operations using energymetrics and flight-data records》中提出了利用能量度量来识别在通用航空运营中在进近和着陆阶段的异常飞行数据记录。x zhang在《anomaly detection for aviationsafety based on an improved kpca algorithm》中提出了一种改进的核主成分分析(kpca)方法,通过平方预测误差统计来搜索飞行数据集中异常的特征,实现了有效异常检测。sdas在《comparison of algorithms for anomaly detection in flight recorderdata of airline operations》中比较了基于聚类的异常检测(clusterad)和多核异常检测(mkad)算法,这两种算法都是为了检测记录的飞行数据中的异常飞行而开发的,通过在在同一组航空公司正常运营的飞行数据上进行了独立测试,评估了clusterad和mkad的效能。
4、面向飞机供电系统的基于运维数据驱动的深度自编码器异常检测方法技术,与传统方法相比,有效解决了:(1)如何大规模的数据选择合适的数据量,保证在合理的时间内完成异常检测任务;(2)如何增强数据可用性:将飞参数据和维护数据进行关联和整合,以建立包含多个维度信息的数据集;也将表征子部件故障状态的离散特征与飞参连续变量合并进行特征提取,增大特征信息量。(3)采用高效的深度自编码器算法,从建立的模型入手,结合领域将重构误差相对值作为系统的全局异常检测指标。本发明实现了基于数据的维护和决策,可以有效识别和故障行为,检测设备是否故障和故障发生时间,为维护决策提供报警信息。
技术实现思路
1、本发明的目的是:针对海量的飞参数据和运维数据有效融合的应用难题,本发明提出了一种基于深度自编码器的飞机供电系统运维数据异常检测方法。
2、本发明的技术实现框架是:参阅图1,一种基于深度自编码器的飞机供电系统运维数据异常检测方法技术,在训练和测试阶段分别完成数据预处理过程和异常检测的实现。
3、数据预处理:
4、步骤1:建立数据集
5、将飞参数据和维护数据进行关联和整合,以建立包含多个维度信息的数据集;
6、子步骤1:将飞机供电系统的飞参数据作为异常检测研究对象。飞参数据是指汇聚到某存储器的实时飞行参数,其飞参数据数量庞大、覆盖范围广、关联关系复杂,包含各系统、各主要部件的连续变量和开关变量。
7、子步骤2:将地面维修数据用于异常检测模型验证。地面维修数据主要来源于地面维修表,该表记录每条故障发生的时间、所属系统、分系统、部件、故障原因、解决措施等文字信息,使用这部分数据可以对飞参数据做标注。
8、步骤2:确定实验数据量
9、选择合适的训练数据量需要在实际应用中进行实验和调整,根据模型的表现来不断优化训练数据的数量。可以通过改变不同训练数据量观察模型异常检测效果来评估模型的性能,从而确定是否需要更多的训练数据。一般来说,训练数据量越大,模型泛化能力更强,也可以降低过拟合的风险,使模型更加稳健。但是随着训练数据量的增加,模型的训练时间也会相应增加,可能会导致训练过程变得更加耗时。。
10、步骤3:pca特征提取
11、将表征子部件故障状态的离散特征与飞参连续变量合并进行特征提取,使用pca降维方法不区分连续变量和开关状态检测量,假设原始数据是n维状态监测变量,先将每个变量的方差和协方差计算出来,得到数据的协方差矩阵。pca分析就是产生一组新的变量,使得新变量的协方差矩阵为对角阵。
12、原始变量的协方差矩阵包含以下两部分信息:
13、①原始变量自身的方差(协方差矩阵的主对角线位置);
14、②原始变量之间的相关程度(非主对角线位置);
15、方差计算公式:
16、
17、其中,n表示n维时间变量,xi代表第i个时间变量值,是原始变量矩阵的均值。
18、协方差计算公式:
19、
20、其中,n表示n维时间变量,xi,yi代表第i个时间变量值x,y,是原始变量矩阵的均值。
21、方差var(x)计算单个变量的变异度,表示数据的离散程度。协方差cov(x,y)计算两个变量的相关度,协方差值为0表示没有相关性;协方差值如果为正,表示一组数据增加时另一组数据也随之增加;协方差值如果为负,表示一组数据增加时另一组数据也随之减少。
22、步骤4:ma滑窗滤波
23、在实际的工程应用中,经数据噪声太多的问题,比如数据抖动的太厉害等。为了降低噪声的影响,需要对数据进行滑窗滤波。具体地,取连续若干个时间窗口内的样本值的算术平均。滑动窗口的大小决定了平均的时间范围,窗口越大,滤波效果越平滑,但响应速度较慢。假设数据点为:x1,x2,...xt,,窗口大小为n,t时刻的移动平均值smat为:
24、
25、其中,xi表示表示i时刻的数据点,n表示窗口大小。
26、步骤5:数据标准化处理
27、数据标准化处理主要是针对不同的特征参数的量级不同,各特征参数之间的变化范围差异较大,通过标准化处理使得所有特征参数都处于同一量纲下进行比较。本发明采用z-score标准化,通过计算原始数据的均值和方差来得到标准化的新数据,新数据服从均值为0,标准差为1的正态分布。新数据x*通过下列计算公式得到:
28、x*=(x-μ)/σ (4)
29、其中,μ为原始数据的均值,σ为原始数据的标准差。
30、步骤6:建立深度自编码器模型
31、使用双向长短期记忆自编码器网络模型(bidirectional long-short termmemory autoencoder,bilstm-ae)对飞机供电系统正常运行阶段下的状态变化进行学习。bilstm-ae是一种结合了长短时记忆网络(lstm)和自编码器(ae)的深度学习模型,可以将飞机供电系统飞参数据的状态变量作为输入序列,通过学习这些数据中的长期依赖关系和局部特征,来捕捉供电系统的运行状态变化。lstm是一种时间序列处理模型,lstm类似于标准的递归神经网络,lstm用于解决递归神经网络中的梯度消失或梯度爆炸问题。将当前时刻和上一时刻的数据输入到lstm中,利用sigmoid激活函数计算输入、遗忘和输出门的值。lstm门结构如下图2所示。
32、假设存在隐藏单元h,批大小为n,输入数量为d。因此,输入为前一个时间步长的隐藏状态为相应的,时间步长t的门定义如下:输入门为遗忘门为输出门为其计算方法如下:
33、it=σ(xtwxi+ht-1whi+bi) (5)
34、ft=σ(xtwxf+ht-1whf+bf) (6)
35、ot=σ(xtwxo+ht-1who+b0) (7)
36、其中wxi,wxf,和whi,whf,是权重参数,bi,bf,是偏置参数。
37、存储单元使用一个值范围为(-1,1)的tanh函数作为激活函数。在时间步长t得到如下等式:
38、
39、其中和是权重参数,是偏置参数。
40、lstm模型独特的门结构使得lstm可以捕捉单向的(由前至后)长时间间隔之间的依赖关系。但是双向lstm(bidirectional lstm,简称bilstm)由前向lstm和后向lstm组成,能捕捉双向时序关系。bilstm有效地增加了时间序列上下文信息。因此本发明选用bilstm建立自编码器模型。bilstm基本结构如下图3所示。
41、自编码器是一种无监督的数据维度压缩和数据特征表达方法。自编码器基本结构如下图4所示。实际应用中,飞行正常状态下的飞参数据远远大于异常飞参数据,无监督学习算法旨在检测偏离预期模式或偏离正常分布的数据,由于其学习过程不依赖对罕见异常样本的获取,因此在实际中广泛应用,因此,本发明选用无监督自编码器模型。
42、假设存在隐藏单元h,批大小为n,输入数量为d。编码器φ将原始数据高效地压缩为解码器r对隐藏单元数据进行反向操作,将其映射回d维原始输入空间,得到输入数据的重构表示。自编码器训练目标是通过训练得到一组比较稳定的参数,使得重构数据x′t能近似表示原始输入数据xt,其计算方法如下:
43、编码器:zt=φ(xt) (9)
44、解码器:x′t=γ(zt) (10)
45、目标函数:
46、异常检测的实现:
47、步骤1:获取异常指标
48、无监督深度自编码器将计算得到重构误差作为异常检测指标较为常见。将训练数据输入自编码器,通过解码器将其重构为原始数据的近似,通过比较重构数据与原始数据的差异,计算重构误差。可以使用各种距离或损失函数,本发明使用均方误差(mse)来衡量重构误差。计算公式如下:
49、
50、步骤2:确定异常检测阈值
51、本发明将通过专家知识或对业务场景的理解来设定阈值,进行手动调整。根据业务需求和数据特点,调整阈值以获得更好的异常检测性能。
52、本发明的有益效果:通过深度自编码器,即基于运维数据驱动的深度自编码器异常检测模型(anomaly detection model for o&mdata,adm-om),对飞机供电系统的飞参数据进行高维主成分分析(principal component analysis,pca)的特征提取处理和移动平均滤波(moving average,ma)的去噪处理,构建bilstm(bidirectional longshort-termmemory,bilstm)自编码器异常检测模型,将自编码器重构误差相对值作为异常设定自编码器重构误差相对值的上下限为异常检测阈值。测试指标超过异常检测阈值的记为异常样本,与地面维修数据异常情况对比验证模型检测的准确性。实验结果表明,与小样本训练数据量相比,此方法选取的训练数据量以更低的训练时间、更高的异常状态识别率完成建模,异常检测准确率为85.71%。
本文地址:https://www.jishuxx.com/zhuanli/20240822/278616.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。