基于DC-LSTM-Attention组合模型的海洋气象时序预测的方法与流程
- 国知局
- 2024-12-26 14:50:43
本发明涉及一种基于dc-lstm-attention组合模型的海洋气象时序预测的方法,属于海洋气象时序预测领域。
背景技术:
1、海洋气象预测在全球气候变化、海洋资源管理和海上活动中具有不可替代的作用。通过提前预知海洋气象变化,不仅能提升海上运输、渔业和石油开采等行业的作业效率,还能有效避免和减轻气象灾害带来的风险。此外,海洋气象预测对保护海洋生态系统、应对气候变化具有重要的战略价值。在传统方法中,海洋气象时序预测主要依赖于统计模型和物理模型。统计模型如自回归积分滑动平均模型(arima)及其变体,通过历史数据的时间序列特性来预测未来气象状况。这类方法虽然简单易行,但在处理非线性、非平稳或高维数据时表现有限。物理模型则基于大气和海洋动力学的物理定律,通过数值模拟来预测气象变化。然而,物理模型的计算复杂度高,且对初始条件和边界条件的准确性要求极高,限制了其在实际应用中的广泛性和实时性。
2、随着大数据时代的到来和计算能力的提升,深度学习技术逐渐在海洋气象时序预测领域崭露头角。深度学习模型,特别是循环神经网络(rnn)及其变体如长短时记忆网络(lstm)和门控循环单元(gru),因其能够有效捕捉时间序列数据中的长期依赖关系,成为海洋气象预测的重要工具。此外,卷积神经网络(cnn)在特征提取方面的优势也被引入到气象预测中,通过结合lstm,可以进一步提升模型对复杂气象数据的处理能力。
3、张雪薇等为解决传统时间序列网络模型的时间性与空间性结合不足和批量处理海洋环境要素大数据能力不足的问题,采用循环神经网络(rnn)扩展算法和卷积神经网络(cnn)相结合的convgru深度学习神经网络模型以有效体现时空特征,利用样本生成器处理数据以有效处理时间序列遥感数据的批量性问题。阚高远等针对气象数据多波动、非线性且存在极端数据等特点,构建了经小波变换降噪处理后基于lstm神经网络的混合预测模型。该模型首先通过小波变换将原始气象数据分解为低频和高频分量后再重新组合去噪,继而使用lstm网络模型建模预测,并以未来时刻的气象指标作为最终预测结果。在应对海洋气象数据的多波动、非线性和极端值问题时,现有方法虽然取得了一定成效,但仍难以有效捕捉多尺度特征和长短期依赖。
技术实现思路
1、为克服现有技术的缺陷,本发明提供一种基于dc-lstm-attention组合模型的海洋气象时序预测的方法,本发明的技术方案是:
2、一种基于dc-lstm-attention组合模型的海洋气象时序预测的方法,包括以下步骤:
3、(1)数据筛选与预处理,选取海洋气象场景的数据集,对数据进行清洗、归一化处理;
4、(2)设计基于dc-lstm-attention的海洋气象预测模型,该模型包括空洞卷积层、lstm层和attention层;
5、(3)模型训练与验证,将数据输入训练好的模型,通过处理得到多维特征向量,并将其与数据库中的历史特征进行对比,预测未来海洋气象变化。
6、所述的步骤(1)具体为:
7、在预处理阶段,采用滑动窗口方法构建时序输入数据,保证每个时间点都具有多个历史观测值,并对数据进行归一化和标准化处理,以减少不同变量之间的尺度差异。
8、在所述的步骤(2)中:
9、所述的dc-lstm-attention的海洋气象预测模型模型整体架构通过将空洞卷积模型、lstm层和attention层结合,在所述的空洞卷积模型中,首先处理输入的海洋气象数据,通过使用不同的扩张率,空洞卷积能够在保持卷积核尺寸不变的情况下覆盖更广的输入区域,从而增强模型对不同时间尺度特征的感知能力;
10、参数设置:空洞卷积层通常配置数个扩张率;
11、所述的长短期记忆网络lstm层跟随空洞卷积层,接收其输出作为输入,lstm能够处理和维护时间序列数据中的长期依赖关系,其门控机制包括遗忘门、输入门和输出门;
12、所述的注意力层位于lstm之后,对lstm的输出进行加权和选择性聚焦。
13、所述的长短期记忆网络lstm层改进了rnn中的隐藏层,在隐藏层中增加3个门控制单元控制自循环,遗忘门使用sigmoid激活函数将上一时刻的记忆细胞与当前t时刻的输入转化为0~1的数值,0表示丢弃所有信息,1表示保留所有信息,该数值决定多少信息被保留,遗忘门ft计算公式为:
14、ft=σ(wf[ht-1,xt]+bf),式中:σ为sigmoid函数;wf为遗忘门的权重矩阵;ht-1为输出神经元;xt为当前时刻的输入神经元;bf为遗忘门偏置项;
15、输入门有2个部分:第1部分是sigmoid层,决定了更新记忆细胞的状态;第2部分是tanh层,创建1个新的候选记忆细胞状态。输入门it计算公式为:it=σ(wi[ht-1,xt]+bi);ct=tanh(wc[ht-1,xt]+bc);
16、
17、式中:wi为输入门权重矩阵;bi,bc分别为输入门与细胞状态的偏置项;为备选更新信息;tanh为激活函数;wc为记忆细胞权重矩阵;ct为记忆细胞状态;
18、输出门决定单元状态输出值。先利用sigmoid层确定哪部分被输出,再通过tanh处理并将其与sigmoid函数的输出相乘。输出门ot计算公式为:ot=σ(w0[ht-1,xt]+b0);ht=ottanh ct;式中:w0为输出门权重矩阵;b0为输出门偏置项。
19、所述的空洞卷积的公式表示为:
20、其中:x(i)表示输入序列种的第i个数据点;w(k)表示卷积核的第k个权重;d表示扩张率,即卷积核元素之间的跳跃步长;k表示卷积核的索引;感受野是指卷积层在输入数据中覆盖的区域,对于空洞卷积来说,感受野大小为:(k-1)*d+1;其中k是卷积核的大小,d是扩张率;扩张率d决定了感受野的大小;当d=1时,空洞卷积退化为标准卷积;当d=2时,每个卷积核元素会跳过一个输入值;当d=4时,每个卷积核元素会跳过三个输入值。
21、所述的注意力层的计算方法为:
22、首先,attention层计算encoder中的第t个hidden state与每一个encoder的hidden state的相似度sti,分数越高说明关注度越高,权重越大;
23、然后对相似度系数进行softmax归一化,得到归一化后的注意力向量αti;在此基础上计算隐藏层状态与注意力权重αti的乘积f;
24、最终网络得到了被赋予不同重要程度的attention层的输出ht,具体计算方式如公式如下所示:
25、sti=v tanh)wht+uht+b),i=1,2,3.....t-1;
26、
27、ht=attention(f,ht,xt)。
28、所述的步骤(3)具体为:
29、使用均方根误差作为主要的损失函数来优化模型,在验证集上则使用误差在不同百分比范围内的比例来评估模型的表现;具体为:
30、3.1训练阶段:在训练过程中,rmse被用作损失函数,以优化模型的参数,rmse是评估模型预测值与真实值之间差异的一个常用指标,其公式如下:其中:
31、是模型预测的值,yi是实际值,n是样本数;
32、rmse反映了模型预测的总体误差,数值越小,模型的预测性能越好;
33、3.2验证阶段:在验证集上,除了观察rmse值,还引入以下几个指标来评估模型预测值的精度,以更直观地展示模型的实际表现;
34、误差1%以内的比例:表示预测值与真实值的相对误差在1%以内的样本占总样本的比例。此指标反映模型在高精度情况下的表现;
35、误差3%以内的比例:表示预测值与真实值的相对误差在3%以内的样本占总样本的比例。这个指标衡量了模型在实际应用中可能的表现;
36、误差5%以内的比例:表示预测值与真实值的相对误差在5%以内的样本占总样本的比例。这个范围通常被认为是合理的预测精度要求;
37、误差10%以内的比例:表示预测值与真实值的相对误差在10%以内的样本比例;
38、误差15%以内的比例:表示预测值与真实值的相对误差在15%以内的样本比例;
39、3.3验证集上的计算方法:假设预测值和实际值分别为和yi,相对误差的计算公式为:
40、
41、对于每一个样本,计算相对误差,并统计相对误差在1%、3%、5%、10%、15%以内的样本比例;
42、3.4实验步骤:
43、模型训练:在训练集上通过rmse优化模型,调整模型参数直到损失函数达到最优。
44、验证集测试:在验证集上计算预测结果,评估rmse以及不同误差范围内的比例,了解模型在实际应用中的表现。
45、本发明的优点是:dc-lstm-attention模型通过空洞卷积(dc)扩展感受野,更好地捕捉不同尺度的特征。lstm则有效建模时间序列中的长期依赖,提升了对周期性变化的预测能力。attention机制进一步增强了模型的自适应性,使其能动态调整对不同时间步和特征的关注度,优化了复杂数据下的预测表现。
本文地址:https://www.jishuxx.com/zhuanli/20241226/343632.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。