基于时空增强型ConvGRU的海表面温度预测方法与流程
- 国知局
- 2025-01-10 13:25:51
本发明涉及海表温度预测,特别涉及一种基于时空增强型convgru的海表面温度预测方法 。
背景技术:
1、海表面温度(sea surface temperature , sst)是地球表面能量平衡的关键参数,在调节海洋与大气之间的能量、动量和水分交换过程中发挥着重要作用。sst的变化对全球气候系统和生物多样性有着深远的影响。因此,准确预测sst对于气候预报、海洋渔业管理和海洋环境保护等众多领域至关重要。
2、目前,预测海表面温度的方法主要分为两类:基于物理学的数值模型和基于数据的数据驱动模型。数值模型的方法利用一系列复杂的数值方程来模拟温度的变化过程,这种做法具有坚实的物理基础,但计算成本较高。而数据驱动的方法则是从历史观测数据中提取模式并构建预测模型,常用的方法有多层感知器、支持向量机等。这种方法相对于数值模式来说参数更少,计算复杂度更低,但在数据量大时表现不佳,具有一定局限性。
3、随着深度学习技术的不断进步,以往的预测方法难以满足对sst预测精度的需求,因此,基于深度学习的方法进行海表面温度预测已成为研究热点。sst数据不仅规模庞大,而且蕴含丰富的时间序列和空间关联信息。因此,如何有效地利用深度学习方法,深入挖掘这些数据中的隐藏信息和规律,对于提高sst在时间和空间上的预测精度具有至关重要的意义。早期的深度学习方法,如门控循环单元(gru)及其变体卷积门控循环单元(convolutional gated recurrent unit, convgru),虽然在处理时间序列数据时能够有效捕捉时间依赖关系,这些方法的设计初衷更多聚焦于时间维度的建模,而对于sst数据这类同时包含时间和空间复杂性的数据,仅仅依赖时间维度的建模往往难以全面捕捉其动态特性。
技术实现思路
1、为解决上述技术问题,本发明提供了一种基于时空增强型convgru的海表面温度预测方法 ,以达到提升空间信息的处理能力,提高预测精确度的目的。
2、为达到上述目的,本发明的技术方案如下:
3、一种基于时空增强型convgru的海表面温度预测方法 ,包括如下步骤:
4、步骤1,将欧洲中期天气预报中心的era5再分析数据获得的海表温度数据集进行预处理,并划分为训练集、验证集和测试集;
5、步骤2,将训练集的数据输入到时空位置增强注意力的深度学习算法模型中进行训练,用验证集的数据对模型精度进行评估并调整参数,用测试集评估模型的泛化能力以及预测精度;
6、所述模型包括多尺度特征提取模块、位置增强注意力模块和卷积门控循环单元模块;
7、多尺度特征提取模块由四条支路组成,第一条支路包括三个三维卷积层;第二条支路包括一个最大池化层和一个三维卷积层,第三条支路包括两个三维卷积层,第四条支路包括一个三维卷积层,每个三维卷积层后添加批标准化层和relu激活函数;四条支路在通道维度进行拼接,合并后输出;
8、所述位置增强注意力模块包括位置编码模块、通道注意力模块和空间注意力模块;位置编码模块用于为输入海表温度数据中的每个网格点添加唯一的位置编码,以便模型能够捕捉不同位置的信息;通道注意力模块由两个全连接层和两个重塑层组成,该模块用于生成相应的权重,对输入特征图进行加权;空间注意力模块由两个二维卷积层组成,第一个二维卷积层用于捕捉局部特征,第二个二维卷积层用于生成一个归一化的权重图;每个二维卷积层后面都有批标准化层,该权重图随后与经过通道注意力处理的特征图进行逐元素相乘,并进一步与该模块的原始输入相加,最终生成融合了的输出特征图;
9、所述卷积门控循环单元模块包括一个convgru2d层和一个二维卷积层,convgru2d层包括40个convgru单元;convgru单元包括更新门和重置门两个门控结构;
10、步骤3,将待预测海域的海表温度数据进行预处理后,输入到测试合格的模型中进行海表温度预测。
11、上述方案中,所述多尺度特征提取模块中,第一条支路中,输入数据首先通过 卷积核大小为1×1×1 的三维卷积层增加通道数量至32,随后通过两个连续的卷积核大小为3×3×3 的三维卷积层进一步提取空间特征,增加感受野以捕捉大尺度的信息,同时利用批标准化层和 relu 函数激活增强非线性表达能力。
12、上述方案中,所述多尺度特征提取模块中,第二条支路中,输入数据首先通过池化窗口大小为3×3×3的最大池化层进行下采样,随后通过卷积核大小为3×3×3的三维卷积层增加通道数量至32,从而捕捉较大尺度的空间特征信息。
13、上述方案中,所述多尺度特征提取模块中,第三条支路中,输入数据首先通过卷积核大小为1×1×1的三维卷积层增加通道数量至32,随后使用卷积核大小为3×3×3的三维卷积层捕捉中等尺度的空间特征信息。
14、上述方案中,所述多尺度特征提取模块中,第四条支路中,输入数据通过卷积核大小为1×1×1的三维卷积层增加通道数量至32,并通过批标准化层和 relu 激活函数来稳定训练过程;四条支路在通道维度进行拼接,合并后的通道数为128。
15、上述方案中,所述位置编码模块首先生成高度和宽度方向上的位置索引,并为每个通道位置生成一个随通道数增加而指数衰减的频率因子;随后,利用这些位置索引与频率因子计算出每个位置的角度值,并基于此角度值计算正弦和余弦函数,从而构造出包含位置信息的编码向量;最后,将高度和宽度上的位置编码相加,并将其与该模块的输入相加,生成最终的综合位置编码张量,这个张量帮助模型空间数据时,能够更有效地识别和利用不同位置的信息。
16、上述方案中,所述通道注意力模块中,输入数据首先经过重塑层将输入张量除通道维度外展平,然后第一个全连接层将输入通道数压缩为原来的1/4,激活函数为relu;第二个全连接层将通道数恢复到原来的数量,激活函数为sigmoid,最后通过重塑层将数据形状进行恢复。
17、上述方案中,所述空间注意力模块中,第一个二维卷积的卷积核大小为3×3,输出通道为原来的1/4,采用relu激活函数;第二个二维卷积的卷积核大小为3×3,输出通道为1,采用sigmoid激活函数。
18、上述方案中,所述位置增强注意力模块的公式如下:
19、;
20、;
21、;
22、式中,为输入张量,位置编码模块,为通道注意力模块,表示空间注意力模块,为通道注意力模块的输入,为空间注意力模块的输入,为位置增强注意力模块的输出;为hadamard积,即两个矩阵在相同位置的元素相乘;+ 表示相加,两个张量在相同位置的值相加起来生成新的张量;
23、其中,通道注意力模块公式如下:
24、;
25、式中,为通道注意力模块的输入,为通道注意力模块;表示sigmoid激活函数;f为relu激活函数;dense为全连接层;re代表reshape层,用来将除通道以外的其他维度展平;
26、空间注意力模块公式如下:
27、;
28、式中,为空间注意力模块的输入,表示空间注意力模块;表示sigmoid激活函数,表示conv2d函数,卷积核大小为3×3,步长为1,采用same填充,b表示批标准化层;
29、relu激活函数公式如下:
30、;
31、sigmoid激活函数公式如下:
32、;
33、式中,x表示输入的海表温度数据,表示激活函数。
34、上述方案中,所述卷积门控循环单元模块中,convgru2d层输出通道数为24,卷积核大小为3×3,步长为1,二维卷积层的卷积核大小为1×1;
35、卷积门控循环单元模块公式如下:
36、;
37、;
38、;
39、;
40、式中,表示更新门,用于控制前一时刻的隐藏状态以及当前时刻的隐藏状态有多少流入当前时刻t的隐藏状态中;
41、表示重置门,用于控制前一时刻的隐藏状态有多少流入当前时刻的候选隐藏状态中;
42、 表示候选隐藏状态,基于当前的输入和上一时刻的隐藏状态计算得出;
43、 表示隐藏状态,当更新门接近1时,来自输入的信息基本上被忽略,convgru倾向于只保留旧状态信息;反之,当更新门接近0时,convgru倾向于保留候选隐藏状态的信息;
44、、、表示权重矩阵,表示sigmoid函数,为hadamard积。
45、通过上述技术方案,本发明提供的基于位置增强型convgru的海表温度预测方法具有如下有益效果:
46、本发明采用多尺度特征提取模块(inceptionv2)提取多尺度特征,引入位置增强注意力模块(peam)结合地理位置信息以增强对关键区域的关注,并利用卷积门控循环单元(convgru)捕捉时间序列数据中的动态变化,最终通过一个1×1的卷积层输出预测结果,构建了一个基于时空增强型convgru的深度学习算法模型(spatio-temporal enhancedconvgru , ste-convgru)。该模型通过多尺度卷积提取sst数据中的多尺度特征,利用位置增强注意力模块为每个位置提供一个唯一的标识符,确保每个时间步和每个位置都带有相应的位置信息,从而帮助模型更好地挖掘各个位置之间的内在联系并充分利用远距离的信息。卷积门控循环单元(convgru)可以捕捉时间序列的长期依赖性,这一设计不仅增强了模型对空间布局的理解,还提高了其在处理具有复杂时空依赖性的数据时的表现。
本文地址:https://www.jishuxx.com/zhuanli/20250110/353090.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表