一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于估算海洋温度的方法与流程

2022-03-04 22:55:51 来源:中国专利 TAG:


1.本公开涉及海洋科学技术领域,尤其涉及一种利用深度学习网络 模型来预测海洋温度变化的方法。


背景技术:

2.海表温对区域海洋生态系统健康有着重要影响,其变化趋势可能 导致海洋物种的生长、繁殖和分布范围。大规模海域的超长期海表温 度预测对大尺度海洋物理现象具有重要的指导意义,有助于气候监测、 洪水和干旱风险预警等方面的工作。
3.在全球变暖的大环境下,全球海表温度有一定程度的升高,对局 地气候、海洋生态系统有着重要的影响。现有的海表温度预报为海表 温演变特征、气候现象、天气变化等研究提供了有效的数据参考。目 前的研究采用人工神经网络(ann)、支持向量机(svm)等模型,主要 关注对中小规模海域的短周期预报。
4.因此获取精确的大规模、长周期海表温预测结果仍然是一个重要 的挑战。


技术实现要素:

5.为了解决上述技术问题,本公开提供了一种能够估算海洋温度的 方法,,包括如下步骤:
6.对不同获取途径、预定分辨率的海洋气象数据进行同化处理,以 得到同化数据集
7.将所述同化数据集输入至预设的网络模型中进行训练,以得到估 算模型。
8.进一步,所述估算模型为一卷积网络模型。
9.进一步,所述卷积网络模型在进行膨胀卷积后,卷积核的尺寸公 式如下:
10.k=(k-1)*d 1
11.其中,k是膨胀后的卷积核的尺寸;
12.k是原始的卷积核的大小;
13.d是卷积网络模型中神经网络层的扩张率。
14.进一步,所述海洋气象数据至少包含8个月的数据信息。
15.本公开提供的用于估算海洋温度的方法,通过通过将不同途径获 取的数据进行同化处理,能够得到数量更多、规模更大的海洋气象数 据,从而得以构建具备足够数量和范围的用于训练模型的数据集,进 而能够得到更加精确的估算模型。
附图说明
16.附图1是本发明提供的tcn结构示意图;
17.附图2是本发明不同相关度数据的密集程度示意图;
18.附图3(a)、附图3(b)、附图3(c)、附图3(d)、附图3(e) 表示观测和预测的ssts曲线图;
19.图4(a)和图4(b)表示模型预测与真实值的相关度空间分布 示意图;
伸时间长的特点。本公开选取印度洋上经度(40
°
e-110
°
e)纬度 (-25
°
s-25
°
n)海域的海洋-大气月数据。海温预测问题可归结为时 间序列回归问题,针对以往研究者仅使用海表温度构建时间序列,训 练表层温度预测模型,没有考虑海洋内部海水
30.流动或洋流对海水热传递的影响,导致表层海表温度预测效果不 足的问题,本公开选取特征时充分考虑到各种因素对海表温的影响。
31.表1影响海表温度的81个特征
32.[0033][0034]
本公开选取连续十年的月数据,预测未来5年的海表温度。表1 展示了影响数据点海表温度的可能因素(共81个)也是每个月的数 据,分为大气、海面、海下参数三部分。本公开选取大气的温度(t), 位势高度(gph),垂直速度(w),相对湿度(rh),东西风速(u), 南北风速(v),在不同高度(1000850500300hpa)上的数据,共 24个大气因子。海面参数包含中心点的海面高(ssh),中心点海表 温(sst)及周围15个点(表中用sub1_sst、sub2_sst...sub15_sst 表示)的海表温度,共17个。海下参数包含中心点的不同海深(5,15, 25,35,45,55,65,75,85,95m)的温度和东西方向海流u和南北方向 海流v,盐度(sss),共40个。训练数据集共20*2533条数据,也 称样本数目m,测试数据集,共2533条数据以构成不同获取途径、 预定分辨率的海洋气象数据。本公开以滑动窗口的方式整理训练集。 训练集特征包含从1980年-2008年数据,特征时间跨度为十年,滑动 窗口每次向后滑动一年构成训练集,即用于训练模型的海洋气象数据 集。测试集(即用于测试模型精度的海洋气象数据集)为2004-2013 年海洋大气月数据及对应的2014~2018年的月海表温度,共2533条 数据。
[0035]
接着,采用时域卷积网络(tcn)对海洋大数据进行深度学习, 以获得估算模型。
[0036]
本公开使用tcn体系结构。由于tcn应用了残差连接,膨胀卷 积和因果卷积等多种思想使tcn结构在处理长时序空间问题时更具 优势。残差连接(也就是残差块),能够在一定程度上消除深度网络 部分梯度消失和爆炸的影响。因果卷积通过限制卷积窗口的滑动方向, 使得时刻t的预测y
t
只能通过t时刻之前的输入x1到x
t-1
来判别。膨 胀原本是应用在图像分割领域,在维持输入和输出的维度相同的同时, 减少损失的信息,增大感受野。下面是膨胀卷积后卷积核尺寸公式, k是膨胀后卷积核的尺寸,k为原始卷积核的大小,d是神经网络层 的扩张率:
[0037]
k=(k-1)*d 1
ꢀꢀ
公式1
[0038]
本公开将二维训练集处理成(m,120,81)三维矩阵输入模型,每 个样本是大小为(120,81)的矩阵,120表示时间步长,81表示一个 时间步上的特征,三维矩阵层数为m,m取样本数目。设置卷积核大 小个数分别为8和24,dilations=【1,2,4,8,16,32,64,128,256】,stack=1。 经过实验当卷积核的大小设置为8时,模型的效果最好,这意味着模 型在训练时,最短考虑过去八个月的信息,随着膨胀因子的增加,考 虑的历史时间越来越长。卷积核个数决定了卷积中生成特征图的个数, 特征图上包含了从上一层输出中提取的信息,不同卷积核提取到的信 息不同。当卷积核个数过多时,训练集中一些细小、偶然性的数据扰 动都会被模型学习到,从而影响模型的精度。当卷积核个数过少时, 模型学习特征能力弱。本公开通过设置dilations列表,使输出信息包 含更多历史数据。当dilations设置为1时,采用普通卷积的方式训练 模型。
[0039]
图1展示了一个样本在tcn结构中的运算。本公开使用的网络 结构包含28层卷积运算、1层flatten层和1层全连接层。对输入层 的样本进行一次一维卷积(conv1d)后,输出大小为(120,19)的 矩阵,进入第一个残差块进行运算(红色框)。本公开的tcn模型设 置九个残差块。保留每个残差块的非线性映射结果,和最后一个残差 块卷积结果相加。最后由flatten层和全连接层映射出预测结果(60, 1)图中使两个区域框区分了卷积运算和全连接运算,左边的区域框 为28层卷积运算,右侧的区域狂为flatten层和一层全连接。
[0040]
以2014~2018年预测模型为例,输入模型的训练集为一个(120, 81,50660)的矩阵,训练集中的20%作为验证集,验证集调整模型 参数以得到最优模型,即本公开最终想要得到的估算模型。模型预测 印度洋海盆上有效数据点(2533个)的五年月平均海表温度(60), 输出矩阵大小为(60,2533)。本公开采用了相关度、rmse、acc 以及模型单月预测值和观测值在整体数据集上的表现,来评估tcn 模型在预测2014~2018年月平均海表温度的精度。通过计算每一个数 据点的5年真实ssts时间序列和模型估测ssts时间序列的相关度,画 出了相关度分布图。相关度越高,海表温序列趋势越相似,模型拟合 度越高。其中acc表示了模型在数据点上的平均预测精度。
[0041]
从图2可以看出相关度在0.90~0.97之间的数据点密集,相关度 0.75以下的区间段数据点个数均少于50,可以看出只有少数点的相 关度小于0.75。印度洋上2533个有效数据点的观测ssts序列及模型 估测ssts序列的相关度,都表现为显著的正相关,均大于55%,相 关度在55%~65%区间范围内的数据点仅占数据点总数(2533)的百分 之1.54%,近总数一半的数据点的相关度在85%~95%。数据点的相 关度基本都在75%以上。印度洋海盆数据点的平均相关度为88.23%。 模型对数据点的拟合程度整体上较高。
[0042]
从五个相关度区间随机挑选五个数据点展示真实海温和预测海 温在2014~2018年的变化。模型能够大致拟合(1)、(2)数据点的海 温变化趋势,并且学习到了海温变化的平均趋势,(3)-(5)数据点 在2016年上半年观测真实海温出现异常升高的情况,由于模型趋向 学习一种平均普遍的变化趋势,所以在(3)-(5)数据点对2016年 上半年的海表温预测误差偏大,导致数据点相关度低。
[0043]
从五个相关度区间范围内分别挑选出1个数据点,图3展示5个 数据点的观测ssts序列曲线和预测ssts曲线,ssts序列曲线趋势越接 近,相关度越高。图3(a)、(b)估测ssts时间序列对真实ssts序列 变化趋势拟合度高,相关度高。图3(c)、(d)、(e)的数据点在2015 年6-2016年6月海表温度异常变化,预测与真实海温的误差偏大, 导致数据点相关度降低。
[0044]
图5(a)tcn模型预测ssts时间序列和真实ssts序列相关度, 图5(b)cfsv2模型预测ssts时间序列和本公开使用的真实ssts 序列相关度。整体上看,本公开的tcn模型相关度更高,相关度偏 低的数据点集中在赤道以南到-10
°
s、75
°
e~90
°
e的海域而csfv2模 型在很多区域都出现了相关度偏低的数据点。
[0045]
图4(a)展示了tcn模型预测相关度的空间分布,相关度介于 55%~65%的数据点集中于-7
°
s~-2
°
s,75
°
e~100
°
e之间。位于所研究 的海域的中部的数据点相关度介于66%~75。在印度洋东海岸,
ꢀ‑
10
°
s~-25
°
s的低纬度地区,相关度也偏降低,介于75%~85%之间。 索马里半岛和阿拉伯、印度洋半岛之间的沿海区域以及西部尤其是西 南部海域相关度较高,在85%以上。整体上看,对印度洋海盆ssts 时间序列的拟合度在75%以上,平均相关度为88.23%,证明了我们 的模型具有很好的鲁棒性。
[0046]
图4(b)为美国国家海洋和大气管理局(noaa)在2010年发布 的气候预报系统v2(cfsv2)在2014年-2018年真实值和模型预测 值相关度分布。cfsv2模型对全球海洋表面温度仅进行周期为9个月 的预测。所以本公开每隔9个月选取一个模型,共选取noaa的7 个预测模型。本公开选取csfv2模型在-25.039
°
s~25.039
°
n, 40.312
°
e~109.687
°
e的预测值(分辨率为0.9375
°
x 0.9375
°
),与真实 值(1
°×1°
)比对。本公开挑选出经度为54.375、71.250、88.125、105 和纬度为16.535、-0.472、-16.535的数据点删除以保证noaa中大 部分数据点与真实数据点经纬度靠近。
[0047]
cfsv2预测模型平均相关度为87.27%,本公开tcn模型平均相 关度为88.23%。cfsv2模型个别点的相关度低于0.55,本公开模型 的相关度均高于0.55。从图中可以看出,赤道以北的相关度整体比 cfsv2模型的相关度高可以看出我们的模型预测相关度高,对海表温 时间序列的变化趋势的预测能力更强。需要多个cfsv2模型才能完 成长周期预报,本公开仅用一个模型完成了周期为5年预测,比cfsv2 模型更具有功能性。
[0048]
图5(a)2014~2018年每个月acc折线图,(b)2014~2018年 月rmse折线图。2015年8月到2016年6月的acc小于acc平均 值,和rmse误差曲线图吻合,rmse误差也出现了明显的升高。
[0049]
图5是2014-2018预测模型的rmse、acc的比较,acc平均 值为0.985,rmse误差平均值0.506℃。2015年8月到2016年6 月rmse波动明显,误差偏大,acc较低。这与图3(c)-(e)展 示的海表温预测偏差较大的时期吻和。在其他年份中,误差稳定在 0.3℃~0.5℃之间。
[0050]
本公开对大规模海域进行大尺度时间周期的海表温预测,利用过 去10年海洋及大气观测数据预估未来五年的海表温,通过预测ssts 时间序列相关度和rmse、acc对模型评估。本公开对2014-2018 年海表温进行预测,月平均误差为0.506℃。
[0051]
目前的研究着重在小规模海域的小、中尺度的海表温预报,数据 集分辨率高,而本公开针对大规模海域的大尺度时间周期的预报,数 据集分辨率更低,但是精度更高。
[0052]
本公开的模型对海洋物理现象的预报具有重要的意义也表现在 特征的选择方面。大规模海洋现象受到洋流、海面风和光照等多重因 素的影响。以往的模型特征只包含海表的时变参量(海表温、盐度等), 本公开模型将海洋物理的一些理论与特征选择工程结合,对多源多模 态数据进行建模,特征包含海表温,海下温,流速,大气等因子,学 习多个特征与海表温间的关系,更符合物理现象的研究要求。另外, 以往学习空间位置信息的时候一般采用cnn等卷积网络,以图片的 形式输入模型,计算量大,本公开的tcn模型是输入
数值,进行建 模,计算更简单更快捷。海洋数据体系庞杂,显然本公开的模型更加 适合对海洋数据进行处理。本公开的模型一次性输出五年的海表温时 间序列,比noaa的提前九个月预测的cfsv2模型功能性更强。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献