一种拉尼娜现象的预测方法和系统
- 国知局
- 2024-07-31 23:20:32
本发明属于大气科学领域,具体涉及一种拉尼娜现象的预测方法和系统。
背景技术:
1、拉尼娜是指赤道附近东太平洋水温反常下降的一种现象,其特点是东太平洋明显变冷,同时也伴随着全球性气候的变化。拉尼娜现象的出现可能导致我国出现冷冬热夏、南旱北涝等气候异常,同时也会增加登陆中国的热带气旋的数量。这对农业生产、交通运行、居民生活等都可能产生不利影响,因此准确预测拉尼娜现象具有重要意义。而拉尼娜系数反映拉尼娜的严重程度和周期性,因此拉尼娜系数的变化可以预示该现象的发展趋势。
2、用于拉尼娜预测的cmip数据来源于历史观测、气候模拟实验、数值计算和物理模拟,但历史观测不充分、实验缺陷或建模错误可能导致模拟结果与实际情况存在系统性偏差。an等[1]分析了cmip5的10个模式,发现大多数模式低估了海温的非线性效应,只有少数模式在观测中显示热带东太平洋海温正偏。tang等[2]指出,cmip5的系统偏差会降低预测太平洋海表温度变化及其相关的极端拉尼娜频率的可靠性。cmip6对拉尼娜过程的模拟进行了改进,但仍然存在不可忽略的误差。因此直接使用整个cmip5/6数据作为训练集,不仅会携带脏数据,使物理模型冗余,导致预测偏差,而且会消耗大量的时间和计算资源。而数据在时间、空间、质量等方面的筛选,因为气象数据本身的超大体量,如果采用人工手动筛选将会是极大的工作量。
3、当前,预报拉尼娜现象的方法主要包括基于观测数据的统计模型、基于物理模型的数值模拟和基于机器学习的模型等。
4、基于观测数据的统计模型:这种方法简单易行,但准确性受到观测数据质量的限制。由于海洋观测数据获取困难,数据缺失或质量不高可能导致预测结果的不准确。
5、基于物理模型的数值模拟:该方法使用海洋-大气耦合模型进行预测,考虑了多种气候因素的影响。然而,这种模型的建立和求解过程相对复杂,需要大量的计算资源和专业知识。此外,拉尼娜现象涉及到多个复杂的相互作用和反馈机制,模型的不确定性较高。
6、基于机器学习的模型:这种方法利用机器学习算法对历史数据进行学习,并预测拉尼娜现象。它能够处理大量复杂的数据,但其准确性受到数据质量和特征选取的影响。同时,机器学习模型需要大量的训练数据,如果数据量不足或数据特征选取不合理,可能导致预测结果的偏差。
7、综上所述,当前的预报拉尼娜现象的方法在数据质量、复杂性和不确定性、模型复杂度、数据特征选取等方面存在一定的不足或缺陷。
技术实现思路
1、为解决现有技术中存在的问题,本发明提出了一种拉尼娜现象的预测方法和系统。
2、本发明的技术方案如下:
3、一种拉尼娜现象的预测方法,该方法包括:
4、对历史拉尼娜气象资料进行数据提取,形成包含数值模式、气象要素以及拉尼娜系数真值的若干备选样本;
5、基于数值模式与拉尼娜现象的相关性,进行数值模式维度的备选样本筛选;基于气象要素与拉尼娜现象的相关性,进行气象要素维度的备选样本筛选,并以筛选出的备选样本作为训练样本,构建样本集;
6、以样本集中各训练样本中的数值模式以及气象要素作为输入数据,并以每一训练样本中的拉尼娜系数真值作为标签,对预先构建好的神经网络预测模型进行训练,再利用训练好的神经网络预测模型输出对应当前数值模式、气象要素的拉尼娜系数预测值,完成拉尼娜现象的预测。
7、进一步地,所述基于数值模式与拉尼娜现象的相关性,进行数值模式维度的备选样本筛选的具体过程包括:
8、对时空匹配的备选样本进行分类,形成m类备选样本,每一类备选样本中数值模式、气象要素的时空相匹配;
9、构建神经网络筛选模型,分别采用每一类备选样本对神经网络筛选模型进行训练,得到每一类备选样本对应的神经网络筛选模型,训练时以备选样本中的数值模式、气象要素作为输入数据并以拉尼娜系数真值作为标签;
10、利用训练好的每一类备选样本对应的神经网络筛选模型对应输出每一类备选样本下数值模式以及气象要素的拉尼娜系数预测值,并计算每一类备选样本下各备选样本对应的拉尼娜系数预测值与拉尼娜系数真值之间误差,作为该类备选样本所对应的数值模式与拉尼娜现象的相关性系数,筛选出相关性系数最小的前h1类备选样本。
11、进一步地,所述气象要素包括多类别数据。
12、进一步地,所述气象要素包括海表温度数据、热含量数据、纬向风数据和经向风数据。
13、进一步地,所述基于气象要素与拉尼娜现象的相关性,进行气象要素维度的备选样本筛选的具体过程包括:
14、获取各备选样本中气象要素的每一类数据与拉尼娜系数真值的相关系数的均值,筛选出均值最高的前h2类数据。
15、进一步地,所述基于数值模式与拉尼娜现象的相关性,进行数值模式维度的备选样本筛选;基于气象要素与拉尼娜现象的相关性,进行气象要素维度的备选样本筛选,并以筛选出的备选样本作为训练样本,构建样本集的具体步骤为:
16、步骤1.1)定义用于存储备选样本中数值模式、气象要素的数据集cmd(h,elem,year,month,lat,lon),其中,h为数值模式序号,h∈[1,h],h为数值模式总数,h取正整数;elem为气象要素;year为年份;month为月份;lat为经度;lon为纬度;
17、备选样本中拉尼娜系数真值记为lanina_idx(year,month)并与数据集cmd(h,elem,year,month,lat,lon)相对应,形成数据对;
18、步骤1.2)对时空匹配的备选样本进行分类,形成m类备选样本,根据每一类备选样本中对应的数值模式,构建由m个长度为h的列表组成的列表集ax(m,h),m为正整数,m∈[1,m];列表集ax(m,h)中的元素取0或1,其中,取1时表示该元素用于模型的训练,取0时表示该元素不用于模型的训练;对列表集ax(m,h)中的元素进行随机的初始化赋值,并且使赋值为0与赋值为1的元素个数相等或相差3以内;
19、构建神经网络筛选模型model_1,神经网络筛选模型model_1的输入数据为数据集cmd(h,elem,year,month,lat,lon),标签为与数据集相对应的拉尼娜系数真值lanina_idx(year,month);
20、步骤1.3)对所述神经网络筛选模型model_1进行m次训练,每次训练采用列表集中每个列表下赋值为1的元素对应的备选样本,形成对应每个列表的训练完成的神经网络筛选模型,基于每个列表的神经网络筛选模型,输出对应每一列表元素对应的备选样本的拉尼娜系数预测值,
21、步骤1.4)获取每一列表的对应的拉尼娜系数预测值与拉尼娜系数真值之间的、用于表示数值模式与拉尼娜现象的相关性的误差st;再对所有列表的误差st进行由小到大的排序,若m为偶数保留前的列表到列表集ax2,否则保留的列表到列表集ax2(m,h),m∈[1,m′],h∈[1,h];
22、步骤1.5)对列表集ax2(m,h)采用均匀随机抽样,随机抽样该列表集中两个列表ax2(a,h)和ax2(b,h),a∈[1,m′],b∈[1,m′];随机选取该两个列表中对应位置的元素ax2(a,c)和ax2(b,c)并将该两个元素的值进行互换,c∈[0,h];
23、步骤1.6)重复k1次步骤1.6)由此生成新的列表集ax(m,h),m∈[1,m′],h∈[1,h];
24、步骤1.7)对列表集ax3采用均匀随机抽样,随机选取一个列表并用随机选取该列表中的元素ax3(d,e),使该元素的值进行由0到1或由1到0的转变,转变概率为i,i为一个小数,i∈(0,1);生成新的列表集ax4(m,h),上述d∈[0,m′),e∈[0,h);对列表集ax4(m,h)中所有列表的误差st进行由小到大的排序;
25、步骤1.8)不断循环步骤1.3)~步骤1.7),若连续三次循环中列表集ax4(m,h)中最小误差st没有减小,则取列表集ax4(m,h)中第一个列表并根据该列表中的与数据集cmd(h,elem,year,month,lat,lon)中对应的元素构建数据集cm;
26、步骤1.9)选择数据集cm中各元素对应的备选样本中气象要素的每一类数据与拉尼娜系数真值的相关系数的均值,筛选出均值最高的前h2类数据。
27、进一步地,所述神经网络预测模型包括sam模块、二维卷积、标准化层、convnextblock网络、池化层、标准化层、sam模块;所述convnextblock网络包括第一convnextblock模块、第一下采样模块、第二convnextblock模块、第二下采样模块、第三convnextblock模块、第三下采样模块、第四convnextblock模块。
28、一种拉尼娜现象的预测系统,该系统包括备选样本生成模块、样本集构建模块和训练与预测模块;
29、所述备选样本生成模块,用于对历史拉尼娜气象资料进行数据提取,形成包含数值模式、气象要素以及拉尼娜系数真值的若干备选样本;
30、所述样本集构建模块,用于基于数值模式与拉尼娜现象的相关性,进行数值模式维度的备选样本筛选;基于气象要素与拉尼娜现象的相关性,进行气象要素维度的备选样本筛选,并以筛选出的备选样本作为训练样本,构建样本集;
31、所述训练与预测模块,用于以样本集中各训练样本中的数值模式以及气象要素作为输入数据,并以每一训练样本中的拉尼娜系数真值作为标签,对预先构建好的神经网络预测模型进行训练,再利用训练好的神经网络预测模型输出对应当前数值模式、气象要素的拉尼娜系数预测值,完成拉尼娜现象的预测。
32、相比于现有技术本发明具有如下有益效果:
33、本发明提出一种拉尼娜现象的预测方法和系统,该预测方法通过对历史数据进行数值模式维度以及气象要素维度的筛选,并形成样本集对神经网络模型进行训练,以训练完成的神经网络模型进行拉尼娜现象的预测。该预测方法多维数据筛选的设计提高训练数据质量、改进模型的复杂度和准确性,该预测方法优化机器学习模型的训练和特征选取方法,以提高拉尼娜预报的准确性和可靠性。
本文地址:https://www.jishuxx.com/zhuanli/20240730/197091.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表