一种高空间分辨率地下水储量异常模拟方法及系统
- 国知局
- 2024-11-18 18:14:16
本发明涉及一种高空间分辨率地下水储量异常模拟方法及系统,属于地下水水文学、遥感科学、计算机科学等交叉。
背景技术:
1、陆地水储量(terrestrial water storage, tws)是指所有形态的地表和地下水的总和,包括冰雪、土壤水、地下水、地表水和植被水等组成部分。陆地水储量异常数据twsa是指陆地水储量tws的瞬时值与基准值之间的差异,是研究水循环过程中的一个关键变量。
2、grace卫星作为地球重力场监测的杰出工具,在地下水监测领域提供了宝贵的科学数据。然而,其空间分辨率的局限性在一定程度上限制了其在地下水研究中的应用。由于grace的空间分辨率相对较低,它难以捕捉到小尺度的地下水动态变化,这在某些需要对局部地区进行详细监测的研究中构成了一个重要挑战,这意味着在百公里级以及更小尺度的研究区中,grace的监测能力受到一定限制。为了克服这一局限性,研究人员开始探索和应用数据降尺度方法,以从grace数据中提取更多关于小尺度地下水变化的信息。
3、数据降尺度是一种统计或模型方法,用于将较大空间尺度的观测数据转化为较小尺度的信息。在grace卫星地下水监测的背景下,降尺度方法可以帮助更好地理解和解释grace观测到的重力变化,进而推断小尺度的地下水储量变化。统计降尺度方法通常依赖于时间序列分析和统计模型,主要通过建立地面观测数据、气候模型数据与grace数据之间的数学统计关系,在检验这种关系的合理性之后,将其应用于grace数据来实现降尺度过程。机器学习技术的出现极大地推动了统计降尺度技术的发展,赋予了研究人员更有效的工具来处理复杂的地球科学数据,这主要是由于机器学习方法能够在输入参数和目标之间建立非线性关系。利用诸如随机森林、xgboost、和支持向量机等机器学习模型,可以有效地捕捉地面观测或气候模型等高空间分辨率数据与低分辨率grace数据之间复杂的非线性关系。结合可解释性机器学习算法用以解释机器学习模型背后的物理机制,分析各变量对模型性能的贡献以及变量间的相互作用是当前的热点方向。可解释的机器学习算法shap(shapleyadditive explanations)被用于阐明基于多辅助变量的数据训练的降尺度模型,揭示影响水储量变化的主要因素。其主要目标是为模型的特征重要性提供解释,促进对模型预测背后的决策过程的理解。
4、尽管现有关于grace数据降尺度的研究日渐增多,但绝大多数地区的模型构建具备强烈的区域特征,缺少系统性和可泛化性的技术方法,因此,需要探索一种高空间分辨率地下水储量异常模拟方法及系统,为实现grace数据在区域尺度地下水储量的应用方面提供新的研究思路。
技术实现思路
1、鉴于以上技术问题中的至少一项,本发明提出一种高空间分辨率地下水储量异常模拟方法及系统,适应于各个区域的高空间分辨率地下水储量异常模拟。
2、技术方案:为解决上述技术问题,本发明采用的技术方案为:
3、第一方面,一种高空间分辨率地下水储量异常模拟方法,包括:
4、步骤1、对grace数据进行平均化处理,得到平均化处理后的grace数据;其中所述grace数据包括多家机构的原始grace mascon产品;
5、步骤2、整合多源辅助变量数据集,并构建统一时间尺度的高空间分辨率辅助变量数据集与低空间分辨率辅助变量数据集;
6、步骤3、基于所述低空间分辨率辅助变量数据集和所述平均化处理后的grace数据,对机器学习模型进行训练并耦合递归特征消除法rfe得到陆地水储量降尺度模型和辅助变量子集;
7、步骤4、基于所述辅助变量子集,将高空间分辨率辅助变量数据集中对应的辅助变量输入到陆地水储量降尺度模型中,得到降尺度后的高空间分辨率地下水储量异常数据;
8、步骤5、根据降尺度后的高空间分辨率陆地水储量异常数据和全球日值气象数据集gldas中的地表水储量分量,计算得到高空间分辨率地下水储量异常数据。
9、在一些实施例中,步骤1中,对grace数据进行平均化处理,包括:
10、所述grace数据来自于三家grace mascon主要发布机构喷气动力实验室jpl(jetpropulsion laboratory)、美国德克萨斯大学空间研究中心csr(center for spaceresearch)、戈达德空间飞行中心gsfc(goddard space flight center)的原始数据,对所述grace数据进行平均化处理并统一空间分辨率为0.5°×0.5°。
11、在一些实施例中,所述步骤2、整合多源辅助变量数据集,并构建统一时间尺度的高空间分辨率辅助变量数据集与低空间分辨率辅助变量数据集,包括:
12、根据整合得到的多源辅助变量数据集,以辅助变量中的最低分辨率为基准进行统一作为高空间分辨率辅助变量数据集;
13、对所述高空间分辨率辅助变量数据集进行重采样并统一空间分辨率与平均化处理后的grace数据保持一致得到低空间分辨率辅助变量数据集。
14、在一些实施例中,所述多源辅助变量数据集选用来源于terraclimate数据集中的14个水文及气象变量中的帕尔默干旱指数、实际蒸散量、潜在蒸散量、累计降雨量、地表向下短波辐射、最大及最小气温、风速、蒸汽压力,来自全球日值气象数据集gldas中的土壤水分、植物冠层水、地表径流地表水储量异常分量,以及来自noaa的数字高程模型dem数据以及空间坐标信息。
15、在一些实施例中,高空间分辨率辅助变量数据集的空间分辨率为4km×4km,低空间分辨率辅助变量数据集的空间分辨率为0.5°×0.5°。
16、在一些实施例中,辅助变量子集包括帕尔默干旱指数(pdsi)、实际蒸散量(aet)、蒸汽压力(vap)、地表径流(ro)、地表向下短波辐射(sard)、风速(vs)、蒸汽压赤字(vpd)、土壤水分(soil)、累计降雨量(pr)、潜在蒸散量(pet)。
17、在一些实施例中,所述步骤3,基于所述低空间分辨率辅助变量数据集和所述平均化处理后的grace数据,对机器学习模型进行训练并耦合递归特征消除法rfe得到陆地水储量降尺度模型和辅助变量子集,包括:
18、以低空间分辨率辅助变量数据集中的样本作为机器学习模型的输入,以平均化处理后的grace数据作为机器学习模型的输出,对机器学习模型进行训练,并在机器学习模型训练过程中耦合递归特征消除法rfe从低空间分辨率辅助变量数据集中筛选优势变量组合,获取陆地水储量降尺度模型以及输入的辅助变量子集。
19、进一步地,在一些实施例中,在机器学习模型训练过程中耦合递归特征消除法rfe从低空间分辨率辅助变量数据集中筛选优势变量组合,获取陆地水储量降尺度模型以及输入的辅助变量子集,包括:
20、将低空间分辨率辅助变量数据集中所有的辅助变量加入候选特征集;利用候选特征集训练构建得到机器学习模型,并对机器学习模型进行性能评估;
21、通过机器学习模型评估候选特征集中各个特征的重要性,将重要性最低的特征从候选特征集中删除,更新候选特征集;
22、迭代执行以下循环步骤,直至候选特征集中特征数量达到预设的最小值;其中所述循环步骤包括:利用更新后的候选特征集训练重建机器学习模型,并对重建的机器学习模型进行性能评估;利用重建的机器学习模型评估候选特征集中各个特征的重要性;将重要性最低的特征从候选特征集中删除,更新候选特征集;
23、根据所有构建和重建的机器学习模型的性能评估结果,将性能评估结果最好的机器学习模型作为陆地水储量降尺度模型;将用于训练得到性能评估结果最好的机器学习模型的候选特征集作为辅助变量子集。
24、在一些实施例中,所述机器学习模型选自随机森林(random forest,rf) 模型、分布式梯度增强库xgboost (xgb) 模型和lightgbm (lgbm) 模型中至少一种。
25、在一些实施例中,所述步骤5、根据降尺度后的高空间分辨率地下水储量异常数据和全球日值气象数据集gldas中的地表水储量分量,计算得到高空间分辨率地下水储量异常数据,包括:
26、全球日值气象数据集gldas数据集中的地表水储量分量包括土壤水分、植物冠层水、地表径流和融化雪水;
27、根据高空间分辨率地下水储量异常数据、土壤水分、植物冠层水、地表径流和融化雪水,计算得到高空间分辨率地下水储量异常数据;
28、
29、其中,gwsa代表高空间分辨率地下水储量异常数据,twsa代表高空间分辨率陆地水储量异常数据,代表土壤水分,代表植物冠层水,代表地表径流,代表融化雪水。
30、在一些实施例中,所述的方法还包括:步骤6、利用机器学习模型解释算法shap分析各辅助变量对陆地水储量降尺度模型性能的贡献以及变量间的相互作用;
31、shap值的数学表达式为:
32、
33、其中,si表示对于样本xi陆地水储量降尺度模型的输出;i表示第i个样本,j表示每个样本的第j个特征;表示所有样本的平均输出,作为陆地水储量降尺度模型评价的基准;n表示辅助变量的总数。
34、第二方面,提供一种高空间分辨率地下水储量异常模拟系统,包括:
35、grace数据处理模块,用于对grace数据进行平均化处理,得到平均化处理后的grace数据;其中所述grace数据包括多家机构的原始grace mascon产品;
36、辅助变量数据处理模块,用于整合多源辅助变量数据集,并构建统一时间尺度的高空间分辨率辅助变量数据集与低空间分辨率辅助变量数据集;
37、优势变量筛选模块,用于基于所述低空间分辨率辅助变量数据集和所述平均化处理后的grace数据,对机器学习模型进行训练并耦合递归特征消除法rfe得到陆地水储量降尺度模型和辅助变量子集;
38、陆地水储量降尺度模块,用于基于所述辅助变量子集,将高空间分辨率辅助变量数据集中对应的辅助变量输入到陆地水储量降尺度模型中,得到降尺度后的高空间分辨率地下水储量异常数据;
39、地下水储量降尺度模块,用于根据降尺度后的高空间分辨率地下水储量异常数据和全球日值气象数据集gldas中的地表水储量分量,计算得到高空间分辨率地下水储量异常数据。
40、有益效果:本发明将来自多家机构的grace mascon产品进行了平均化处理,降低了单一机构产品由于处理方式不同带来的不确定性,结合多种机器学习模型并耦合rfe算法筛选优势辅助变量组合,建立grace数据与多源辅助变量数据集之间的统计学关系,解决了现有研究中不同研究区的辅助变量差异导致的方法可泛化性差的问题,并结合可解释性机器学习算法,用以解释机器学习模型背后的物理机制,分析各变量对模型性能的贡献以及变量间的相互作用,为grace在区域尺度的地下水研究提供了新的研究思路。
本文地址:https://www.jishuxx.com/zhuanli/20241118/327744.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表