一种基于混合自注意力机制的植物液流预测方法
- 国知局
- 2024-07-31 23:26:26
本发明属于植物信息监测领域的一种植物液流预测方法,具体涉及了一种基于混合自注意力机制的植物液流预测方法。
背景技术:
1、随着近年来计算机技术不断发展,计算机技术在不同领域都得到了广泛的应用,在智慧农业方面和智慧林业方面,如何更加高效地监测植物状态是一个重要的研究内容,这为制定高效合理的灌溉策略提供了重要的参考依据。此外,评估植物的水分利用状况同样是作为评估植物蒸腾作用的一个重要依据,为分析陆地水循环等科学研究活动提供了一种高效的方案。而传统的评估植物水分利用状况的手段主要是利用植物茎流计来持续地获取植物液流信息,从而进一步获取植物的耗水状况以及蒸腾作用。常用的植物茎流计,如基于热脉冲法(hpv)、热耗散法(td)以及热场变形法(hfd)等的茎流计是依靠热信号来实现植物液流检测的,而且需要在树的茎部钻孔便于将加热器和检测探针放入到植物内部。基于传统检测方法的植物液流检测方案往往会带来较高的检测误差,而且持续的液流监测会带来较高的成本,此外,大范围地部署液流计是不现实的,特别是在估计林分尺度的植物水分利用状况估计的时候,通常是通过科学的方法来选择样本,获取得到每一个样本的液流数据后再进一步评估林分尺度的植物水分利用状况。
2、目前针对植物液流的持续准确获取有两个主要的方面。一方面,部分研究人员从检测原理出发,进一步研究设计更加合理,准确,低成本的茎流计,这需要综合考虑物种,仪器安装,环境影响,树木生长等一系列因素,从而实现液流的准确获取。另一方面,也有部分研究人员尝试利用数据驱动的方式来获取持续的准确的液流指,基于数据驱动的方法可以有效利用已有的植物液流数据以及环境数据来预测准确的液流值,通过将训练好的模型部署在茎流计或环境监测站等设备上可以实现在线的液流值预测或自动校准工作,从而有效提升获取准确液流值的效率。
3、现有的传统液流检测方法存在误差较大,需要及时校准以及频繁更换液流计等问题;而目前基于数据驱动方法的液流预测方法发展还十分有限,模型较难准确获取到数据中的有效特征,此外,还需要依靠一定的专家知识来做特征工程,一定程度上增加了模型的繁琐性,为模型的使用带来了不便性。
技术实现思路
1、为了解决背景技术中存在的局限性以及更加准确的获取持续的植物液流数据,本发明提供了一种基于混合自注意力机制的植物液流预测方法,主要是使用了一种使用混合自注意力机制的transformer模型,可以实现植物液流的准确预测,通过滑动窗口的方式可以实现模型的在线更新从而实现植物液流的长期准确的在线监测。此外,模型采用了端到端的网络结构,因此不需要做额外的特征工程,有效提升了模型的易用性与简便性,适用于解决评估树木一类的植物耗水以及蒸腾作用存在较为复杂的滞后性、检测的误差较大以及持续监测成本较高的问题。
2、本发明采用的技术方案如下:
3、一、一种基于混合自注意力机制的植物液流预测方法
4、步骤1:同步采集植物液流与环境变量的连续时序数据后,获得原始时序数据,接着对原始时序数据预处理后,获得初始数据集;
5、步骤2:通过滑动窗口采样方法对初始数据集进行样本采样后,获得训练样本数据集;
6、步骤3:利用训练样本数据集对混合自注意力机制网络模型进行训练后,获得初始植物液流预测模型;
7、步骤4:在线预测时,将实时的预处理后的环境变量数据输入到当前植物液流预测模型中,模型输出植物液流预测值,同时通过滑动窗口采样方法对植物液流真实值和对应的植物液流预测值取样后再对当前植物液流预测模型进行在线微调并更新,不断进行植物液流的预测和植物液流预测模型的更新,实现植物液流的长期在线监测。
8、所述步骤1中,对原始时序数据预处理包括异常值剔除、空缺值填补、误差校正和标准化操作,以及将植物液流与环境变量的连续时序数据进行时间上的对齐。
9、所述步骤3中,混合自注意力机制网络模型包括卷积模块、时间-位置信息嵌入模块、多个混合注意力模块和全连接神经网络层,混合自注意力机制网络模型的输入均作为卷积模块的输入和时间-位置信息嵌入模块的输入,卷积模块的输出和时间-位置信息嵌入模块的输出拼接后再输入到第一混合注意力模块中,第一混合注意力模块与第二混合注意力模块相连,第二混合注意力模块与全连接神经网络层相连,全连接神经网络层的输出作为混合自注意力机制网络模型的输出。
10、所述时间-位置信息嵌入模块包括并行设置的时间信息嵌入模块和位置信息嵌入模块,混合自注意力机制网络模型的输入同时作为时间信息嵌入模块和位置信息嵌入模块的输入,时间信息嵌入模块的输出和位置信息嵌入模块的输出与卷积模块的输出拼接后再输入到第一混合注意力模块中。
11、所述时间信息嵌入模块将混合自注意力机制网络模型的输入中的多个相邻时间点的时间编码信息相加后获得聚合后的时间信息编码。
12、所述位置信息嵌入模块中采用三角编码方法。
13、所述第一混合注意力模块和第二混合注意力模块均包括维度转换层、第二归一化层、第三归一化层和两个残差自注意力块,混合注意力模块的输入作为第一残差自注意力块的输入,第一残差自注意力块依次经第二归一化层、维度转换层和第二残差自注意力块后与第三归一化层相连,第三归一化层的输出作为混合注意力模块的输出。
14、所述残差自注意力块包括多头自注意力层和前馈神经网络层,残差自注意力块的输入作为多头自注意力层的输入,多头自注意力层与前馈神经网络层相连,残差自注意力块输入的恒等映射与前馈神经网络层的输出拼接后的输出作为残差自注意力块的输出。
15、所述卷积模块包括相连的卷积层和第一层归一化层,卷积模块的输入作为卷积层的输入,第一层归一化层的输出作为卷积模块的输出。
16、所述步骤3中,混合自注意力机制网络模型的训练是采用反向传播算法。
17、二、一种存储介质
18、所述介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法。
19、其中所述的计算机程序为对应实现所述方法的指令。
20、本发明与现有技术相比的有益效果有:
21、1、对原始数据进行了异常值,缺省值处理,最后还对数据做了标准化处理,有效提升了模型的鲁棒性,同时由于去除了不同量纲的影响,方便了模型的更新。
22、2、对原始数据进行了局部时间聚合操作,在面对相同的训练数据的时候,由于对原始时间序列的长度进行了压缩,因此可以有效减少模型的训练参数,加快模型训练速度,有效提升了模型的训练效率与预测效率。
23、3、模型针对时间特征与多变量特征的融合提取,充分发挥了自注意力机制的优势,统一使用了自注意力机制来提取历史时间序列的时间依赖与多变量依赖,保持了模型相对简明的结构,提升了预测的准确率。
24、4、采用了自注意力机制提取数据中所包含的时间信息与多变量信息,可以更加鲁棒地处理长时间依赖问题与非线性依赖问题,从而使模型可以更加有效地应对复杂情况。
25、5、使用了端到端的网络结构,将数据直接输入到模型中便可以得到所需的目标预测数据,而无需做复杂的特征工程,有效提升了模型的易用性。
本文地址:https://www.jishuxx.com/zhuanli/20240730/197567.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。