技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 基于迁移学习的少样本森林可燃物含水率预测方法与流程 > 正文

基于迁移学习的少样本森林可燃物含水率预测方法与流程

国知局
2024-09-14 14:34:01

本发明涉及火险预测，尤其涉及基于迁移学习的少样本森林可燃物含水率预测方法。

背景技术：

1、森林可燃物含水率的预测是森林火灾风险管理中至关重要的一环。然而，由于含水率受到众多因素如气压、湿度、温度和风速等的影响，且这些因素的作用机理复杂，导致目前尚缺乏成熟且广泛适用的预测方法。

2、现有的预测方法主要分为理论建模和经验建模两大类。理论建模虽然基于深入的机理分析，但在实际应用中受限于其复杂的模型结构和众多需要考虑的因素，使得其应用受到较大限制。相对而言，经验建模方法由于依赖历史数据，具有更强的灵活性和实用性，因而得到了更为广泛的应用。

3、在经验建模方法中，一种较为先进的做法是基于实时近红外光谱数据，并结合气压、湿度、温度、风速等环境参数对含水率进行修正。这种方法在小规模实验中表现出了较高的预测准确率。然而，当试图将其推广至更大范围时，却遇到了模型通用性的问题。这是因为不同地区的环境参数对含水率的影响存在明显的空间差异，因此需要在每个地区长期采集数据并训练专门的模型。这不仅耗时耗力，而且使得模型的成本高昂，难以大规模推广。

技术实现思路

1、有鉴于此，本发明提出基于迁移学习的少样本森林可燃物含水率预测方法，以解决现有技术中存在的森林可燃物含水率预测模型的适用性差的问题。

2、本发明具体的技术方案如下：

3、基于迁移学习的少样本森林可燃物含水率预测方法，包括：

4、步骤1，通过林间分布的传感器采集林间的温度、湿度、风速、气压以及可燃物样本的近红外光谱反射率数据，并周期性地在每个传感器分布区域内采集可燃物样本，在实验室中测量每份样本的含水率作为标签数据；

5、步骤2，构建lstm作为特征提取器的多源迁移学习模型；为多个源-目标域对构建单独的子网络，并采用集成学习的思想，将不同子网络的输出值进行算术平均，得到最终的预测结果；

6、步骤3，设计一个由回归损失、mmd损失和差异损失组成的损失函数，其中回归损失用于最小化最终预测值与真实值之间的误差，mmd损失用于对齐源域和目标域之间的分布，差异损失用于减小多个子网络预测值之间的差异；

7、步骤4，在预训练阶段，使用大量源域数据对模型进行预训练，并将训练后的参数传输到目标模型；在模型推理阶段，将新采集的数据输入到训练好的模型中，输出可燃物含水率的预测结果。

8、具体地，步骤1还包括：对采集到的时序数据进行缺失值填补和归一化处理，并以一定时间窗口从预处理后的数据中截取切片作为训练样本。

9、具体地，步骤2还包括：在多源迁移学习模型中采用参数共享和mmd域自适应技术，以减少源域和目标域之间的分布差异。

10、具体地，步骤2还包括：所述多源迁移学习模型包括至少两个用于提取输入时序数据的特征的lstm网络层，以及用于学习源域和目标域的共同特征表示的深域适应层。

11、具体地，步骤4还包括：在微调和重新学习阶段，将多个源-目标域对的数据输入到目标模型，对模型中的参数进行微调，并基于mmd度量优化损失函数，使模型能够提取源域和目标域的共同特征表示。

12、具体地，步骤1中，对于时序数据中的缺失值，采用临近数据的平均值进行填补。

13、具体地，步骤2中还包括：使用两个深度神经网络lstm1和lstm2提取输入时序数据的特征，并将特征输入到深域适应层fc1和fc2。

14、具体地，步骤4还包括：从n个源域中选择的两个源域d s1和d s2被输入到源模型，使用大量源域数据对源模型进行预训练，并将训练后的参数传输到目标模型。

15、具体地，步骤4还包括：多个单独的lstm子网络分别提取源-目标域的时间特征，mmd计算源域和目标域分布之间的距离，并作为损失函数的一部分进行优化，最终对子网络的输出进行平均，得到可燃物含水率的预测结果。

16、具体地，步骤3中，差异损失是通过计算两个子网络输出的目标预测值之间的差值的绝对值来获得的。

17、本发明的有益效果在于：

18、1.低成本复用性：本专利的预测模型具有极高的复用性，允许用户在新地区以极低的成本快速部署并应用。用户仅需在几个具有代表性的地区采集数据并训练出预训练源模型，然后在新目标地区收集短期少量数据，就能基于这些源模型通过快速微调，迅速生成适用于新地区的预测模型。

19、2.多源迁移学习：为了克服场景间数据分布差异导致的negative transfer问题，本专利引入了多源迁移学习方法。这种方法通过利用多个源领域的数据和知识，有效减少了数据分布差异对模型性能的影响，从而确保了模型在不同地区都能保持良好的预测性能。

20、3.综合损失函数：在模型微调和重新学习阶段，本专利设计了一个包含回归损失、差异损失和mmd(最大均值差异)的总损失函数。这个损失函数能够充分利用与目标领域数据分布相近的多个源领域的知识，通过优化这些损失项，显著提升模型在目标域内的预测准确性。

21、4.集成学习方法：为了进一步提升预测准确性，本专利采用了集成学习技术。通过综合多个子网络的预测结果，集成网络能够提供更稳定、更准确的预测结果。与单个网络相比，集成网络能够更好地应对数据噪声和模型不确定性，从而提高预测的可靠性。

技术特征：

1.基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，包括：

2.如权利要求1所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤1还包括：对采集到的时序数据进行缺失值填补和归一化处理，并以一定时间窗口从预处理后的数据中截取切片作为训练样本。

3.如权利要求1所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤2还包括：在多源迁移学习模型中采用参数共享和mmd域自适应技术，以减少源域和目标域之间的分布差异。

4.如权利要求1所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤2还包括：所述多源迁移学习模型包括至少两个用于提取输入时序数据的特征的lstm网络层，以及用于学习源域和目标域的共同特征表示的深域适应层。

5.如权利要求1所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤3中：回归损失用于最小化最终预测值与真实值之间的误差，mmd损失用于对齐源域和目标域之间的分布，差异损失用于减小多个子网络预测值之间的差异。

6.如权利要求1所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤1中，对于时序数据中的缺失值，采用临近数据的平均值进行填补。

7.如权利要求4所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤2中还包括：使用两个深度神经网络lstm1和lstm2提取输入时序数据的特征，并将特征输入到深域适应层fc1和fc2。

8.如权利要求1所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤4还包括：从n个源域中选择的两个源域d s1和d s2被输入到源模型，使用大量源域数据对源模型进行预训练，并将训练后的参数传输到目标模型。

9.如权利要求1所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤4还包括：多个单独的lstm子网络分别提取源-目标域的时间特征，mmd计算源域和目标域分布之间的距离，并作为损失函数的一部分进行优化，最终对子网络的输出进行平均，得到可燃物含水率的预测结果。

10.如权利要求1所述的基于迁移学习的少样本森林可燃物含水率预测方法，其特征在于，所述步骤3中，差异损失是通过计算两个子网络输出的目标预测值之间的差值的绝对值来获得的。

技术总结本发明公开了基于迁移学习的少样本森林可燃物含水率预测方法，该方法包括：通过林间分布的传感器采集林间的温度、湿度、风速、气压以及可燃物样本的近红外光谱反射率数据，并周期性地在每个传感器分布区域内采集可燃物样本，测量每份样本的含水率作为标签数据；构建LSTM作为特征提取器的多源迁移学习模型；为多个源‑目标域对构建单独的子网络，并采用集成学习的思想，将不同子网络的输出值进行算术平均，得到最终的预测结果；在模型推理阶段，将新采集的数据输入到训练好的模型中，输出可燃物含水率的预测结果。本发明实现了可燃物湿度预测模型在不同地区的高效、低成本复用，有效解决了以往预测模型在不同地域场景下性能下降的问题。技术研发人员：王永受保护的技术使用者：合肥恒宝天择智能科技有限公司技术研发日：技术公布日：2024/9/12