技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于特征分解重构的城市短期降雨径流污染预测方法与流程 > 正文

一种基于特征分解重构的城市短期降雨径流污染预测方法与流程

国知局
2024-07-31 23:04:00

本发明属于城市水环境污染治理类城市短期降雨径流污染预测，具体涉及一种基于特征分解重构的城市短期降雨径流污染预测方法。

背景技术：

1、城市短期降雨径流污染预报对于城市水环境污染治理和防治具有重要意义，长期以来受到人们的广泛关注。近几十年来，人们提出了大量的降雨径流污染预测模型。这些方法主要分为两类：过程驱动型和数据驱动型。通常，基于过程驱动模型的预测方法需要复杂的数学模型、污染物的迁移转化规律以及大量的水文和气象数据，有时还需要人为判断。由于以上种种因素限制，过程驱动模型在实际应用过程中的预测性能往往较高，模型的不确定性较大。

2、数据驱动模型具有预测周期短、精度高的特点，通常可以满足城市短期降雨径流污染预测的精度和可靠性要求。一些方法采用时间序列平滑技术对水文时间序列进行预测，主要包括自回归模型、自回归滑动平均(arma)模型和自回归综合滑动平均(arima)模型。这些模型假设输入输出序列之间是线性相关的，但是这些输入输出序列之间是高度非线性的。因此，模型忽略了降雨径流序列中隐藏的非线性特征，导致预测性能较差。随着智能算法、分位数回归、逐步聚类分析、人工神经网络(ann等)、决策树(dt)、自适应神经模糊推理系统(anfis)和支持向量机的发展，在降雨径流污染预测中得到了广泛的应用。与传统的回归方法相比，这些方法在预测精度和有效性方面有了很大的提高。然而，这些模型属于“浅层”学习范畴。它们处理输入特性的能力有限。它们容易陷入局部最优或收敛性差、过度拟合和对参数的强烈依赖，这在一定程度上限制了预测模型的实用性和可解释性。

3、深度学习的灵感来自人脑的认知模式，即从多个抽象层中提取信息。长期以来，由于缺乏训练方法和经验，深层网络的权重难以优化，导致相关研究和应用的停滞。无监督深度信念网络的出现解决了上述问题，深度信念网络以其在特征提取、分类识别和拟合预测等方面的优势，在众多领域得到了广泛应用。目前，深度信念网络在语音识别、计算机视觉、文本处理和自然语言处理等领域得到了广泛的应用并取得了良好的效果，但是在城市水环境污染治理领域的应用相对较少。降雨径流污染预测作为机器学习、气象、水文和环境等学科的交叉领域，应用深度学习方法对于提高城市短期降雨径流污染预测具有重要意义。

4、此外，降雨径流污染迁移过程本身的复杂性也是数据驱动模型的另一个难点。仅通过传统预测模型很难准确区分和识别这些特征。越来越多的研究表明，通过选择合适的时频分解技术对预测输入数据进行预处理，可以有效地提取隐藏在复杂水文时间序列中的有用信息，提高数据驱动模型的预测精度。离散小波变换(dwt)、经验模态分解(emd)和集成经验模态分解(eemd)是常用的时频分解方法。其中，离散小波变换具有良好的时频局部化特性，但分解效果取决于基函数的选择，其适应性较差。经验模态分解具有较强的适应性，但也存在一些问题，如终点效应和过度包络。集成经验模态分解是经验模态分解的一种改进方法，可以在噪声辅助下分析信号，并削弱模态混叠现象的影响。但该方法计算量大，模态分量无法控制，容易导致函数不收敛，影响算法的精度。与传统的递归筛选分解模式相比，变分模态分解(vmd)能够将非平稳信号递归地转化为降雨固有频率的一系列正交本征模式函数序列，在多个研究领域得到了广泛应用，例如新能源领域发电预测和国际股票市场分析。然而，变分模态分解在降雨径流污染时间序列中尚未得到应用。

技术实现思路

1、为解决当前存在技术问题，本发明旨在提出一种基于特征分解重构的城市短期降雨径流污染预测方法，用于城市短期降雨径流污染预测。该方法利用变分模态分解将降雨径流污染预测输入数据时间序列分解为一系列具有良好特征的正交本征模式函数序列，降低原始输入序列的复杂性和非平稳性；采用偏自相关函数确定每个正交本征莫斯函数序列的输入变量，提高输出数据的频率分辨率；最后，利用改进粒子群优化算法对深度信念网络的模型参数进行优化，确保模型预测结果能够反映真实的城市短期径流污染变化过程。

2、为了实现上述的技术特征，本发明的目的是这样实现的：一种基于特征分解重构的城市短期降雨径流污染预测方法，包括以下步骤：

3、步骤1，收集典型城市的多源降雨径流污染数据，确定降雨径流污染预测的输入和输出数据，并利用pauta标准对输入数据和输出数据进行预处理；

4、步骤2，利用深度信念网络构建城市短期降雨径流污染预测模型，并采用变分模态分解方法对降雨径流污染预测输入数据进行特征分解与重构，将重构后的降雨径流污染预测输入数据输入到城市短期降雨径流污染预测模型中，预测得到城市在短期降雨之后的径流污染状况；

5、步骤3，设置城市短期降雨径流污染预测模型的初始参数和预测性能评估指标，选取典型城市实际的降雨径流污染观测数据，对城市短期降雨径流污染预测模型进行训练和测试，利用改进粒子群优化算法对城市短期降雨径流污染预测模型的初始参数进行更新和优化，选取降雨径流污染预测性能最好的参数组合作为城市短期降雨径流污染预测模型的参数基；

6、步骤4，利用深度信念网络构建城市短期降雨径流污染预测基准模型，选取不同城市的降雨径流污染真实观测数据，分别利用城市短期降雨径流污染预测模型和城市短期降雨径流污染预测基准模型预测得到不同城市不同降雨条件下的降雨径流污染情况，计算得到两个城市短期降雨径流污染预测模型的性能评估指标，对城市短期降雨径流污染预测模型的预测性能进行评估与分析。

7、所述步骤1具体步骤为：

8、步骤1.1，收集典型城市的降雨径流污染多源数据，其中输入数据主要包括：雨型、平均雨强、峰值雨强、降雨历时、雨前干期、大气降尘量、pm10、车流量、路面材料和功能区；输出数据主要包括：场次降雨径流污染平均浓度emc、初期冲刷指数ff30；

9、步骤1.2，对收集的降雨径流污染多源数据进行预处理，采用pauta标准清理降雨径流污染预测输入和输出数据中的异常值和缺失值，并采用线性变换方法对降雨径流污染预测输入和输出数据进行归一化，将原始的降雨径流污染预测输入和输出数据转换为可计算的格式；

10、步骤1.3，在得到统一格式的降雨径流污染预测输入和输出数据后，将降雨径流污染预测输入和输出数据按照4:1的比例分为训练集和测试集，以便对城市短期降雨径流污染预测模型进行训练和测试，更新城市短期降雨径流污染预测模型的初始参数，得到降雨径流污染预测性能最优的城市短期降雨径流污染预测模型参数组合。

11、所述步骤2具体如下：

12、步骤2.1，采用变分模式分解方法将降雨径流污染预测输入和输出数据时间序列分解为一组子序列，子序列由降雨径流污染预测输入数据的调频信号和调幅信号组成，在子序列分解后通过迭代确定降雨径流污染预测输入数据的参数，并对信号的基频段进行自适应分解；

13、步骤2.2，在完成所有降雨径流污染预测输入数据非平稳信号分解后，依次通过迭代搜索确定各个降雨径流污染预测输入数据变分模型的最优解，确定各个降雨径流污染预测输入数据信号分解后的中心角频率ωk与有限带宽参数α，重复该过程，直到得到所有降雨径流污染预测输入数据信号分解后的中心角频率ωk与有限带宽参数α；

14、步骤2.3，将降雨径流污染预测输入数据各个子序列最优输入特征分别输入到对应的深度信念网络中，在各个深度信念网络中利用降雨径流污染预测输入数据子序列预测得到单个降雨径流污染预测值，融合降雨径流污染预测输入数据各个子序列的降雨径流污染预测结果，融合得到最终的降雨径流污染预测值；

15、所述步骤3具体如下：

16、步骤3.1，在利用多源降雨径流污染序列对降雨径流污染进行模拟之前，将深度信念网络模型中每个受限玻尔兹曼机隐层的学习率设定为0.01，最大迭代次数为1000次，通过改进的粒子群优化算法对各个连接权重进行优化；在训练深度信念网络模型结构时，采用实验误差法逐层选取隐含神经元数，并对不同网络结构的预测效果进行了比较和验证；

17、步骤3.2，确定城市短期降雨径流污染预测模型的预测性能评估指标，以便在城市短期降雨径流污染预测模型训练和测试阶段，各个深度信念网络模型的参数能够得到有效更新和优化，从而得到满足精度要求的城市短期降雨径流污染预测模型；

18、步骤3.3，将多源降雨径流污染预测输入数据输入到城市短期降雨径流污染预测中，利用变分模式分解法对降雨径流污染预测输入数据进行特征分解与重构，然后将降雨径流污染预测输入数据各个子序列最优特征输入到对应的深度信念网络中，对城市短期降雨径流污染预测模型进行训练和测试，确保降雨径流污染预测模型的输出数据：场次降雨径流污染平均浓度emc和初期冲刷指数ff30，能够准确反映真实的降雨径流污染情况。

19、所述步骤4具体为：

20、步骤4.1，利用深度信念网络构建城市短期降雨径流污染预测基准模型，该模型在输入降雨径流污染预测输入数据时，不需要对降雨径流污染输入数据时间序列进行特征分解与重构，利用该基准模型对城市短期降雨径流污染预测模型的降雨径流污染预测性能进行比较与评估；

21、步骤4.2，选取不同城市不同降雨条件下真实降雨径流污染观测数据，分别利用城市短期降雨径流污染预测模型和城市短期降雨径流污染预测基准模型预测得到降雨径流污染预测输出数据：场次降雨径流污染平均浓度emc和初期冲刷指数ff30，计算得到两种降雨径流污染预测模型的预测性能评估指标，对城市短期降雨径流污染预测模型的降雨径流污染预测性能进行评估与分析。

22、所述步骤1.2具体为：

23、步骤1.2.1，对降雨径流污染预测输入数据：雨型、平均雨强、峰值雨强、降雨历时、雨前干期、大气降尘量、pm10、车流量、路面材料和功能区，以及输出数据：场次降雨径流污染平均浓度emc和初期冲刷指数ff30，中的异常值和缺失值进行清理，异常值和缺失值清理采用pauta标准，异常值的计算公式为：

24、voutliers＝[vi>(μ+3θ)∪vi<(μ-3θ)]；

25、式中，μ和θ分别为变量的均值和标准差；

26、步骤1.2.2，为了消除降雨径流污染预测输入和输出数据中数据属性多元和数值差异对降雨径流污染预测性能的影响，采用线性变换方法对降雨径流污染预测输入和输出原始数据进行归一化，其中，某个城市的降雨径流污染预测输入和输出数据包含n个指示符，即包含n个时刻的观测数据：v1、v2、…、vn，每个时刻降雨径流污染预测输入和输出数据共包含m个属性，此处m为12，即降雨径流污染预测输入数据的属性为10，降雨径流污染预测输出数据的属性为2，降雨径流污染预测输入和输出原始数据集可以表示为：

27、

28、式中，n表示指标的个数，m表示每个指标的属性个数；设“max”和“min”分别为指示符的最大值和最小值，这些值通过最小-最大归一化将索引的原始值vij映射到区间[0.1]中的值vi′j；

29、

30、式中，vi′为归一化值，max(vi)和min(vi)分别为样本中的最大值和最小值。

31、所述步骤2.1具体为：

32、步骤2.1.1，依次利用维纳滤波将降雨径流污染预测输入数据非平稳信号分解为调频和调幅的k个信号；其中，对于预处理和归一化后的峰值雨强观测数据，将原始峰值雨强时间序列数据分解为多个子序列，利用维纳滤波依次将各个峰值雨强子序列非平稳信号分解为调频和调幅的k个信号，重复该过程，对其余降雨径流污染预测输入数据进行非平稳信号分解；

33、步骤2.1.2，在完成所有降雨径流污染预测输入数据非平稳信号分解后，依次通过迭代搜索确定各个降雨径流污染预测输入数据变分模型的最优解，确定各个降雨径流污染预测输入数据信号分解后的中心角频率ωk与有限带宽参数α，重复该过程，直到得到所有降雨径流污染预测输入数据信号分解后的中心角频率ωk与有限带宽参数α；

34、步骤2.1.3，最后，对降雨径流污染预测输入数据信号分解后的基频段进行自适应分解，依次得到各个降雨径流污染预测输入数据相应可控数k下的内膜函数。

35、所述步骤2.2具体为：

36、步骤2.2.1，采用部分自相关函数评估降雨径流污染预测各个输入数据之间的相关性和结果；其中，假设xt表示某个降雨径流污染预测输入数据，如果滞后自相关长度k超过95％置信区间则xt-k为降雨径流污染预测输入数据之一，如果所有部分自相关函数的系数都在95％置信区间内，则输入该降雨径流污染预测输入数据该时刻的前一个值用作输入变量，部分自相关函数描述如下：对于降雨径流污染预测输入数据时间序列，滞后k的协方差，如果k＝0，则为方差，γk估计为：

37、

38、式中，为降雨径流污染序列的平均值，m＝n/4为最大滞后系数，k为自相关函数滞后长度，ρk可估计为：

39、

40、步骤2.2.2，根据降雨径流污染预测输入数据的协方差，滞后k(k＝1,2,…,m)时的部分自相关函数，fkk表示为：

41、

42、所述步骤3.1具体为：

43、步骤3.1.1，对于城市短期降雨径流污染预测模型的单个深度信念神经网络模型，初始化一个包含7个输入神经元和1个输出神经元的单隐层深度信念网络模型，对不同的隐层神经元运行10次，计算各个降雨径流污染预测性能指标和平均运行时间；

44、步骤3.1.2，对于单个城市短期降雨径流污染预测模型，将受限玻尔兹曼机1的隐藏神经元数设为18个，再增加一个隐层进行双隐层的深度信念网络模型学习，依次确定受限玻尔兹曼机2和受限玻尔兹曼机3的隐藏神经元数的最优值。

45、所述步骤3.2具体为：

46、步骤3.2.1，在城市短期降雨径流污染预测模型单次训练和测试过程中，基于城市短期降雨径流污染预测模型的输出结果，计算得到降雨径流污染预测结果的平均绝对误差，平均绝对误差计算公式如下：

47、

48、式中，表示降雨径流污染预测值，yi表示降雨径流污染观测值，n表示总的降雨径流污染预测输入数据和输出数据时刻数；

49、步骤3.2.2，在城市短期降雨径流污染预测模型单次训练和测试过程中，基于城市短期降雨径流污染预测模型的输出结果，计算得到降雨径流污染预测结果的均方根误差，均方根误差计算公式如下：

50、

51、式中，表示降雨径流污染预测值，yi表示降雨径流污染观测值，n表示总的降雨径流污染预测输入数据和输出数据时刻数；

52、步骤3.2.3，在城市短期降雨径流污染预测模型单次训练和测试过程中，计算得到降雨径流污染预测结果的纳什-苏克里夫效率系数，纳什-苏克里夫效率系数的计算公式如下：

53、

54、式中，表示降雨径流污染预测值，yi表示降雨径流污染观测值，n表示总的降雨径流污染预测输入数据和输出数据时刻数；

55、步骤3.2.4，根据步骤3.2.1-3.2.3计算得到的降雨径流污染预测性能评估指标，选取降雨径流污染预测性能指标最优的参数组合作为城市短期降雨径流污染预测模型的参数基。

56、所述步骤4.1具体为：

57、步骤4.1.1，采用深度信念网络构建城市短期降雨径流污染预测基准模型，该基准模型不需要对降雨径流污染预测输入数据进行信号分解与重构，直接利用降雨径流污染预测输入数据预测得到降雨径流污染预测输出数据，降雨径流污染预测输入数据包括雨型、平均雨强、峰值雨强、降雨历时、雨前干期、大气降尘量、pm10、车流量、路面材料和功能区，降雨径流污染预测输出数据包括场次降雨径流污染平均浓度emc和初期冲刷指数ff30；

58、步骤4.1.2，采用k个城市不同降雨条件下的真实降雨径流污染观测数据对城市短期降雨径流污染预测模型进行训练和测试；基于深度信念网络的降雨径流污染预测模型进行训练，将深度信念网络模型中每个受限玻尔兹曼机隐层的学习率设定为0.01，最大迭代次数为1000次，通过改进的粒子群优化算法对各个连接权重进行优化；

59、步骤4.1.3，选取降雨径流污染预测值的平均绝对误差、均方根误差和纳什-苏克里夫效率系数作为城市短期降雨径流污染预测基准模型的性能评估指标，在城市短期降雨径流污染预测基准模型单次训练和测试过程中，依次计算得到降雨径流污染预测结果的平均绝对误差、均方根误差和纳什-苏克里夫效率系数，根据最优降雨径流污染预测性能评估指标组合确定城市短期降雨径流污染预测模的参数基。

60、所述步骤4.2具体为：

61、步骤4.2.1，选择j个城市不同降雨条件下的真实降雨径流污染观测数据，对真实降雨径流污染观测数据进行数据预处理，分别将其输入到城市短期降雨径流污染预测模型和城市短期降雨径流污染预测基准模型中，预测得到j个城市不同降雨条件下的降雨径流污染预测值；

62、步骤4.2.2，在得到城市短期降雨径流污染预测模型和城市短期降雨径流污染预测模型的降雨径流污染预测值后，分别计算得到两种降雨径流污染预测模型降雨径流污染预测结果的平均绝对误差、均方根误差和纳什-苏克里夫效率系数，根据这些指标对城市短期降雨径流污染预测模型的降雨径流污染预测性能进行比较与评估。

63、本发明有如下有益效果：

64、基于特征分解重构的城市短期降雨径流污染预测方法对于提高城市短期降雨径流污染预测精度具有重要意义。变分模式分解降低了原始降雨径流污染输入序列的复杂性和非平稳性，偏自相关函数的应用则有助于确定最优降雨径流污染预测输入数据输入特征，改进粒子群优化算法能够确保降雨径流污染预测模型在训练过程中快速获得最优参数组合。