技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于贝叶斯优化的时间序列数据预测方法、装置及设备与流程  >  正文

基于贝叶斯优化的时间序列数据预测方法、装置及设备与流程

  • 国知局
  • 2025-01-17 12:58:09

本发明属于时间序列数据预测,具体涉及一种基于贝叶斯优化的时间序列数据预测方法、装置及设备。

背景技术:

1、时间序列数据预测是数据分析与管理的重要组成部分。准确的时间序列数据预测可以帮助企业有效管理运营,优化资源配置,降低成本。因此,开发一种更为精准和高效的时间序列数据预测方案具有重要意义。例如,时间序列数据预测常用于用户负荷、市场电力价格或股票价格等领域,在调整工商业用户充放电策略(一般工商业用户在短期的生产需求上变化不大,数据整体上波动不大,因此能够建立时间序列预测模型进行用户的负荷预测,为进一步精细化储能的充放电策略提供支持)、参与电网需求响应以及电力市场的现货交易等多个方面具有重要意义。

2、目前,诸如统计分析和基于机器学习等的传统时间序列数据预测方案在处理复杂和非线性时间序列数据时常面临局限,以及不同的深度学习与机器学习模型各具优势和劣势,使得其预测精度高度依赖于超参数的选择。因此,选用合适的超参数至关重要。同时由于不同模型在面对多样的时间序列数据类型时表现不一,有必要通过融合算法来整合多种模型的预测结果,以便有效提高整体预测准确性,进而可利于通过实施来为企业提供更可靠的决策依据。

技术实现思路

1、本发明的目的是提供一种基于贝叶斯优化的时间序列数据预测方法、装置、计算机设备、计算机可读存储介质及计算机程序产品,用以解决传统时间序列数据预测方案所存在预测结果准确性有限的问题。

2、为了实现上述目的,本发明采用以下技术方案:

3、第一方面,提供了一种基于贝叶斯优化的时间序列数据预测方法,包括:

4、获取时间序列历史数据,其中,所述时间序列历史数据包含有在时序上依次连续的个单位时段以及在所述个单位时段中的各个单位时段的历史数据值,表示大于等于3的正整数;

5、对所述时间序列历史数据进行数据清洗处理,得到清洗后时间序列历史数据,其中,所述清洗后时间序列历史数据包含有所述个单位时段以及在所述各个单位时段的清洗后历史数据值;

6、按照如下方式从所述清洗后时间序列历史数据中抽取得到多个样本数据:从所述清洗后时间序列历史数据中抽取在时序上依次连续的个单位时段的清洗后历史数据值作为模型输入项,并从所述清洗后时间序列历史数据中抽取位于所述个单位时段之后且在时序上依次连续的个单位时段的清洗后历史数据值作为模型输出项,然后将所述模型输入项和所述模型输出项作为一个样本数据,其中,表示大于等于2且小于的正整数,表示小于等于的正整数;

7、将所述多个样本数据划分为训练集、验证集和测试集;

8、应用所述训练集分别对基于人工智能算法构建的多个初步时间序列数据预测模型进行模型训练,得到与所述多个初步时间序列数据预测模型一一对应的多个训练后时间序列数据预测模型;

9、应用所述验证集分别对所述多个训练后时间序列数据预测模型的超参数进行贝叶斯优化,得到与所述多个训练后时间序列数据预测模型一一对应的多个优化后时间序列数据预测模型;

10、针对在所述多个优化后时间序列数据预测模型中的各个优化后时间序列数据预测模型,应用所述测试集对相应模型进行性能评估,得到对应的性能评估结果;

11、从所述清洗后时间序列历史数据中抽取在时序上依次连续的最近个单位时段的清洗后历史数据值,并导入在所述多个优化后时间序列数据预测模型中具有最佳性能评估结果的某个优化后时间序列数据预测模型,输出得到位于所述最近个单位时段之后且在时序上依次连续的未来个单位时段的预测数据值。

12、基于上述技术实现要素:,提供了一种基于贝叶斯优化进行多模型融合的时间序列数据预测新方案,即在对时间序列历史数据进行数据清洗处理以得到清洗后时间序列历史数据后,先从该数据中抽取得到多个样本数据并划分为训练集、验证集和测试集,然后应用训练集、验证集和测试集分别依次对基于人工智能算法构建的多个初步预测模型进行模型训练、超参数贝叶斯优化和性能评估,最后应用具有最佳性能评估结果的优化后时间序列数据预测模型进行未来时间序列数据的预测,如此通过利用贝叶斯优化算法对多种时间序列数据预测模型进行模型超参数调整优化,可提升各模型的预测性能,并通过择优选用最佳模型进行预测,能够有效提升时间序列数据预测的准确性、鲁棒性、效率及响应速度,便于实际应用和推广。

13、在一个可能的设计中,对所述时间序列历史数据进行数据清洗处理,得到清洗后时间序列历史数据,包括:

14、针对在所述个单位时段中的各个单位时段,判断在对应时段的历史数据值是否为异常值,若是,则剔除该异常值;

15、针对所述各个单位时段,若在对应时段缺失数据值,则按照如下公式计算得到在对应时段且用于补齐缺失数据值的清洗后历史数据值:

16、

17、式中,表示在位于对应时段之前且不存在数据值缺失情况的在前最近单位时段的历史数据值,表示在位于对应时段之后且不存在数据值缺失情况的在后最近单位时段的历史数据值,表示对应时段的所在时间,表示所述在前最近单位时段的所在时间,表示所述在后最近单位时段的所在时间。

18、在一个可能的设计中,针对在所述个单位时段中的各个单位时段,判断在对应时段的历史数据值是否为异常值,包括:

19、针对在所述个单位时段中的各个单位时段,判断对应的统计分析值是否达到预设阈值,若是,则判定在对应时段的历史数据值为异常值,否则判定在对应时段的历史数据值不为异常值,其中,所述统计分析值按照如下公式计算得到:

20、

21、式中,表示在对应时段的历史数据值,表示在所述时间序列历史数据中的历史数据值的均值,表示在所述时间序列历史数据中的历史数据值的标准差。

22、在一个可能的设计中,在得到清洗后时间序列历史数据之后且在进行样本数据抽取之前,所述方法还包括:

23、针对在所述个单位时段中的各个单位时段,按照如下公式对在对应时段的清洗后历史数据值进行归一化处理:

24、

25、式中,表示在对应时段的清洗后历史数据值的归一化结果,表示在对应时段的清洗后历史数据值,表示在所述清洗后时间序列历史数据中的清洗后历史数据值的最小值,表示在所述清洗后时间序列历史数据中的清洗后历史数据值的最大值。

26、在一个可能的设计中,所述人工智能算法采用基于支持向量机、随机梯度下降法、多变量线性回归、多层感知机、决策树、反向传播神经网络、径向基函数网络、arima、lstm、一维卷积神经网络或随机森林的机器学习算法。

27、在一个可能的设计中,应用所述验证集分别对所述多个训练后时间序列数据预测模型的超参数进行贝叶斯优化,得到与所述多个训练后时间序列数据预测模型一一对应的多个优化后时间序列数据预测模型,包括有如下步骤s61~s67:

28、s61.针对在所述多个训练后时间序列数据预测模型中的某个训练后时间序列数据预测模型,定义对应的超参数空间,以及将对应模型在属于该超参数空间的给定超参数下的均方根误差作为对应的目标函数,然后执行步骤s62;

29、s62.对所述某个训练后时间序列数据预测模型的目标函数进行高斯过程建模,得到高斯过程模型,然后执行步骤s63;

30、s63.从所述某个训练后时间序列数据预测模型的超参数空间中随机选择多个点,并针对在所述多个点中的各个点,应用所述验证集对采用对应点的超参数的所述某个训练后时间序列数据预测模型进行模型评估,得到对应的均方根误差,然后执行步骤s64;

31、s64.利用已评估的点及对应的均方根误差,更新所述高斯过程模型,然后执行步骤s65;

32、s65.根据所述高斯过程模型,选择采集函数来决定在所述某个训练后时间序列数据预测模型的超参数空间中的下一个待评估点,并将使所述采集函数最大的超参数组合作为所述下一个待评估点,然后执行步骤s66;

33、s66.应用所述验证集对采用所述下一个待评估点的超参数的所述某个训练后时间序列数据预测模型进行模型评估,得到所述下一个待评估点的均方根误差,然后执行步骤s67;

34、s67.判断是否满足预设的优化结束条件,若是,则结束贝叶斯优化,并将采用与最小均方根误差对应的已评估点的超参数的所述某个训练后时间序列数据预测模型作为与所述某个训练后时间序列数据预测模型对应的优化后时间序列数据预测模型,否则重复执行步骤s64~s67。

35、在一个可能的设计中,所述方法还包括:

36、应用如第一方面或任一在前可能设计所述的时间序列数据预测方法,根据历史电价时序数据预测得到在未来至少一个单位时段的电价估计值,以及根据用户负荷系统的历史负荷时序数据预测得到所述用户负荷系统在所述未来至少一个单位时段的负荷估计值;

37、根据在所述未来至少一个单位时段的电价估计值,按照如下公式建立储能系统的充放电成本与储能系统功率的函数关系:

38、

39、式中,表示所述充放电成本,表示所述未来至少一个单位时段的时段总数,表示小于等于的正整数,表示在所述未来至少一个单位时段中的第个单位时段的电价估计值,表示在所述第个单位时段的储能系统功率,所述储能系统与所述用户负荷系统存在于同一微电网中且接在同一个变压器下;

40、根据所述储能系统的参数,按照如下公式建立所述储能系统的电池容量损失与储能系统功率的函数关系:

41、

42、式中,表示所述电池容量损失,表示用于控制日历老化的惩罚权重系数,表示用于控制循环老化的惩罚权重系数,表示所述储能系统在所述第个单位时段的电池荷电状态,表示微分算子,表示所述储能系统在所述未来至少一个单位时段中的第个单位时段的电池荷电状态且有表示所述储能系统在位于所述未来至少一个单位时段之前的最近单位时段的电池荷电状态,表示单位时段的时长,表示所述储能系统的储能系统容量,表示所述储能系统在所述第个单位时段的储能系统功率且有表示所述储能系统在所述最近单位时段的储能系统功率;

43、根据所述储能系统的充放电成本及电池容量损失与储能系统功率的函数关系,按照如下公式建立目标函数:

44、

45、式中,表示所述充放电成本的归一化形式,表示所述电池容量损失的归一化形式,和分别表示预设权重系数且有;

46、根据所述用户负荷系统在所述未来至少一个单位时段的负荷估计值、所述变压器的最大允许功率以及所述储能系统的电池荷电状态上下限和储能系统功率上下限,建立所述目标函数的如下约束条件:

47、

48、式中,表示所述用户负荷系统在所述第个单位时段的负荷估计值,表示所述变压器的最大允许功率,表示所述储能系统的电池荷电状态下限,表示所述储能系统的电池荷电状态上限,表示所述储能系统的储能系统功率下限,表示所述储能系统的储能系统功率上限;

49、根据所述目标函数以及所述约束条件,基于优化算法对所述储能系统在所述未来至少一个单位时段的储能系统功率进行优化,得到该储能系统功率且用于使所述目标函数最小化的最优化搜索结果;

50、根据所述最优化搜索结果,在所述未来至少一个单位时段动态调整所述储能系统的储能系统功率。

51、第二方面,提供了一种基于贝叶斯优化的时间序列数据预测装置,包括有时序数据获取单元、数据清洗处理单元、样本数据抽取单元、样本数据划分单元、预测模型训练单元、模型参数优化单元、模型性能评估单元和预测模型应用单元;

52、所述时序数据获取单元,用于获取时间序列历史数据,其中,所述时间序列历史数据包含有在时序上依次连续的个单位时段以及在所述个单位时段中的各个单位时段的历史数据值,表示大于等于3的正整数;

53、所述数据清洗处理单元,通信连接所述时序数据获取单元,用于对所述时间序列历史数据进行数据清洗处理,得到清洗后时间序列历史数据,其中,所述清洗后时间序列历史数据包含有所述个单位时段以及在所述各个单位时段的清洗后历史数据值;

54、所述样本数据抽取单元,通信连接所述数据清洗处理单元,用于按照如下方式从所述清洗后时间序列历史数据中抽取得到多个样本数据:从所述清洗后时间序列历史数据中抽取在时序上依次连续的个单位时段的清洗后历史数据值作为模型输入项,并从所述清洗后时间序列历史数据中抽取位于所述个单位时段之后且在时序上依次连续的个单位时段的清洗后历史数据值作为模型输出项,然后将所述模型输入项和所述模型输出项作为一个样本数据,其中,表示大于等于2且小于的正整数,表示小于等于的正整数;

55、所述样本数据划分单元,通信连接所述样本数据抽取单元,用于将所述多个样本数据划分为训练集、验证集和测试集;

56、所述预测模型训练单元,通信连接所述样本数据划分单元,用于应用所述训练集分别对基于人工智能算法构建的多个初步时间序列数据预测模型进行模型训练,得到与所述多个初步时间序列数据预测模型一一对应的多个训练后时间序列数据预测模型;

57、所述模型参数优化单元,分别通信连接所述样本数据划分单元和所述预测模型训练单元,用于应用所述验证集分别对所述多个训练后时间序列数据预测模型的超参数进行贝叶斯优化,得到与所述多个训练后时间序列数据预测模型一一对应的多个优化后时间序列数据预测模型;

58、所述模型性能评估单元,分别通信连接所述样本数据划分单元和所述模型参数优化单元,用于针对在所述多个优化后时间序列数据预测模型中的各个优化后时间序列数据预测模型,应用所述测试集对相应模型进行性能评估,得到对应的性能评估结果;

59、所述预测模型应用单元,分别通信连接所述数据清洗处理单元和所述模型性能评估单元,用于从所述清洗后时间序列历史数据中抽取在时序上依次连续的最近个单位时段的清洗后历史数据值,并导入在所述多个优化后时间序列数据预测模型中具有最佳性能评估结果的某个优化后时间序列数据预测模型,输出得到位于所述最近个单位时段之后且在时序上依次连续的未来个单位时段的预测数据值。

60、第三方面,本发明提供了一种计算机设备,包括有依次通信连接的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任意可能设计所述的时间序列数据预测方法。

61、第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面或第一方面中任意可能设计所述的时间序列数据预测方法。

62、第五方面,本发明提供了一种计算机程序产品,包括计算机程序或指令,所述计算机程序或所述指令在被计算机执行时实现如第一方面或第一方面中任意可能设计所述的时间序列数据预测方法。

63、上述方案的有益效果:

64、(1)本发明创造性提供了一种基于贝叶斯优化进行多模型融合的时间序列数据预测新方案,即在对时间序列历史数据进行数据清洗处理以得到清洗后时间序列历史数据后,先从该数据中抽取得到多个样本数据并划分为训练集、验证集和测试集,然后应用训练集、验证集和测试集分别依次对基于人工智能算法构建的多个初步预测模型进行模型训练、超参数贝叶斯优化和性能评估,最后应用具有最佳性能评估结果的优化后时间序列数据预测模型进行未来时间序列数据的预测,如此通过利用贝叶斯优化算法对多种时间序列数据预测模型进行模型超参数调整优化,可提升各模型的预测性能,并通过择优选用最佳模型进行预测,能够有效提升时间序列数据预测的准确性、鲁棒性、效率及响应速度;

65、(2)还可解决现有储能系统功率调整方案所存在因优化目标未顾及健康状态而导致储能电芯易老化损耗和容量易衰减的问题;

66、(3)还由于前述容量损失函数中的参数可以灵活调整,使得还可适配不同型号的电芯,确保在多种情况下适配不同储能系统,具有较高使用价值;

67、(4)还可以在微电网中存在发电设备时更新调整约束条件,以便进一步确保在多种情况下适配不同储能系统,便于实际应用和推广。

本文地址:https://www.jishuxx.com/zhuanli/20250117/355857.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。