技术新讯 > 计算推算,计数设备的制造及其应用技术 > 交易量预测模型的训练方法及装置、交易量预测方法及装置、电子设备及计算机可读存储介质与流程  >  正文

交易量预测模型的训练方法及装置、交易量预测方法及装置、电子设备及计算机可读存储介质与流程

  • 国知局
  • 2024-09-19 14:39:13

本技术涉及交易量预测,尤其涉及一种交易量预测模型的训练方法及装置、交易量预测方法及装置、电子设备及计算机可读存储介质。

背景技术:

1、银行作为金融机构的代表,其日常业务涉及到大量的交易活动。银行每日交易量的准确预测对于银行的业务管理、政策制定和风险控制具有重要意义。传统的预测方法主要依靠统计学方法,如时间序列分析等。这些方法虽然简单易行,但是在预测精度和泛化能力方面存在一定的局限性。

2、随着深度学习技术的不断发展,利用该技术进行银行交易量预测已经成为了一种趋势。深度学习技术能够自动从数据中学习规律和模式,从而实现对未来数据的预测。在银行交易量预测中,深度学习技术可以利用历史交易数据进行训练,学习交易量与各种因素之间的关系,然后利用学习到的模型对未来的交易量进行预测。深度学习技术相比传统的预测方法具有更高的准确性和更好的泛化能力,能够更好地应对交易量的复杂变化。

3、目前,自回归移动平均模型(autoregressive integrated moving averagemodel,arima)、广义arch模型(generalized autoregressive conditionalheteroskedast,garch)模型、深度学习神经网络模型等都是常用且能有效捕捉数据之间时序关系、推测未来数据走势的时序模型。

4、arima是在自回归模型的基础上演化而来的,其主要通过差分的形式将历史数据中的实际信号与噪声分离,进而利用实际信号预测未来值。金融领域中,garch模型也是常用的一种模型,其目的是利用金融数据,探索波动率变化的时序统计模型,其主要原理是利用历史波动率数据来预测未来波动率,进而估计数据未来发展趋势。随着深度学习的发展,利用神经网络模型进行预测的越来越多,该技术通过对历史交易数据进行训练,学习交易量与各种因素之间的关系,然后利用学习到的模型对未来的交易量进行预测。例如,现有技术中提供了一种基于神经网络的商户日交易量预测方法及系统,该方案构建了一个由3层全连接层组合而成的神经网络模型,在数据处理方面,将每日交易量变化率、目标日期交易量变化率、交易量平均变化率和下一日日期输入到神经网络模型中进行训练,通过在预测方法中考虑日期因素,根据交易量变化趋势与日期之间的对应关系进行交易量预测,一定程度上提高了预测精准度,降低了预测偏差。

5、然而,上述几种方案仍然存在如下的缺点:

6、arima模型十分简单,只需要内生变量而不需要借助其他外生变量,但是该模型对数据要求比较严格,它要求时序数据基本稳定,并且它只能够捕捉数据的线性关系,不能捕捉数据的非线性关系,所以具有一定局限性。

7、garch模型需要假设金融时间序列中的波动率是随时间变化的,并且具有自回归的特性,这使得一般金融数据集很难满足。

8、基于神经网络的商户日交易量预测方法及系统应用深度学习技术进行预测,构建的预测模型由3层全连接神经网络搭建而成,存在的主要问题有:1)模型训练参数太多,会极大地增加训练时长;2)每个神经元都作为了输入,可能会存在极大的噪声,导致模型的过拟合。

技术实现思路

1、本技术实施例提供了一种交易量预测模型的训练方法及装置、交易量预测方法及装置、电子设备及计算机可读存储介质,以提高银行交易量预测的准确性和泛化能力,为银行业务管理和风险控制提供更好的支持。

2、本技术实施例采用下述技术方案:

3、第一方面,本技术实施例提供一种交易量预测模型的训练方法,所述交易量预测模型的训练方法包括:

4、获取原始交易量数据;

5、对所述原始交易量数据进行特征提取和处理,得到处理后的交易量特征;

6、将所述处理后的交易量特征输入交易量预测模型,得到交易量预测结果和对应的预测损失,所述交易量预测模型的隐藏层包括多层lstm层,多层lstm层以深度循环网络的方式堆叠连接;

7、根据所述交易量预测结果对应的预测损失更新所述交易量预测模型的参数,得到训练后的交易量预测模型。

8、可选地,所述对所述原始交易量数据进行特征提取和处理,得到处理后的交易量特征包括:

9、对所述原始交易量数据进行特征提取,得到提取出的交易量特征;

10、对提取出的交易量特征进行预处理,得到预处理后的交易量特征,所述预处理包括补充缺失值、编码变换、归一化以及标准化处理中的至少一种。

11、可选地,所述处理后的交易量特征为当日的交易量特征,所述多层lstm层为n层,n为大于1的整数,所述交易量预测模型的隐藏层还包括全连接层,所述将所述处理后的交易量特征输入交易量预测模型,得到交易量预测结果和对应的预测损失包括:

12、将所述当日的交易量特征和上一日的第一层输出向量输入多层lstm层中的第一层lstm层,得到当日的第一层输出向量;

13、将当日的第n-1层输出向量和上一日的第n层输出向量输入第n层lstm层,得到当日的多层lstm层的最终输出向量;

14、将当日的多层lstm层的最终输出向量输入所述全连接层,得到全连接层的输出向量;

15、根据所述全连接层的输出向量确定所述交易量预测结果和对应的预测损失。

16、可选地,所述交易量预测模型的隐藏层还包括注意力层,所述将所述处理后的交易量特征输入交易量预测模型,得到交易量预测结果和对应的预测损失包括:

17、将所述处理后的交易量特征输入多层lstm层,得到多层lstm层的最终输出向量;

18、将多层lstm层的最终输出向量输入所述注意力层,得到注意力层的输出向量;

19、将所述注意力层的输出向量输入所述全连接层,得到全连接层的输出向量;

20、根据所述全连接层的输出向量确定所述交易量预测结果和对应的预测损失。

21、可选地,所述将多层lstm层的最终输出向量输入所述注意力层,得到注意力层的输出向量包括:

22、根据所述多层lstm层的最终输出向量和对应的注意力权重,采用加权平均池化的方式确定注意力层的输出向量。

23、可选地,所述处理后的交易量特征为当日的交易量特征,所述多层lstm层包括第一层lstm层和最后一层lstm层,所述隐藏层还包括bi-gru层和全连接层,所述bi-gru层用于替换多层lstm层中的中间层lstm层,所述将所述处理后的交易量特征输入交易量预测模型,得到交易量预测结果和对应的预测损失包括:

24、将所述当日的交易量特征和上一日的第一层输出向量输入多层lstm层中的第一层lstm层,得到当日的第一层输出向量;

25、将当日的第一层输出向量和上一日的第二层输出向量输入bi-gru层,得到当日的bi-gru层的输出向量;

26、将所述当日的bi-gru层的输出向量和上一日的最后一层输出向量输入最后一层lstm层,得到当日的最后一层lstm层的输出向量;

27、将当日的最后一层lstm层的输出向量输入所述全连接层,得到全连接层的输出向量;

28、根据所述全连接层的输出向量确定所述交易量预测结果和对应的预测损失。

29、可选地,所述根据所述交易量预测结果对应的预测损失更新所述交易量预测模型的参数,得到训练后的交易量预测模型包括:

30、根据所述交易量预测结果对应的预测损失,利用预设自适应优化算法更新所述交易量预测模型的参数,得到训练后的交易量预测模型。

31、第二方面,本技术实施例还提供一种交易量预测方法,所述交易量预测方法包括:

32、获取待预测的交易量数据;

33、对所述待预测的交易量数据进行特征提取和处理,得到处理后的待预测交易量特征;

34、将所述处理后的待预测交易量特征输入交易量预测模型,得到交易量预测结果;

35、其中,所述交易量预测模型基于前述任一项所述交易量预测模型的训练方法训练得到。

36、第三方面,本技术实施例还提供一种交易量预测模型的训练装置,所述交易量预测模型的训练装置包括:

37、第一获取单元,用于获取原始交易量数据;

38、第一特征处理单元,用于对所述原始交易量数据进行特征提取和处理,得到处理后的交易量特征;

39、输入单元,用于将所述处理后的交易量特征输入交易量预测模型,得到交易量预测结果和对应的预测损失,所述交易量预测模型的隐藏层包括多层lstm层,多层lstm层以深度循环网络的方式堆叠连接;

40、更新单元,用于根据所述交易量预测结果对应的预测损失更新所述交易量预测模型的参数,得到训练后的交易量预测模型。

41、第四方面,本技术实施例还提供一种交易量预测模型的训练装置,所述交易量预测模型的训练装置包括:

42、第二获取单元,用于获取待预测的交易量数据;

43、第二特征处理单元,用于对所述待预测的交易量数据进行特征提取和处理,得到处理后的待预测交易量特征;

44、预测单元,用于将所述处理后的待预测交易量特征输入交易量预测模型,得到交易量预测结果;

45、其中,所述交易量预测模型基于前述任一项所述交易量预测模型的训练方法训练得到。

46、第五方面,本技术实施例还提供一种电子设备,包括:

47、处理器;以及

48、被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行前述之任一交易量预测模型的训练方法,或者执行前述交易量预测方法。

49、第六方面,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行前述之任一交易量预测模型的训练方法,或者执行前述交易量预测方法。

50、本技术实施例采用的上述至少一个技术方案能够达到以下有益效果:本技术实施例的交易量预测模型的训练方法,先获取原始交易量数据;然后对原始交易量数据进行特征提取和处理,得到处理后的交易量特征;之后将处理后的交易量特征输入交易量预测模型,得到交易量预测结果和对应的预测损失,交易量预测模型的隐藏层包括多层lstm层,多层lstm层以深度循环网络的方式堆叠连接;最后根据交易量预测结果对应的预测损失更新交易量预测模型的参数,得到训练后的交易量预测模型。本技术实施例的交易量预测模型的训练方法一方面引入lstm神经网络层替换部分全连接层,能够学习到更多时序信息,进而得到更优的模型,且参数相比现有方案的全连接层更少,减少了时间成本,另一方面在原始lstm模型的基础上进行了拓展,构建多层lstm层网络结构用于交易量时序序列的预测,由于深层体系结构具有更紧凑的表示形式,因此提高了模型的预测性能和泛化效果。

本文地址:https://www.jishuxx.com/zhuanli/20240919/299412.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。