技术新讯 > 计算推算,计数设备的制造及其应用技术 > 结合LSTM与多图卷积神经网络的选股方法及系统  >  正文

结合LSTM与多图卷积神经网络的选股方法及系统

  • 国知局
  • 2025-01-10 13:14:01

本发明属于数据处理领域,尤其涉及一种结合lstm与多图卷积神经网络的选股方法及系统。

背景技术:

1、随着经济发展水平提高,金融市场日渐扩大,股票因其潜在的高额回报率而备受投资者亲睐,已经成为最具吸引力的投资选择之一。股票投资者能否获得利润本质上取决于所选股票价格在未来会上升,因此,能否有效预测股票的未来价格和走势至关重要。

2、量化投资通过建模方式使这一过程变得更加科学,后来随着信息化时代的到来和人工智能技术发展,更多算法被用于股票预测。通过大量数据捕获各种股票特征,如历史价格数据、交易量等,与收益回报之间的关系,进而实现有效的股票收益率预测,并根据预测结果选择股票,最终获得超额投资回报。

3、目前用于股票预测的深度学习模型仍存在着一些问题,首先在进行股票预测时只考虑到股票价格与其历史数据序列的关系。可是在现实市场中,股票并非独立存在,它们之间存在大量关联,例如,处于竞争关系的两家公司,股票价格呈现此消彼长的状态,而具有供应关系的公司,股价很可能呈现同样的变化趋势。其次,基于股票关系图的方法,通常都以静态关系图为基础,根据先验知识构建股票关系图,无法准确反映股票关系的变化。并且,生成的关系图只从某个单一角度出发(比如行业关系,wiki关系,投资关系),不能充分包含股票间的所有关系。

4、lstm是rnn的一种变体,最初被提出是为了解决rnn在反向传播过程中容易产生梯度消失或梯度爆炸的问题,能够很好地捕捉和利用长期的时间序列依赖关系。它通过输入门、输出门和遗忘门,可以自动对信息进行筛选,忽略无效部分,保留重要信息。股票价格被看作为一种典型的时间序列。而lstm模型能够很好地捕获序列长期依赖关系,在保留原始数据趋势特征的情况下,降低数据复杂度。因此在金融领域被广泛应用。

5、有效市场假说证明,股票价格可以完全反映市场信息。基于此观点,通过计算股票历史价格序列间的关系,可以动态反应股票间的关系。attention可以自适应地关注输入信息的重要性,可以更加有效整合根据不同角度出发所计算得到的关系图对不同股票的重要程度,获得一张更加完成的股票关系图。图上顶点表示股票节点,而边值表示每对股票间相关性的强度。gcn是一种广泛应用于图上的深度学习方法,它通过对图中相邻节点进行聚合,捕获节点间的关系,并为每个节点生成新的特征表示,从而实现节点间的交叉信息影响,得到股票相互作用后的结果。

6、在进行股票预测的过程中,股票价格不仅与其自身的历史序列有关,还会受到其他相关股票的影响。因此,借助lstm对于时间序列长期依赖关系的处理能力和多图卷积神经网络对于相邻节点关系的捕获能力,可以更加全面地获取市场信息,从而实现准确且高效地股票数据分析和预测,得到一种新的量化选股方法。

技术实现思路

1、本发明的目的在于解决现有技术中存在的问题,并提供一种结合lstm与多图卷积神经网络的选股方法及系统,本发明的方法可以有效提高预测准确率,并提高投资收益率。

2、为了实现上述发明目的,本发明具体采用如下技术方案:

3、第一方面,本发明提供了一种结合lstm与多图卷积神经网络的选股方法,包括以下步骤:

4、s1:获取原始的股票特征数据,并按照股票代码对原始的股票特征数据进行分类;

5、s2:对分类后的股票特征数据进行数据预处理,得到预处理后的股票特征数据,并由预处理后的股票特征数据构建数据集;

6、s3:在所述数据集上训练选股模型,所述选股模型包含lstm模型、图卷积网络、attention机制以及全连接层;

7、s4:获取经过数据预处理的待检测股票的股票特征数据,将待检测股票的股票特征数据输入到训练好的选股模型中,由选股模型预测每支待检测股票的未来收益率,按照未来收益率的大小对待检测股票的股票特征数据进行排序,选取收益率最高的前k支待检测股票进行投资。

8、在上述方案基础上,各步骤可以采用如下优选的具体方式实现。

9、作为上述第一方面的优选,步骤s2中,所述数据预处理具体过程为:依次对分类后的股票特征数据进行中心化以及归一化后,利用中心化以及归一化后的股票特征数据计算股票价格移动平均线。

10、作为上述第一方面的优选,步骤s3中,选股模型中的具体处理流程如下:

11、s31:将预处理后的股票特征数据输入到所述lstm模型中提取各支股票的股票趋势特征;

12、s32:从原始的股票特征数据中获取股票的历史收盘价序列,基于股票的历史收盘价序列计算每对股票间的皮尔逊相关系数,得到皮尔逊关系矩阵,基于股票的历史收盘价序列计算每对股票间的斯皮尔曼秩相关系数,得到斯皮尔曼秩关系矩阵,并通过fastdtw算法获得股票的历史收盘价序列之间的相似度,得到相似关系矩阵;

13、s33:将皮尔逊关系矩阵、斯皮尔曼秩关系矩阵以及相似关系矩阵通过attention机制整合为一个注意力关系矩阵,所述注意力关系矩阵中的每个元素代表对应索引的两支股票之间的关系强度;

14、s34:将注意力关系矩阵中的每个元素作为股票关系图的边值,将各支股票的股票趋势特征作为股票关系图中的股票节点,以构建股票关系图;

15、s35:将股票关系图输入到图卷积网络中,进行两层图卷积过程后获得各支股票的关系嵌入;

16、s36:将各支股票的股票趋势特征以及各支股票的关系嵌入拼接在一起,将拼接后的结果通过一个全连接层进行预测结果处理,得到各支股票收益率的预测结果。

17、作为上述第一方面的优选,步骤s3中,在训练选股模型时,采用的损失函数具体为:

18、

19、

20、

21、式中:l1代表预测损失,l2表示每对股票间相对排名的损失;表示在t+1时间所有股票收益率的预测结果;yt+1表示在t+1时间所有股票收益率的真实值;α表示权重超参数;分别表示在t+1时间第i支股票、第j支股票收益率的预测结果;分别表示在t+1时间第i支股票、第j支股票收益率的真实值。

22、第二方面,本发明提供了一种结合lstm与多图卷积神经网络的选股系统,包括:

23、数据获取模块,用于获取原始的股票特征数据,并按照股票代码对原始的股票特征数据进行分类;

24、预处理模块,用于对分类后的股票特征数据进行数据预处理,得到预处理后的股票特征数据,并由预处理后的股票特征数据构建数据集;

25、模型训练模块,用于在所述数据集上训练选股模型,所述选股模型包含lstm模型、图卷积网络、attention机制以及全连接层;

26、结果获取模块,用于获取经过数据预处理的待检测股票的股票特征数据,将待检测股票的股票特征数据输入到训练好的选股模型中,由选股模型预测每支待检测股票的未来收益率,按照未来收益率的大小对待检测股票的股票特征数据进行排序,选取收益率最高的前k支待检测股票进行投资。

27、第三方面,本发明提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时,能实现如上述第一方面任一项方案所述的一种结合lstm与多图卷积神经网络的选股方法。

28、第四方面,本发明提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上述第一方面任一项方案所述的一种结合lstm与多图卷积神经网络的选股方法。

29、第五方面,本发明提供了一种计算机电子设备,包括存储器和处理器;

30、所述存储器,用于存储计算机程序;

31、所述处理器,用于当执行所述计算机程序时,实现如上述第一方面任一项方案所述的一种结合lstm与多图卷积神经网络的选股方法。

32、本发明相对于现有技术而言,具有以下有益效果:

33、本发明为量化选股提供了新的方法思路,与传统统计回归模型和机器学习方法相比,使用lstm模型和多图卷积神经网络可以同时捕获股票价格数据的事件依赖性和不同股票间的关系影响,提高股票收益率预测结果的准确性。此外,将股票相对排名加入损失函数中,可以更加准确地选择排名靠前的股票,使投资者能够获得更高的投资回报。

本文地址:https://www.jishuxx.com/zhuanli/20250110/351777.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。