一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种预测每日股东户数的方法及设备与流程

2022-02-22 23:36:58 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,尤其涉及一种预测每日股东户数的方法及设备。


背景技术:

2.现有技术中,上市公司真实的股东户数是定期按季披露或者通过上市公司不定期的业绩发布会进行披露,只能从年报、中报、季报中获取股东户数变化的具体数据,且年报的数据往往滞后3到4个月,中报也要滞后1到2月,不定期的业绩发布会没有规律可循,因此基于该数据的分析往往存在较大的滞后性和不确定性,难以提供预判的价值。
3.股东户数的变化主要是股东在二级市场进行买卖操作的结果,股东的买卖操作行为受到宏观经济、行业发展、市场波动、资金变化、个股涨跌等多种因素影响,而例如市场资金变化等的这些因素是可以直接观测得到的。现有技术中仅出现了对股票的每日交易量及期货价格趋势进行预测,并没有出现任何对股票的每日股东户数进行预测的方案,使在对金融数据进行预测的现有技术中,多数技术方案是对成交量、价格趋势的预测研究,而对于成交量、价格等行情数据,本身披露周期就短,几乎是有实时数据,相比对于按季度披露的股东户数数据,则是披露周期较长且无法及时了解上市公司股东户数变化情况。


技术实现要素:

4.本技术的一个目的是提供一种预测每日股东户数的方法及设备,实现了对上市公司的每日股东户数进行及时且准确的预测,不仅提升了使用及时且准确的每日股东户数的时效性,还提高了对每日股东户数的实用价值。
5.根据本技术的一个方面,提供了一种预测每日股东户数的方法,其中,所述方法包括:
6.预测每日股东户数的方法,其中,所述方法包括:
7.确定用于预测目标上市公司的每日股东户数的目标预测模型;
8.获取所述目标上市公司在当前交易日的实时涨跌动因指标和实时控制变量;
9.将所述实时涨跌动因指标和所述实时控制变量输入所述目标预测模型进行预测,得到所述目标上市公司在所述当前交易日对应的实时股东户数。
10.进一步地,上述方法中,所述确定用于预测目标上市公司的每日股东户数的目标预测模型,包括:
11.获取所述目标上市公司在第一时间段内的至少两个样本数据,以形成训练集,同时,获取所述目标上市公司在第二时间段内的至少两个样本数据,以形成测试集,其中,所述第二时间段晚于所述第一时间段;
12.基于所述训练集和所述测试集进行模型训练,确定用于预测目标上市公司的每日股东户数的目标预测模型。
13.进一步地,上述方法中,所述获取所述目标上市公司在第一时间段内的至少两个样本数据,以形成训练集,同时,获取所述目标上市公司在第二时间段内的至少两个样本数
据,以形成测试集,包括:
14.获取所述目标上市公司在第一时间段内的每日对应的第一股东户数、第一涨跌动因指标及第一控制变量;
15.基于所述目标上市公司在第一时间段内的每日对应的第一股东户数、第一涨跌动因指标及第一控制变量,得到所述训练集中的每个样本数据的自变量和因变量。
16.进一步地,上述方法中,所述获取所述目标上市公司在第二时间段内的至少两个样本数据,以形成测试集,包括:
17.获取所述目标上市公司在第二时间段内的每日对应的第二股东户数、第二涨跌动因指标及第二控制变量;
18.基于所述目标上市公司在第二时间段内的每日对应的第二股东户数、第二涨跌动因指标及第二控制变量,得到所述测试集中的每个样本数据的自变量和因变量。
19.进一步地,上述方法中,所述基于所述训练集和所述测试集进行模型训练,确定用于预测目标上市公司的每日股东户数的目标预测模型,包括:
20.采用机器学习算法对所述训练集进行模型训练,得到用于预测目标上市公司的每日股东户数的至少一个备选预测模型;
21.基于所述测试集,分别对每个所述备选预测模型进行测试,得到每个所述备选预测模型的准确率;
22.基于所述至少一个备选预测模型中的每个所述备选预测模型的准确率,确定用于预测目标上市公司的每日股东户数的目标预测模型。
23.进一步地,上述方法中,所述基于所述至少一个备选预测模型中的每个所述备选预测模型的准确率,确定用于预测目标上市公司的每日股东户数的目标预测模型,包括:
24.将所述至少一个备选预测模型中的、准确率最高时对应的备选预测模型,确定为用于预测目标上市公司的每日股东户数的目标预测模型。
25.进一步地,上述方法中,所述机器学习算法包括随机森林回归算法、神经网络算法及深度学习算法中的任一种。
26.根据本技术的另一方面,还提供了一种非易失性存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行时,使所述处理器实现如上述预测每日股东户数的方法。
27.根据本技术的另一方面,还提供了一种用于预测每日股东户数的设备,其中,该设备包括:
28.一个或多个处理器;
29.计算机可读介质,用于存储一个或多个计算机可读指令,
30.当所述一个或多个计算机可读指令被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述预测每日股东户数的方法。
31.与现有技术相比,本技术通过首先确定用于预测目标上市公司的每日股东户数的目标预测模型;然后,在实际应用场景中获取所述目标上市公司在当前交易日的实时涨跌动因指标和实时控制变量;将所述实时涨跌动因指标和所述实时控制变量输入所述目标预测模型进行预测,得到所述目标上市公司在所述当前交易日对应的实时股东户数,实现了对上市公司的每日股东户数进行及时且准确的预测,不仅提升了使用及时且准确的每日股
东户数的时效性,还提高了对每日股东户数的实用价值。
附图说明
32.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本技术的其它特征、目的和优点将会变得更明显:
33.图1示出根据本技术一个方面的一种预测每日股东户数的方法的流程示意图;
34.图2示出根据本技术一个方面的一种预测每日股东户数的方法在实际应用场景中的各处理阶段的示意图;
35.图3示出根据本技术一个方面的一种预测每日股东户数的方法在实际应用场景中的处理流程框架图;
36.图4示出根据本技术一个方面的一种预测每日股东户数的方法在一优选的实际应用场景中的a股股东户数的真实值与预测值的对比示意图。
37.附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
38.下面结合附图对本技术作进一步详细描述。
39.在本技术一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
40.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
41.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
42.如图1所示,本技术的一个方面提出了一种预测每日股东户数的方法的流程示意图,其中,所述方法包括步骤s11、步骤s12和步骤s13,具体包括如下步骤:
43.步骤s11,确定用于预测目标上市公司的每日股东户数的目标预测模型;
44.步骤s12,获取所述目标上市公司在当前交易日的实时涨跌动因指标和实时控制变量;
45.步骤s13,将所述实时涨跌动因指标和所述实时控制变量输入所述目标预测模型进行预测,得到所述目标上市公司在所述当前交易日对应的实时股东户数。
46.通过上述步骤s11至步骤s13,首先确定用于预测目标上市公司的每日股东户数的目标预测模型;然后,在实际应用场景中获取所述目标上市公司在当前交易日的实时涨跌动因指标和实时控制变量;将所述实时涨跌动因指标和所述实时控制变量输入所述目标预
测模型进行预测,得到所述目标上市公司在所述当前交易日对应的实时股东户数,实现了对上市公司的每日股东户数进行及时且准确的预测,与传统的按季度更新或不定期更新的股东户数相比,本技术不仅提升了使用及时且准确的每日股东户数的时效性,还提高了对每日股东户数的实用价值。
47.在实际应用场景中,还由于本技术可以实时且准确地预测上市公司的每日的实时股东户数,对于需要对上市公司进行投资的投资者而言,可以对上市公司每日的实时股东户数进行更高频率的分析和使用实时股东户数,可以做出相应的投资决策,不仅提高了及时且准确预测的每日的实时股东户数的实用价值,还提高了及时且准确预测的每日的实时股东户数的研究价值。
48.接着本技术的上述实施例,所述步骤s11确定用于预测目标上市公司的每日股东户数的目标预测模型,具体包括:
49.获取所述目标上市公司在第一时间段内的至少两个样本数据,以形成训练集,同时,获取所述目标上市公司在第二时间段内的至少两个样本数据,以形成测试集,其中,所述第二时间段晚于所述第一时间段;
50.基于所述训练集和所述测试集进行模型训练,确定用于预测目标上市公司的每日股东户数的目标预测模型。
51.在此,为了确保用于预测目标上市公司的每日股东户数的目标预测模型能够更接近于真实应用场景中对每日股东户数的预测需求,用于预测所述目标预测模型的测试集中的样本数据对应的第二时间段,晚于用于训练所述目标预测模型的训练集的样本数据对应的第一时间段,使得通过更早时间段的训练集进行模型训练,通过更晚时间段的测试集来测试训练所得的模型的准确度和实际契合度,以便最终确定的目标预测模型能够更接近于当前时间或者最近时间段的该上市公司的每日股东户数的走势,从而使得后续通过该目标预测模型预测得到的预测日的实时股东户数更准确且更接近于实际股东走势的结果。
52.在本技术一优选实施例中,将所述第一时间段优选为2016年至2019年,将所述第二时间段优选为2020年至2021年6月,则在本实施例中,首先获取2016年至2019年的全部a股上市公司在每日披露的股东户数真实值等数据形成的训练集,该训练集包括样本数据v11、样本数据v12、样本数据v13、
……
、样本数据v1(n-1)及样本数据v1(n),其中,n为大于等于2的正整数,即训练集={样本数据v11、样本数据v12、样本数据v13、
……
、样本数据v1(n-1)及样本数据v1(n)};同时,获取2020年至2021年6月的全部a股上市公司在每日披露的股东户数真实值等数据形成的测试集,该测试集包括样本数据v21、样本数据v22、样本数据v23、
……
、样本数据v2(n-1)及样本数据v2(m),其中,m为大于等于2的正整数,即所述测试集={样本数据v21、样本数据v22、样本数据v23、
……
、样本数据v2(n-1)及样本数据v2(m)};然后,基于所述训练集:{样本数据v11、样本数据v12、样本数据v13、
……
、样本数据v1(n-1)及样本数据v1(n)}和所述测试集:样本数据v21、样本数据v22、样本数据v23、
……
、样本数据v2(n-1)及样本数据v2(m)进行模型训练和模型测试,最终确定用于预测目标上市公司的每日股东户数的目标预测模型model,实现了对用于模型训练的训练集的确定和对用于训练得到的模型进行模型测试的测试集的确定,进一步根据确定的训练集和测试集依序分别进行模型训练和模型测试,实现对用于预测目标上市公司的每日股东户数的目标预测模型model的训练和确定。
53.接着本技术的上述实施例,所述步骤s12中的获取所述目标上市公司在第一时间段内的至少两个样本数据,以形成训练集,同时,获取所述目标上市公司在第二时间段内的至少两个样本数据,以形成测试集,包括:
54.获取所述目标上市公司在第一时间段内的每日对应的第一股东户数、第一涨跌动因指标及第一控制变量;在此,所述目标上市公司的第一时间段内的每日对应的第一控制变量包括但不限于所述目标上市公司在所述第一时间段内的每日对应的总市值、股票价格及成交量、该目标上市公司的所属行业及所述目标上市公司是否为新股等用于指示所述目标上市公司的行情相关数据。
55.基于所述目标上市公司在第一时间段内的每日对应的第一股东户数、第一涨跌动因指标及第一控制变量,得到所述训练集中的每个样本数据的自变量和因变量。
56.在本技术一优选实施例中,获取2016年至2019年的全部a股上市公司在每日披露的第一股东户数、第一涨跌动因指标及第一控制变量;然后,对获取的2016年至2019年的全部a股上市公司在每日披露的第一股东户数、第一涨跌动因指标及第一控制变量分别进行分析和处理,以得到训练集中的每个样本数据中的自变量和因变量,在本技术所有的实施例中,训练集中的每个所述样本数据均由自变量及其对应的因变量组成,以便后续能够通过每个样本数据对应的自变量和因变量来进行模型构建和训练,实现了对训练集中的每个样本数据的确定。
57.接着本技术的上述实施例,所述步骤s11中的获取所述目标上市公司在第二时间段内的至少两个样本数据,以形成测试集,具体包括:
58.获取所述目标上市公司在第二时间段内的每日对应的第二股东户数、第二涨跌动因指标及第二控制变量;在此,所述目标上市公司的第二时间段内的每日对应的第二控制变量包括但不限于所述目标上市公司在所述第二时间段内的每日对应的总市值、股票价格及成交量、该目标上市公司的所属行业及所述目标上市公司是否为新股等用于指示所述目标上市公司的行情相关数据。
59.基于所述目标上市公司在第二时间段内的每日对应的第二股东户数、第二涨跌动因指标及第二控制变量,得到所述测试集中的每个样本数据的自变量和因变量。
60.在本技术一优选实施例中,获取2020年至2021年6月的全部a股上市公司在每日披露的第二股东户数、第二涨跌动因指标及第二控制变量;然后,对获取的2020年至2021年6月的全部a股上市公司在每日披露的第二股东户数、第二涨跌动因指标及第二控制变量分别进行分析和处理,以得到训测试集中的每个样本数据中的自变量和因变量,在本技术所有的实施例中,测试集中的每个所述样本数据均由自变量及其对应的因变量组成,以便后续能够通过每个样本数据对应的自变量和因变量来进行模型的测试,实现了对测试集中的每个样本数据的确定。
61.在本技术一优选实施例中,如图2所示,所述步骤s11确定用于预测目标上市公司的每日股东户数的目标预测模型model包括三个步骤,分别为数据准备、模型训练和模型测试,其中,在数据准备阶段,由于每个上市公司披露股东户数的时间存在不一致的情况,本技术实施例中通过计算a股上市公司最近一次获取的股东户数的披露值至预测当天的股东户数变化率作为因变量,即只有a股上市公司在当天有披露股东户数的真实值(披露值)的,才能作为训练集中的样本数据与测试集中的样本数据。使用获取样本数据中的因变量的方
法,对获取的a股上市公司的每日对应的涨跌动因指标ddy进行处理,即计算a股上市公司最近一次获取的股东户数的披露值至预测当日的ddy累积变化值,并将ddy累计变化值作为样本数据中的一自变量,其中,为了考虑到a股上市公司的行情相关信息,样本数据中的自变量包括多个,比如自变量还可以包括预测当日的a股上市公司的总市值、所属行业、是否新股、股票价格及成交量等行情相关信息,这些信息既可以进行上述累计变化的计算,也可以直接使用,视自变量是否实时变化而定,实现对样本数据的自变量和因变量的确定。在模型训练阶段,使用2016年至2019年全部a股上市公司在当日有披露股东户数的真实值的数据及a股上市公司的ddy在当日有披露的真实值、总市值、所属行业、是否新股、股票价格及成交量等行情相关信息作为训练集,进行模型的构建。在模型测试阶段,使用2020年至2021年6月全部a股上市公司在当日有披露股东户数的真实值的数据及a股上市公司的ddy在当日有披露的真实值、总市值、所属行业、是否新股、股票价格及成交量等行情相关信息作为测试集,来验证训练所得的模型的准确率,以达到测试模型训练阶段所得的模型的目的。
62.接着本技术的上述实施例,在模型训练和模型测试阶段中,所述步骤s11中的基于所述训练集和所述测试集进行模型训练,确定用于预测目标上市公司的每日股东户数的目标预测模型,具体包括:
63.采用机器学习算法对所述训练集进行模型训练,得到用于预测目标上市公司的每日股东户数的至少一个备选预测模型;在此,所述机器学习算法包括但不限于随机森林回归算法、神经网络算法及深度学习算法中的任一种,在如图2所示的本技术一优选实施例中,将所述机器学习算法优选为随机森林回归算法。
64.基于所述测试集,分别对每个所述备选预测模型进行测试,得到每个所述备选预测模型的准确率;
65.基于所述至少一个备选预测模型中的每个所述备选预测模型的准确率,确定用于预测目标上市公司的每日股东户数的目标预测模型。
66.在申请一优选实施例中,采用随机森林回归算法对训练集:{样本数据v11、样本数据v12、样本数据v13、
……
、样本数据v1(n-1)及样本数据v1(n)}进行建模,得到用于预测a股上市公司的每日股东户数的备选预测模型model1、备选预测模型model2、备选预测模型model3、
……
、备选预测模型model(p-1)及备选预测模型model(p),其中,p为大于等于1的正整数;然后,为了从p个备选预测模型中筛选精确度更好的模型,将所述测试集:样本数据v21、样本数据v22、样本数据v23、
……
、样本数据v2(n-1)及样本数据v2(m)用来对每个备选预测模型进行测试,以统计得到每个备选预测模型的准确率;最后,基于p个备选预测模型中的每个备选预测模型的准确率,从p个备选预测模型中确定出一个目标预测模型,作为后续对a股上市公司的每日股东户数进行实时预测的最终预测模型,实现了对用于预测目标上市公司的每日股东户数的目标预测模型的构建、筛选和确定。
67.接着本技术的上述实施例,所述基于所述至少一个备选预测模型中的每个所述备选预测模型的准确率,确定用于预测目标上市公司的每日股东户数的目标预测模型,具体包括:
68.将所述至少一个备选预测模型中的、准确率最高时对应的备选预测模型,确定为用于预测目标上市公司的每日股东户数的目标预测模型。
69.在本技术一优选实施例中,为了便于后续能够更精确地预测a股上市公司的每日
股东户数的实时值,在训练得到p个备选预测模型并模型测试后,需要根据每个备选预测模型的准确率,从p个备选预测模型中筛选出准确率最高时对应的备选预测模型,若备选预测模型model5的准确率为p个备选预测模型的准确率中的最高值,则将所述备选预测模型model5确定为目标预测模型model,使得通过预测效果最好的目标预测模型model来对未来实时应用场景中的a股上市公司的每日股东户数进行实时预测,确保预测到的结果的准确率更好,更能接近于每日股东户数的真实值。
70.如图2所示,在模型应用阶段,首先使用模型对2016年至2021年全部a股上市公司对这段周期内所有交易日的股东户数进行预测,并保存数据;然后,每日收盘后,对全部a股上市公司当天的股东户数进行预测,并保存数据。
71.在本技术的一优选具体实施中,如图3所示,首先,从vertica数据库读取a股上市公司的股东户数的真实值、ddy、总市值、所属行业、是否新股等行情相关信息;然后,将读取的数据导入python环境,经过模型训练、模型测试后,在python环境中保存最终预测模型,即用于预测目标上市公司的每日股东户数的目标预测模型model;最终,从vertica数据库读取全部a股每个当前交易日对应的自变量的数据,使用python环境的最终模型:目标预测模型model进行预测,将预测的a股上市公司在每个当前交易日对应的实时股东户数,并保存在vertica环境,如图4所示,图4中的随时间变化的走势曲线为a股上市公司的每日股东户数的预测走势,图4中的每个圆点是在a股上市公司的每日股东户数的定期报告披露当日的股东户数的真实值。
72.根据本技术的另一方面,还提供了一种非易失性存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行时,使所述处理器实现如上述预测每日股东户数的方法。
73.根据本技术的另一方面,还提供了一种用于预测每日股东户数的设备,其中,该设备包括:
74.一个或多个处理器;
75.计算机可读介质,用于存储一个或多个计算机可读指令,
76.当所述一个或多个计算机可读指令被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述预测每日股东户数的方法。
77.在此,所述用于预测每日股东户数设备中的各实施例的详细内容,具体可参见上述预测每日股东户数的方法的实施例的对应部分,在此,不再赘述。
78.综上所述,本技术通过首先确定用于预测目标上市公司的每日股东户数的目标预测模型;然后,在实际应用场景中获取所述目标上市公司在当前交易日的实时涨跌动因指标和实时控制变量;将所述实时涨跌动因指标和所述实时控制变量输入所述目标预测模型进行预测,得到所述目标上市公司在所述当前交易日对应的实时股东户数,实现了对上市公司的每日股东户数进行及时且准确的预测,不仅提升了使用及时且准确的每日股东户数的时效性,还提高了对每日股东户数的实用价值。
79.需要注意的是,本技术可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本技术的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本技术的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,
磁或光驱动器或软磁盘及类似设备。另外,本技术的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
80.另外,本技术的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本技术的方法和/或技术方案。而调用本技术的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本技术的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本技术的多个实施例的方法和/或技术方案。
81.对于本领域技术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神或基本特征的情况下,能够以其他的具体形式实现本技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本技术内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献