一种基于并行隐特征分析的出口补贴金额预测方法和装置与流程
- 国知局
- 2024-10-09 16:19:02
本发明涉及大数据,特别涉及一种基于并行隐特征分析的出口补贴金额预测方法和装置。
背景技术:
1、随着全球贸易的不断扩大和国际市场的日益竞争,越来越多的出口企业与出口商品品类不断涌现,出口交易数额与交易数量迅速激增。出口补贴金额是衡量政府对出口企业特定商品品类支持程度的重要指标,可以反映出政府对特定出口企业或者特定产业的重视程度,即政府对出口补贴对象的倾向。出口企业能够根据政府的出口补贴对象倾向制定和调整出口计划、产品定价策略等。然而,可供出口的商品品类众多,如何预测出口补贴金额为出口企业选择适合的出口商品品类已成为了一个至关重要的问题。
2、目前,针对出口补贴金额的预测问题,一般是通过基于隐特征分析的机器学习模型来预测政府对出口企业特定商品品类的出口补贴金额,主要是通过政府对出口企业特定商品品类的已知历史出口补贴金额数据预测未知出口补贴金额数据。
3、在进行隐特征分析时,需要构造出口企业与商品品类之间的二阶出口补贴金额矩阵,并基于该矩阵中的已知出口补贴金额数据来训练两个低维的二阶隐特征矩阵,使得二者乘积逼近于已知的二阶出口补贴金额矩阵,以预测政府对出口企业特定商品品类的出口补贴金额。然而,由于出口企业和出口商品品类的数量庞大,其所对应的二阶出口补贴金额矩阵及二阶隐特征矩阵在两个阶上呈现高维度特征,对高维度的二阶出口补贴金额矩阵进行隐特征分析需要消耗巨大的计算成本和时间成本,造成预测效率低下的问题。因此,如何快速地预测政府对出口企业特定商品品类的出口补贴金额,已成为了一个迫切需要解决的问题。
技术实现思路
1、针对现有技术中出口补贴金额预测效率低下的问题,本发明提出一种基于并行隐特征分析的出口补贴金额快速预测方法和装置。
2、为了实现上述目的,本发明提供以下技术方案:
3、一种基于并行隐特征分析的出口补贴金额预测方法,具体包括以下步骤:
4、s1:从服务器采集历史出口补贴金额数据并进行存储;
5、s2:根据历史出口补贴金额数据构造出口补贴金额矩阵r;
6、s3:将构造的出口补贴金额矩阵r分块成t×t个矩阵子块,其中t>p,p为服务器的线程数;
7、s4:初始化出口补贴金额预测过程中所涉及的损失函数及过程参数;
8、s5:根据出口补贴金额矩阵子块、损失函数和过程参数计算出口补贴金额预测值。
9、优选地,所述s1中,历史出口补贴金额数据以三元组的形式进行存储,三元组表示形式为z=(b,s,c),其中b表示出口企业,s表示出口商品品类,c表示政府对出口企业b出口商品品类s的出口补贴金额。
10、优选地,所述s2中,将历史出口补贴金额数据z=(b,s,c)构造成一个i×j大小的二阶出口补贴金额矩阵r,其中i为出口企业的数量,j为出口商品品类的数量,矩阵中的元素rij表示第i个出口企业第j个商品品类的出口补贴金额,1≤i≤i,1≤j≤j,γ为出口补贴金额矩阵r中包含的已知元素的集合。
11、优选地,所述s4中,损失函数ε用以下公式表示:
12、
13、公式(1)中,γ是在出口补贴金额矩阵r中包含的已知元素的集合;rij表示出口补贴金额矩阵r中第i个出口企业第j个出口商品品类的出口补贴金额;ui表示出口企业隐特征矩阵u中的第i个行向量;vj表示出口商品品类隐特征矩阵v中第j个行向量;λ表示出口企业隐特征矩阵u和出口商品品类隐特征矩阵v的正则化参数。
14、优选地,所述s4中,过程参数包括出口企业隐特征矩阵u和出口商品品类隐特征矩阵v、对应于出口企业隐特征矩阵u的动量矩阵φ、对应于出口商品品类隐特征矩阵v的动量矩阵隐特征维数d、收敛终止阈值δ、学习率η、动量系数γ、正则化因子λ;其中,
15、隐特征维数d决定了隐特征矩阵u和v的隐特征空间维数;
16、隐特征矩阵u和v的大小由对应的出口补贴金额矩阵r的每个阶的维度值确定,即u为i行d列的隐特征矩阵、v为j行d列的隐特征矩阵,;
17、收敛终止阈值δ是判断迭代过程是否已收敛的参数;
18、正则化因子λ是控制训练过程中隐特征矩阵u和v相关元素的正则化效应的常数。
19、优选地,所述s5包括:
20、s5-1:结合分块的出口补贴金额矩阵子块、损失函数和过程参数,计算历史出口补贴金额数据的隐特征u、v;
21、s5-2:根据得到的历史出口补贴金额数据的隐特征u、v,计算出口补贴金额预测值并存储。
22、优选地,所述s5-1包括:
23、s5-1-1:向每个工作线程p1,p2,…,p异步并行随机调度一个矩阵子块rmn,rmn表示r中第m行第n列的矩阵子块,则每个工作线程p1,p2,…,p负责训练的当前矩阵子块为rm1n1,rm2n2,…,rmpnp,且训练的当前矩阵子块要满足m1≠m2≠…≠mp且n1≠n2≠…≠np;
24、s5-1-2:根据所有当前被调度的矩阵子块、损失函数和过程参数,异步并行训练获取历史出口补贴金额数据的隐特征矩阵u、v的值,训练迭代的公式如下所示:
25、
26、公式(2)中,表示在第τ次迭代中动量矩阵的第i个行向量;γ表示动量系数;η表示学习率;表示在第τ-1次迭代中动量矩阵的第i个行向量;表示损失函数ε在上对ui的梯度;表示在第τ-1次迭代中隐特征矩阵u的第i个行向量,表示在第τ次迭代中隐特征矩阵u的第i个行向量;表示在第τ次迭代中动量矩阵φ的第i个行向量;表示在第τ-1次迭代中动量矩阵φ的第i个行向量;表示损失函数ε在上对vj的梯度;表示在第τ-1次迭代中隐特征矩阵v的第i个行向量,表示在第τ次迭代中隐特征矩阵v的第i个行向量;ui表示出口企业隐特征矩阵u中的第i个行向量;vj表示出口商品品类隐特征矩阵v中第j个行向量;
27、s5-1-3:判断损失函数ε在γ上训练迭代过程是否达到收敛条件,若是则进入s5-2;若否则进入s5-1-1,直到满足收敛条件。
28、优选地,所述s5-2中出口补贴金额预测值的计算公式为:
29、
30、公式(3)中,表示出口企业ui出口商品品类vj的出口补贴金额预测值;ui表示出口企业隐特征矩阵u中的第i个行向量;vj表示出口商品品类隐特征矩阵v中第j个行向量。
31、本发明还提供一种基于并行隐特征分析的出口补贴金额预测装置,包括:
32、出口补贴金额数据接收模块1100,用于采集历史出口补贴金额数据,并将其存储到出口补贴金额数据存储模块1200;
33、出口补贴金额数据存储模块1200,用于存储采集的历史出口补贴金额数据,及存储出口补贴金额预测值;
34、出口补贴金额矩阵构造模块1300,用于将存储的历史出口补贴金额数据构造成出口补贴金额矩阵r;
35、出口补贴金额矩阵分块模块1400,用于将出口补贴金额矩阵r分块成t×t个出口补贴金额矩阵子块;
36、出口补贴金额数据快速预测模块1500,用于根据构造的出口补贴金额矩阵子块进行出口补贴金额预测,并将精度最高的出口补贴金额预测值存储至出口补贴金额数据存储模块1200。
37、优选地,出口补贴金额快速预测模块1500包括初始化单元1510、训练单元1520和出口补贴金额预测值计算单元1530:
38、初始化单元1510用于初始化出口补贴金额预测过程中所涉及的损失函数及过程参数;
39、训练单元1520,用于结合分块的出口补贴金额矩阵子块及初始化单元已初始化的出口补贴金额预测过程中所涉及的损失函数及过程参数,并行训练计算历史出口补贴金额数据的隐特征;
40、出口补贴金额预测值计算单元1530,用于根据训练单元得到的历史出口补贴金额数据的隐特征,计算出口补贴金额数据预测值。
41、综上所述,由于采用了上述技术方案,与现有技术相比,本发明至少具有以下有益效果:
42、本发明提供了一种基于并行隐特征分析的出口补贴金额快速预测方法和装置,其专门作用于出口补贴金额数据,能够进行符合统计规律的、准确度高的出口补贴金额预测,以找出潜在的政府出口补贴对象,促进出口企业制定和调整出口计划、产品定价策略等。可广泛应用在出口缴税、出口补贴等领域。
本文地址:https://www.jishuxx.com/zhuanli/20240929/312658.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。