基于核映射的TWSVR模型构建方法、设备和存储介质与流程
- 国知局
- 2024-07-31 23:16:59
本技术属于时间序列数据预测,具体涉及一种基于核映射的twsvr模型构建方法、设备和存储介质。
背景技术:
1、在时间序列预测问题中,基于支持向量回归机(svr)的自回归预测模型是一种流行的方案。然而该方法的计算复杂度高,不能充分适用于大规模时序数据的训练。
2、现有技术面对上述svr模型不能充分适用于大规模时序数据训练的问题,常用的手段为采用孪生支持向量机(twsvr)模型,将一个大的二次规划求解问题转换为两个小的二次规划求解问题,降低计算复杂度,大大提高了svr的训练效率。
3、然而,上述方法在非线性情形下依旧需要求解样本数量级的二次规划问题。
技术实现思路
1、为了解决现有技术中的上述问题,本技术提供了一种基于核映射的twsvr模型构建方法、设备和存储介质。
2、第一方面,本技术提供一种基于核映射的twsvr模型构建方法,所述方法包括:
3、通过数据处理将单维时间序列数据组转化为多组多维度特征数据组,并基于泰勒级数理论构建高斯核函数的显式核映射函数,其中显示核映射函数为可用函数关系式表达的函数;
4、基于所述显示核映射函数构建目标回归函数,并构建两个二次规划问题,和每个二次规划问题对应的限制条件,带入所述多组多维度特征数据组对所述每个二次规划问题进行求解,获取目标参数;
5、根据所述目标参数获取所述目标回归函数的表达式后,根据所述目标回归函数建立twsvr模型。
6、在一种可能的实施方式中,所述基于所述显示核映射函数构建目标回归函数,包括:
7、设计所述twsvr模型的非平行不敏感上届回归函数,为:
8、设计所述twsvr模型的非平行不敏感下届回归函数,为:
9、根据所述非平行不敏感上届回归函数和所述非平行不敏感下届回归函数构建所述目标回归函数,初始表达式为:
10、其中,所述b1和所述b2为偏置参数,所述w1和所述w2为权重参数,所述φ(x)为高斯函数的显示核映射函数,b1、b2、w1和w2为所述目标参数。
11、在一种可能的实施方式中,所述构建两个二次规划问题,和每个二次规划问题对应的限制条件,包括:
12、基于偏置参数b1和权重参数w1构建第一目标优化问题,为:以及对应的第一限制条件,为:s.t.y-(φ(a)w1+eb1)≥eε1-ξ,ξ≥0;
13、基于偏置参数b2和权重参数w2构建第二目标优化问题,为:以及对应的第二限制条件,为:s.t.(φ(a)w2+eb2)-y≥eε2-η,η≥0;
14、基于所述第一目标优化问题和所述第二目标优化问题,引入拉格朗日乘子α和γ,结合kkt条件构建对偶问题以及对应的限制条件;
15、其中,c1和c2惩罚参数,ξ和η为松弛变量,e为单位列向量,ε1和ε2为不敏感回归系数,a为每组多维度特征数据组构成的样本矩阵,y为每组多维度特征数据组对应的标签。
16、在一种可能的实施方式中,所述基于所述第一目标优化问题和所述第二目标优化问题,引入拉格朗日乘子α和γ,结合kkt条件构建对偶问题以及对应的限制条件,包括:
17、基于所述第一目标优化问题,引入拉格朗日乘子α结合kkt条件构建第一对偶问题,为:
18、以及对应的第三限制条件,为:s.t.0≤α≤c1e;
19、基于所述第二目标优化问题,引入拉格朗日乘子γ结合kkt条件构建第二对偶问题,为:
20、以及对应的第四限制条件,为:s.t.0≤γ≤c2e;
21、其中,f=y-ε1,h=y+ε2。
22、在一种可能的实施方式中,所述带入所述多组多维度特征数据对所述每个二次规划问题进行求解,获取目标参数,包括:
23、将所述多组多维度特征数据组带入所述第一目标优化问题、第二目标优化问题、第一对偶问题以及第二对偶问题,结合每个二次规划问题对应的限制条件获取目标参数,为:
24、
25、所述根据所述目标参数获取所述目标回归函数的表达式,包括:
26、将所述目标参数带入所述目标回归函数的初始表达式,计算获取所述目标回归函数的表达式,为:
27、
28、其中,φ(x)=[φ(x);1]。
29、在一种可能的实施方式中,所述基于泰勒级数理论构建高斯核函数的显式核映射函数,包括:
30、基于泰勒级数理论构建高斯核函数的近似核映射函数,并对所述高斯核函数和所述近似核映射函数进行可行性分析;
31、当根据分析结果确定所述近似核映射函数收敛于所述高斯核函数时,对所述近似核映射函数进行2阶泰勒级数展开,获取所述显式核映射函数,为:
32、在一种可能的实施方式中,所述通过数据处理将单维时间序列数据组转化为多组多维度特征数据组,包括:
33、设置滑动窗口和滑动步长,并根据所述滑动窗口和滑动步长将所述单维时间序列数据组拆分为多组多维度特征数据组;
34、获取每个多维度特征数据组的末位特征数据,在所述单维时间序列数据组中获取每个末位特征数据后一位的序列数据;
35、根据每个末位特征数据对应的序列数据,给对应的多维度特征数据组进行打标签处理,其中,每个多维度特征数据组的标签用于所述twsvr模型的训练。
36、在一种可能的实施方式中,所述根据所述目标回归函数建立twsvr模型之后,所述方法还包括:
37、将每组多维度特征数据组输入所述twsvr模型,并获取输出值,将所述输出值与对应的标签进行对比,根据对比结果调整所述twsvr模型的参数;
38、根据调整后的twsvr模型预测所述单维时间序列数据组。
39、第二方面,本技术还提供一种电子设备,包括:至少一个处理器和存储器,其中:
40、所述存储器用于存储计算机执行指令;
41、所述至少一个处理器用于执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的基于核映射的twsvr模型构建方法。
42、第三方面,本技术还提供一种计算机存储介质,所述计算机存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面任一项所述的基于核映射的twsvr模型构建方法。
43、第四方面,本技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时,可实现如前述任意一项所述的基于核映射的twsvr模型构建方法的步骤。
44、本技术提供一种基于核映射的twsvr模型构建方法、设备和存储介质,将twsvr基于核函数的回归函数调整为基于显示核映射函数形式的目标回归函数,使其训练非线性时序数据过程中的二次规划问题与样本维数有关而非样本量,且不需要进行任何核矩阵元素的存储。通过上述方式,使得基于核映射的twsvr模型充分灵活地适应于大规模数据,提高模型的训练效率。
本文地址:https://www.jishuxx.com/zhuanli/20240730/196794.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。