一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于流量的数据处理方法、装置、设备、介质及程序产品与流程

2022-06-01 14:58:39 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,尤其涉及一种基于流量的数据处理方法、装置、设备、介质及程序产品。


背景技术:

2.流量预测可以理解为是根据历史一段时间已消耗的流量预测未来一段时间可能消耗的流量;例如,根据2020年1-12个月已消耗的流量和2021年1-12个月已消耗的流量,预测2022年1-12个月可能消耗的流量;又如,根据1-3个月已消耗的流量预测第4个月可能消耗的流量。准确地预测未来一段时间可能消耗的流量,有利于对未来流量进行合理分配,降低流量的浪费,因此,如何提高流量预测结果的准确性成为当前的研究热点。


技术实现要素:

3.本技术实施例提供了一种基于流量的数据处理方法、装置、设备、介质及程序产品,可以提高流量预测结果的准确性。
4.一方面,本技术实施例提供了一种基于流量的数据处理方法,该基于流量的数据处理方法包括:
5.获取目标对象的流量特征序列;流量特征序列包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据用于反映对应周期下目标对象在目标设备中的流量使用特征,n为正整数;获取目标对象的总流量序列;总流量序列包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据用于指示对应周期下目标对象在目标设备中消耗的总流量;对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列;根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。
6.相应地,本技术实施例提供了一种基于流量的数据处理装置,该基于流量的数据处理装置包括:
7.获取单元,用于获取目标对象的流量特征序列;流量特征序列包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据用于反映对应周期下目标对象在目标设备中的流量使用特征,n为正整数;以及,获取目标对象的总流量序列;总流量序列包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据用于指示对应周期下目标对象在目标设备中消耗的总流量;
8.处理单元,用于对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列;以及,根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。
9.在一种实现方式中,任一个周期的流量特征数据包括以下至少一种:目标对象在目标设备运行的应用程序中消耗的流量数据、目标对象在目标设备中的剩余流量数据、目标对象在目标设备中的流量购买数据、针对目标对象的流量计费数据、所述目标对象在不
同节假日使用目标设备消耗的流量数据、以及目标对象在不同季节使用目标设备消耗的流量数据。
10.在一种实现方式中,处理单元,用于根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据时,具体用于执行如下步骤:
11.根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据;根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据;根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据;根据第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期的节假日流量数据,确定第t 1个周期的总流量数据。
12.在一种实现方式中,趋势项序列包括n 1个周期中每个周期的趋势流量数据;处理单元,用于根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据时,具体用于执行如下步骤:
13.在流量特征序列中确定特征预测序列,特征预测序列包括流量特征序列中从第t-n 1个周期开始到第t个周期结束的共n个周期的流量特征数据;调用目标趋势流量预测模型根据特征预测序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据。
14.在一种实现方式中,处理单元,还用于执行如下步骤:
15.获取初始趋势流量预测模型;根据目标对象的对象标识对流量特征序列进行连接构建,得到趋势训练序列,趋势训练序列包括n 1个周期中每个周期的趋势训练数据;在趋势训练序列中确定训练样本序列和测试样本序列;根据趋势项序列、训练样本序列和测试样本序列对初始流量预测模型进行训练,以便于得到目标趋势流量预测模型。
16.在一种实现方式中,季节项序列包括n 1个周期中每个周期的季节流量数据;处理单元,用于根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据时,具体用于执行如下步骤:
17.在季节项序列中确定季节预测序列,季节预测序列包括季节项序列中从第t-n 1个周期开始到第t个周期结束的共n个周期的季节流量数据;调用目标季节流量预测模型根据季节预测序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据。
18.在一种实现方式中,处理单元,还用于执行如下步骤:
19.获取初始季节流量预测模型;在季节项序列中确定季节训练序列,季节训练序列包括季节项序列中从第t-n个周期开始到第t-1个周期结束的共n个周期的季节流量数据;从季节训练序列中确定训练样本序列和测试样本序列;根据训练样本序列和测试样本序列对初始季节流量模型进行训练,以便于得到目标季节流量预测模型。
20.在一种实现方式中,节假日项序列包括n 1个周期中每个周期的节假日流量数据,处理单元,用于根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据时,具体用于执行如下步骤:
21.调用节假日流量预测模型获取n 1个周期中每个周期的节假日流量数据对应的节假日数据序列,节假日数据序列包括对应周期下的m个节假日的流量数据,m为正整数;确定m个节假日中每个节假日的预测流量数据,m个节假日中的第i个节假日的预测流量数据是n
1个周期中每个周期下的第i个节假日的流量数据的平均值,i为小于或等于m的正整数;根据m个节假日中每个节假日的预测流量数据,确定第t 1个周期的节假日流量数据。
22.在一种实现方式中,处理单元,用于对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列时,具体用于执行如下步骤:
23.对总流量序列进行滑动平均处理,得到趋势项序列,趋势项序列包括n 1个周期中每个周期的趋势流量数据;根据总流量序列和趋势项序列,确定季节项序列;根据总流量序列、趋势项序列和季节项序列,确定节假日项序列。
24.在一种实现方式中,处理单元,用于根据总流量序列和趋势项序列,确定季节项序列时,具体用于执行如下步骤:
25.根据总流量序列和趋势项序列,确定去趋势项序列;去趋势项序列包括n 1个周期中每个周期的去趋势流量数据,任一个周期的去趋势流量数据是根据对应周期的总流量数据和对应周期的趋势流量数据确定的;按照季节对去趋势项序列进行平均处理,得到季节项序列,季节项序列包括n 1个周期中每个周期的季节流量数据。
26.在一种实现方式中,处理单元,用于根据总流量序列、趋势项序列和季节项序列,确定节假日项序列时,具体用于执行如下步骤:
27.根据总流量序列、趋势项序列和季节项序列,确定去趋势去季节项序列;去趋势去季节项序列包括n 1个周期中每个周期的去趋势去季节流量数据,任一个周期的去趋势去季节流量数据是根据对应周期的总流量数据、对应周期的趋势流量数据和对应周期的季节流量数据确定的;按照节假日对去趋势去季节项序列进行平均处理,得到节假日项序列,所述节假日项序列包括n 1个周期中每个周期的节假日流量数据。
28.相应地,本技术实施例提供了一种计算机设备,该计算机设备包括处理器和计算机可读存储介质;其中,处理器适于实现计算机程序;计算机可读存储介质存储有计算机程序,计算机程序适于由处理器加载并执行上述的数据处理方法。
29.相应地,本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被计算机设备的处理器读取并执行时,使得计算机设备执行上述的数据处理方法。
30.相应地,本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的数据处理方法。
31.本技术实施例中,当需要对目标对象在第t 1个周期的流量使用情况进行流量预测时,可以获取目标对象的流量特征序列和目标对象的整体流量序列,然后可以对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列,再然后可以根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。其中,流量特征序列可以包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据可以用于反映对应周期下目标对象在目标设备中的流量使用特征;总流量序列可以包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据可以用于指示对应周期下目标对象在目标设备中消耗的总流量。由上述内容不难看出,采用流量特征序列参与流量预测,可以使得流量预测结果更加符合目标对象在目标设备中的流量使用
特征,提升流量预测结果的准确性;通过对总流量序列进行序列分解处理,可以从不同角度进行流量预测,进一步提升流量预测结果的准确性。
附图说明
32.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
33.图1是本技术实施例提供的一种基于流量的数据处理方法的流程示意图;
34.图2是本技术实施例提供的一种数据处理系统的架构示意图;
35.图3是本技术实施例提供的一种车载场景的场景示意图;
36.图4是本技术实施例提供的另一种基于流量的数据处理方法的流程示意图;
37.图5是本技术实施例提供的另一种基于流量的数据处理方法的流程示意图;
38.图6是本技术实施例提供的一种基于流量的数据处理装置的结构示意图;
39.图7是本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
40.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
41.为了更清楚地理解本技术实施例提供的技术方案,在此对本技术实施例涉及的关键术语进行介绍:
42.(1)本技术实施例涉及流量。流量是指目标对象(即流量使用者)通过目标设备上网所消耗的数据流量,目标对象可以通过目标设备上网的前提是目标设备中可以安装有流量相关硬件,该流量相关硬件例如可以是车联网卡、物联网卡、移动流量卡、移动手机卡等。流量一般具有季节性效应和节假日性效应;其中,流量的季节性效应是指流量在一年中随季节(此处的季节可以理解为是一年中的每个月份)变化而规律性变化的现象,例如每年寒假期间(包括1月份和2月份)和暑假期间(包括7月份和8月份)消耗的流量高于每年其他月份消耗的流量;流量的节假日性效应是指流量在一年中随节假日变化而规律性变化的现象,例如每年国庆节、春节流量消耗的流量高于每年其他时间段消耗的流量,休息日消耗的流量高于工作日消耗的流量。
43.(2)本技术实施例涉及流量预测。流量预测可以理解为是根据目标对象在历史一段时间通过目标设备上网已消耗生的流量,来预测目标对象在未来一段时间通过目标设备上网可能消耗的流量。例如,根据目标对象在2020年1-12个月和2021年1-12个月通过目标设备上网已消耗的流量,预测目标对象在2022年1-12个月通过目标设备上网可能消耗的流量;又如,根据目标对象在1-3个月通过目标设备上网已消耗的流量,预测目标对象在第4个月通过目标设备上网可能消耗的流量。
44.为了提升流量预测结果的准确性,本技术实施例提出一种基于流量的数据处理方
法,该基于流量的数据处理方法在进行流量预测时,一方面考虑到了历史一段时间目标对象的流量使用特征,另一方面考虑到了历史一段时间流量随时间的变化趋势、流量的季节性效应和流量的节假日性效应。也就是说,本技术实施例综合考虑了历史一段时间流量使用者的流量使用特征、流量随时间的变化趋势、流量的季节性效应和流量的节假日性效应,来对未来一段时间可能消耗的流量进行预测,这样可以使得流量预测结果更加符合流量使用者的流量使用特征、流量预测结果更准确。
45.在此结合图1对本技术实施例提供的基于流量的数据处理方法的整体流程进行梳理:

当需要对第t 1个周期进行流量预测时,可以获取目标对象的流量特征序列和目标对象的总流量序列;流量特征序列可以包括在第t 1个周期之前的n 1个周期的流量特征数据,n 1个周期可以表示为{t-n,t-n 1,

,t},任一个周期的流量特征数据用于反映该周期下目标对象在目标设备中的流量使用特征;总流量序列可以包括在第t 1个周期之前的n 1个周期的总流量数据,任一个周期的总流量数据用于指示该周期下目标对象在目标设备中消耗的总流量。

可以对总流量序列进行分解处理,得到趋势项序列、季节项序列和节假日项序列;其中,趋势项序列可以包括n 1个周期的趋势流量数据,可以用于反映流量随时间的变化趋势;季节项序列可以包括n 1个周期的季节流量数据,可以用于反映流量的季节性效应;节假日项序列可以包括n 1个周期的节假日流量数据,可以用于反映流量的节假日性效应。

可以调用目标趋势流量预测模型根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据。

可以调用目标季节流量预测模型根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据。

可以调用节假日流量预测模型根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据。

可以将第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期的节假日流量数据相加,得到第t 1个周期的总流量数据。
46.其中,周期是指对流量数据进行统计的时间区间,例如一个周期可以是一年、一个月、一周等等。在此以一个周期是一个月为例,对基于流量的数据处理方法的整体流程进行示例:当t 1=12,n 1=11时,即当需要对12月份进行流量预测时,可以获取流量特征序列和总流量序列,流量特征序列可以包括12月份之前的11个月(即1-11月份)的流量特征数据,总流量序列可以包括12月份之前的11个月(即1-11月份)的总流量数据;然后,可以对总流量序列进行时间序列分解,得到趋势项序列、季节项序列和节假日项序列,趋势项序列中可以包括1-11月份的趋势流量数据,季节项序列中可以包括1-11月份的季节流量数据,节假日项序列中可以包括1-11月份的节假日流量数据;然后,可以根据流量特征序列和趋势项序列预测得到12月份的趋势流量数据,根据季节项序列预测得到12月份的季节流量数据,根据节假日项序列预测得到12月份的节假日项流量数据;最后,可以将12月份的趋势流量数据,12月份的季节流量数据和12月份的节假日流量数据进行相加,得到12月份的总流量数据。
47.下面结合图2对适于实现本技术实施例提供基于流量的数据处理方法的数据处理系统进行介绍,如图2所示,数据处理系统可以包括目标设备201和服务器202,目标设备201和服务器202之间可以通过有线通信方式进行直接连接,或者可以通过无线通信方式进行间接连接。其中,目标设备201可以包括但不限于智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备、智能家电、智能手表、车载终端等,但并不局限于此;服务器202可
以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据等基础云计算服务的云服务器。
48.在图2所示的数据处理系统中,模型训练过程可以是由服务器执行的,例如服务器可以对初始趋势流量预测模型进行训练,得到上述用于进行趋势流量预测的目标趋势流量预测模型,又如服务器可以对初始季节流量预测模型进行训练,得到上述用于进行季节流量预测的目标季节流量预测模型。流量预测过程可以是由目标设备执行的,也可以是由服务器执行的,下面分别对这两种情况进行介绍:
49.当流量预测过程由目标设备执行时,目标设备中可以部署有目标趋势流量预测模型、目标季节流量预测模型和节假日流量预测模型。当目标设备获取到目标对象的流量特征序列和总流量序列后,可以将总流量序列分解为趋势项序列、季节项序列和节假日项序列,然后可以调用目标趋势流量预测模型根据流量特征序列和趋势项序列进行趋势流量预测,得到第t 1个周期的趋势流量数据,调用目标季节流量模型根据季节项序列进行季节流量预测,得到第t 1个周期的季节流量数据,以及调用节假日流量预测模型根据节假日项序列进行节假日流量预测,得到第t 1个周期的节假日流量数据,然后可以将第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据、以及第t 1个周期的节假日流量数据相加,得到第t 1个周期的总流量数据。
50.当流量预测过程由服务器执行时,服务器中可以部署有目标趋势流量预测模型、目标季节流量预测模型和节假日流量预测模型。服务器可以接收目标设备发送的流量特征序列和总流量序列,服务器可以将总流量序列分解为趋势项序列、季节项序列和节假日项序列,然后可以调用目标趋势流量预测模型根据流量特征序列和趋势项序列进行趋势流量预测,得到第t 1个周期的趋势流量数据,调用目标季节流量模型根据季节项序列进行季节流量预测,得到第t 1个周期的季节流量数据,以及调用节假日流量预测模型根据节假日项序列进行节假日流量预测,得到第t 1个周期的节假日流量数据,然后可以将第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据、以及第t 1个周期的节假日流量数据相加,得到第t 1个周期的总流量数据,然后服务器可以将第t 1个周期的总流量数据发送至目标设备。
51.在图2所示的系统架构下,通过采用反映目标对象的流量使用特征的流量特征序列参与流量预测过程,可以使得预测得到的第t 1个周期的总流量数据更加符合目标对象的流量使用特征,提升流量预测结果的准确性;通过对总流量序列进行分解,从不同角度进行流量预测,可以进一步提升流量预测结果的准确性。可以理解的是,本技术实施例描述的数据处理系统是为了更加清楚的说明本技术实施例的技术方案,并不构成对于本技术实施例提供的技术方案的限定,本领域普通技术对象可知,随着系统架构的演变和新业务场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。
52.在图2所示的系统架构下,下面结合图3对数据处理方案在车联网(例如车载场景)中的应用进行介绍,如图3所示,车辆中可以安装有车载终端,车载终端可以获取目标对象的流量特征序列和总流量序列进行流量预测,得到第t 1个周期的总流量数据;车载终端还可以输出第t 1个周期的总流量数据,以及可以输出基于第t 1个周期的总流量数据计算得到的第t 1个周期的剩余流量数据,以便于目标对象在通过车载终端查看第t 1个周期的总
流量数据和第t 1个周期的剩余流量数据后,可以对第t 1个周期进行合理地流量分配,减少流量浪费。例如,若预测得到的第t 1个周期的总流量数据较大,导致第t 1个周期的剩余流量数据非常少,则目标对象可以减少车载设备中消耗流量多、消耗流量速度快的一些流量消耗操作,例如减少播放在线歌曲,减少播放在线视频等等。
53.基于上述数据处理系统的相关描述,以及基于流量的数据处理方法应用于车载场景中的相关描述,下面结合附图对本技术实施例提出的基于流量的数据处理方法进行详细介绍。
54.本技术实施例提出一种基于流量的数据处理方法,该流量的数据处理方法主要介绍流量特征序列、以及总流量序列的序列分解过程等内容;该基于流量的数据处理方法可以由上述提及的数据处理系统中的目标设备201或服务器202执行,本技术实施例对此不进行限定。请参见图4,该基于流量的数据处理方法可以包括以下步骤s401至步骤s404:
55.s401,获取目标对象的流量特征序列。
56.目标对象的流量特征序列可以是对目标对象的日志数据进行预处理得到的。可以获取在第t 1个周期之前的n 1个周期的目标对象的日志数据,然后可以对n 1个周期的日志数据进行预处理,得到目标对象的流量特征序列。流量特征序列可以包括在第t 1个周期之前的n 1个周期的流量特征数据,任一个周期的流量特征数据可以用于反映该周期下目标对象在目标设备中的流量使用特征;流量特征序列可以表示为{x
t-n
,x
t-n 1
,

,x
t
},其中x
t
表示第t个周期的流量特征数据。
57.日志数据的预处理过程可以理解为是一个统计过程,由于日志数据中记录的数据是零散的,例如日志数据中记录的是目标对象每小时在目标设备中消耗的流量、每小时在目标设备的各个应用程序中消耗的流量,每分钟在目标设备中消耗的流量、每分钟在目标设备的各个应用程序中消耗的流量等等,零散的数据不利于进行流量预测,因此需要对日志数据进行统计,将零散的数据统计为每个周期内的数据。
58.任一个周期的流量特征数据可以包括以下至少一种:

目标对象在目标设备运行的应用程序中消耗的流量数据;此处在应用程序中消耗的流量数据可以包括两种理解:第一种理解是在应用程序中消耗的总流量数据,例如在目标设备运行的第一应用程序中消耗的流量数据,在目标设备运行的第二应用程序中消耗的流量数据,等等;第二种理解是在应用程序的各个功能中消耗的流量数据,例如在目标设备运行的第一应用程序中的社交会话功能、音视频播放功能等等;应用程序的数量可以为一个或多个,功能的数量可以为一个或多个。

目标对象在目标设备中的剩余流量数据。

目标对象在目标设备中的流量购买数据。

针对目标对象的流量计费数据。

目标对象在不同节假日使用目标设备消耗的流量数据;此处节假日使用目标设备消耗的流量数据可以包括两种理解:第一种理解是节假日使用目标设备消耗的总流量数据,第二种理解是节假日使用目标设备消耗的流量峰值数据(例如取节假日中消耗流量最多的一天的流量数据作为节假日的流量峰值数据)。

目标对象在不同季节使用目标设备消耗的流量数据;此处每个季节使用目标设备消耗的流量数据可以包括两种理解:第一种理解是每个季节使用目标设备消耗的总流量数据,第二种理解是每个季节使用目标设备消耗的流量峰值数据(例如取季节中消耗流量最多的一天的流量数据作为季节的流量峰值数据)。
59.s402,获取目标对象的总流量序列。
60.目标对象的总流量序列可以包括在第t 1个周期之前的n 1个周期的总流量数据,总流量序列可以表示为{y
t-n
,y
t-n 1
,

,y
t
},其中y
t
表示第t个周期的总流量数据。任一个周期的总流量数据用于指示该周期下目标对象在目标设备中消耗的总流量。以一个周期是一个月为例,一种示例性的总流量序列可参见如下表1,表1示出的总流量序列包括36个月(即36个周期)的总流量数据:
61.表1
[0062][0063]
s403,对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列。
[0064]
在获取到目标对象的总流量序列之后,可以对总流量序列进行序列分解处理,得到趋势项序列,季节项序列以及节假日项序列。下面对序列分解处理具体过程进行介绍:
[0065]
(1)对于趋势项序列,可以对总流量序列进行滑动平均处理,得到趋势项序列;趋势项序列可以包括n 1个周期中每个周期的趋势流量数据,趋势项序列可以表示为{g
t-n
,g
t-n 1
,

,g
t
},其中g
t
表示第t个周期的趋势流量数据。滑动平均处理具体可以是采用ma(moving average model,滑动平均)模型进行的,可以取m=12(即12个周期)作为滑动周期。以上述表1为例,2019年1月份的流量数据可以是根据2019年1月份的流量数据和2018年2-11月份的流量数据(即b1、a2、a3、a4、a5、a6、a7、a8、a9、a10、a11、a12)进行平均处理得到的,2020年1月份的流量数据可以是根据2020年1月份的流量数据和2019年2-12个月的流量数据(即c1、b2、b3、b4、b5、b6、b7、b8、b9、b10、b11、b12)进行平均处理得到。
[0066]
(2)对于季节项序列,可以根据总流量序列和趋势项序列,确定季节项序列。具体来说,可以根据总流量序列和趋势项序列,确定去趋势项序列;去趋势项序列可以包括n 1个周期中每个周期的去趋势流量数据,任一个周期的去趋势流量数据可以是根据对应周期的总流量数据和对应周期的趋势流量数据确定的,任一个周期的去趋势流量数据可以等于对应周期的总流量数据减去对应周期的趋势流量数据;去趋势项序列可以表示为{y
t-n-g
t-n
,y
t-n 1-g
t-n 1
,

,y
t-g
t
},其中y
t-g
t
表示第t个周期的去趋势流量数据,第t个周期的去趋势流量数据可以等于第t个周期的总流量数据减去第t个周期的趋势流量数据。然后,可以将一个周期作为一个季节,按照季节对去趋势项序列进行平均处理,得到季节项序列;例如,对于月份数据(即一个周期为一个月,一个月作为一个季节),3月的季节流量数据可以是对去趋势项序列中所有3月的去趋势流量数据的平均,将这些各周期的数据排列结合在一起可以得到季节项序列,以上述表1为例,2019年3月份的流量数据可以是去趋势项序列
中2018年3月的去趋势流量数据与去趋势项序列中2019年3月的去趋势流量数据的平均,2020年3月份的去趋势流量数据可以是去趋势项序列中2019年3月的去趋势流量数据与去趋势项序列中2020年3月的去趋势流量数据的平均。季节项序列可以包括n 1个周期中每个周期的季节流量数据,季节项序列可以表示为{s
t-n
,s
t-n 1
,

,s
t
},其中s
t
表示第t个周期的季节流量数据。
[0067]
(3)对于节假日项序列,可以根据总流量序列、趋势项序列和季节项序列,确定节假日项序列。具体来说,可以根据总流量序列、趋势项序列和季节项序列,确定去趋势去季节项序列;去趋势去季节项序列可以包括n 1个周期中每个周期的去趋势去季节流量数据,任一个周期的去趋势去季节流量数据可以是根据对应周期的总流量数据、对应周期的趋势流量数据和对应周期的季节流量数据确定的,任一个周期的去趋势去季节流量数据可以等于对应周期的总流量数据减去对应周期的趋势流量数据后再减去对应周期的季节流量数据;去趋势去季节项序列可以表示为{y
t-n-g
t-n-s
t-n
,y
t-n 1-g
t-n 1-s
t-n 1
,

,y
t-g
t-s
t
},其中y
t-g
t-s
t
表示第t个周期的去趋势去季节流量数据,第t个周期的去趋势去季节流量数据可以等于第t个周期的总流量数据减去第t个周期的趋势流量数据后再减去第t个周期的季节流量数据。然后,可以按照节假日对去趋势去季节项序列进行平均处理,得到节假日项序列;节假日项序列可以包括n 1个周期中每个周期的节假日流量数据,节假日项序列可以表示为{h
t-n
,h
t-n 1
,

,h
t
},其中h
t
表示第t个周期的节假日流量数据。
[0068]
按照节假日对去趋势去季节项序列进行平均处理,得到节假日项序列的过程可以包括:每个周期可以包含m个节假日,以m个节假日中的第i个节假日为例,第i个节假日的流量数据是对去趋势去季节项序列中所有第i个节假日的流量数据的平均,将这些各周期的数据排列结合在一起可以得到n 1个周期中每个周期内第i个节假日的序列(i=1,2,

,m,每个周期内包含m个节假日,m为正整数,i为小于或等于m的正整数),然后,可以按照下述公式1得到n 1个周期中每个周期的节假日流量数据,即得到节假日项序列。
[0069][0070]
上述公式1以节假日项序列中的第t个周期的节假日流量数据为例,节假日项序列中的除第t个周期外的其他周期均可参见第t周期。在此对上述公式1中的参数进行解释:h
t
表示第t个周期的节假日流量数据;i表示第i个节假日;m表示每个周期内包含m个节假日;表示第t个周期内的第i个节假日的流量数据;di表示第i个节假日前后一段时间区间,表示如果t属于di指示的时间区间则取值为1,如果t不属于di指示的时间区间则取值为0。
[0071]
综上总流量序列分解为趋势项序列、季节项序列和节假日项序列的内容,以第t个周期为例,序列分解处理过程可表示为如下公式2和公式3:
[0072]yt
=g
t
s
t
h
t
ε
t
ꢀꢀ
公式2
[0073]
ε
t
~n(0,1)
ꢀꢀ
公式3
[0074]
下面对上述公式2和公式3中的参数进行解释:y
t
表示第t个周期的总流量数据;g
t
表示第t个周期的趋势流量数据;s
t
表示第t个周期的季节流量数据;h
t
表示第t个周期的节
假日流量数据;ε
t
表示拟合残差序列,n(0,1)表示标准正态分布,即拟合残差序列符合标准正态分布。
[0075]
s404,根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。
[0076]
在对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列之后,然后可以根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。其中,根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据可以包括:根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据;根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据;根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据;根据第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期的节假日流量数据,确定第t 1个周期的总流量数据。
[0077]
本技术实施例中,当需要对目标对象在第t 1个周期的流量使用情况进行流量预测时,可以获取目标对象的流量特征序列和目标对象的整体流量序列,然后可以对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列,再然后可以根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。其中,流量特征序列可以包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据可以用于反映对应周期下目标对象在目标设备中的流量使用特征;总流量序列可以包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据可以用于指示对应周期下目标对象在目标设备中消耗的总流量。由上述内容不难看出,采用流量特征序列参与流量预测,可以使得流量预测结果更加符合目标对象在目标设备中的流量使用特征,提升流量预测结果的准确性;通过对总流量序列进行序列分解处理,可以从不同角度进行流量预测,进一步提升流量预测结果的准确性。通过对日志数据进行统计得到流量特征序列,可以使得用于进行流量预测的数据更加规整,有利于提升流量预测效率。
[0078]
本技术实施例提出一种基于流量的数据处理方法,该流量的数据处理方法主要介绍目标趋势流量预测模型的训练过程、目标趋势流量预测模型的趋势流量预测过程、目标季节流量预测模型的训练过程、目标季节流量预测模型的季节流量预测过程流量特征序列、以及节假日流量预测模型的节假日流量预测过程等内容;该基于流量的数据处理方法可以由上述提及的数据处理系统中的目标设备201或服务器202执行,本技术实施例对此不进行限定。请参见图5,该基于流量的数据处理方法可以包括以下步骤s501至步骤s507:
[0079]
s501,获取目标对象的流量特征序列。
[0080]
本技术实施例中步骤s501的执行过程与上述图4所示实施例中步骤s401的执行过程相同,具体可参见上述图4所示实施例中步骤s401的描述,在此不再赘述。
[0081]
s502,获取目标对象的总流量序列。
[0082]
本技术实施例中步骤s502的执行过程与上述图4所示实施例中步骤s402的执行过程相同,具体可参见上述图4所示实施例中步骤s402的描述,在此不再赘述。
[0083]
s503,对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列。
[0084]
本技术实施例中步骤s503的执行过程与上述图4所示实施例中步骤s403的执行过程相同,具体可参见上述图4所示实施例中步骤s403的描述,在此不再赘述。
[0085]
s504,根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据。
[0086]
第t 1个周期的趋势流量数据可以是调用目标趋势流量预测模型进行趋势流量预测得到的,目标趋势流量预测模型可以是对初始趋势流量预测模型进行训练得到的,本技术实施例提及的初始趋势流量预测模型和目标趋势流量预测模型具体可以是指rnn(recurrent neural network,循环神经网络)模型,rnn是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络,其目的是为了处理时间序列数据。初始趋势流量预测模型的训练过程可以包括:首先,可以获取初始趋势流量预测模型。其次,可以根据目标对象的对象标识对流量特征序列{x
t-n
,x
t-n 1
,

,x
t
}进行链接构建,得到趋势训练序列;趋势训练序列可以包括n 1个周期中每个周期的趋势训练数据,趋势训练序列可以表示为{sa
t-n
,sa
t-n 1
,

,sa
t
},其中sa
t
表示第t个周期的趋势训练数据;此处链接构建可以理解为:当流量特征序列中的任一个流量特征数据包括多项内容时,例如,任一个流量特征数据包括目标对象在目标设备运行的第一应用程序中消耗的流量数据,和目标对象在目标设备运行的第二应用程序中消耗的流量数据,并且第一应用程序和第二应用程序都是采用目标对象的对象标识进行登录注册的,那么可以通过目标对象的对象标识将这两项内容关联起来,一起作为趋势训练序列中的趋势训练数据。然后,可以在趋势训练序列中确定训练样本序列和测试样本序列,训练样本序列和测试样本序列可以是按照预设比例从趋势训练序列中抽取的,例如可以从趋势训练序列中随机抽取预设比例(例如可以是80%)的趋势训练数据作为训练样本序列,趋势训练序列中除训练样本序列包含的趋势训练数据外的其他趋势训练数据可以作为训练测试样本;其中,训练样本可以用于对初始趋势流量预测模型训练得到目标趋势流量预测模型,测试样本序列可以用于测试目标趋势流量预测模型的性能。初始趋势流量预测模型可以表示为如下公式4和公式5:
[0087]gt
=rnn(x
t
,g
t-1
)
ꢀꢀ
公式4
[0088][0089]
上述公式以第t个周期和第t-1个周期为例进行示意,在此对上述公式4和公式5中的参数进行解释:g
t
表示第t个周期的趋势流量数据,g
t-1
表示第t-1个周期的趋势流量数据;x
t
表示第t个周期的流量特征数据,x
t-1
表示第t-1个周期的流量特征数据;k
t
和k
t-1
表示隐藏层向量;wk、wg和uk表示参数矩阵;bk和bg表示参数向量;σk和σg表示激活函数,例如σk可以为tanh(双曲正切)函数或relu(linear rectification function,线性整流函数),σg可以为sigmoid函数;隐藏层k0可以采用第t-n个周期的趋势流量数据(即g0=g
t-n
)。
[0090]
在趋势训练序列中确定训练样本序列和测试样本序列之后,可以根据趋势项序列、训练样本序列和测试样本序列对初始趋势流量预测模型进行训练,得到参数矩阵和参数矩阵从而可以得到目标趋势流
量预测模型。
[0091]
在训练得到目标趋势流量预测模型之后,可以在流量特征序列{x
t-n
,x
t-n 1
,

,x
t
}中确定特征预测序列,特征预测序列可以包括流量特征序列中从第t-n 1个周期开始到第t个周期结束的共n个周期的流量特征数据,特征预测序列可以表示为{x
t-n 1
,x
t-n 2
,

,x
t
};然后,可以调用目标趋势流量预测模型根据特征预测序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据其中,在调用目标趋势流量预测模型进行趋势流量预测的过程中,可以将趋势项序列中包括的第t-n 1个周期的趋势流量数据作为隐藏层k0,将特征预测序列{x
t-n 1
,x
t-n 2
,

,x
t
}作为目标趋势流量预测模型的输入数据,经过目标趋势流量预测模型的预测,目标趋势流量预测模型的输出数据为第t 1个周期的趋势流量数据
[0092]
s505,根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据。
[0093]
第t 1个周期的季节流量数据可以是调用目标季节流量预测模型进行季节流量预测得到的,目标季节流量预测模型可以是对初始季节流量预测模型进行训练得到的,初始季节流量预测模型的训练过程可以包括:首先,可以获取初始季节流量预测模型。其次,可以在季节项序列{s
t-n
,s
t-n 1
,

,s
t
}中确定季节训练序列,季节训练序列可以包括季节项序列中从第t-n个周期开始到第t-1个周期结束的共n个周期的季节流量数据,季节训练数据可以表示为{s
t-n
,s
t-n 1
,

,s
t-1
}。然后,可以从季节训练序列中确定训练样本序列和测试样本序列,训练样本序列和测试样本序列可以是按照预设比例从季节训练序列中抽取的,例如可以从季节训练序列中随机抽取预设比例(例如可以是80%)的季节流量数据作为训练样本序列,季节训练序列中除训练样本序列包含的季节流量数据外的其他季节流量数据可以作为训练测试样本;其中,训练样本序列可以用于对初始季节流量预测模型进行训练得到目标季节流量预测模型,测试样本序列可以用于测试目标季节流量预测模型的性能。再然后,可以根据训练样本序列和测试样本序列对初始季节流量模型进行训练,以便于得到目标季节流量预测模型。初始季节流量预测模型可以表示为下述公式6:
[0094][0095]
上述公式6以季节项序列中的第t个周期的节假日流量数据为例,季节项序列中的除第t个周期外的其他周期均可参见第t个周期。在此对上述公式6中的参数进行解释:s
t
可以表示第t个周期的季节流量数据;n表示季节的数量为n个;tn可以表示第n个时间周期,n为大于或等于1,且小于或等于n的整数;a和b均为初始季节流量预测模型的模型参数。
[0096]
基于上述公式6,根据训练样本序列和测试样本序列对所述初始季节流量模型进行训练的过程可以包括:可以将训练样本序列中的各个周期的季节流量数据代入上述公式6进行线性回归处理,得到初始季节流量预测模型的模型参数的参数值(包括上述模型参数a的参数值和模型参数b的参数值),然后可以将模型参数的参数值代入上述公式6中,得到中间季节流量预测模型,然后可以根据测试样本序列对目标季节流量模型进行性能测试,并在性能测试结果不满足性能条件时不断优化中间季节流量预测模型的模型参数,直至性能测试结果满足性能条件为止,并可以将性能测试结果满足性能条件的中间季节流量预测
模型确定为目标季节流量预测模型。
[0097]
在训练得到目标季节流量预测模型之后,可以在季节项序列中确定季节预测序列,季节预测序列可以包括季节项序列中从第t-n 1个周期开始到第t个周期结束的共n个周期的季节流量数据,季节预测序列可以表示为{s
t-n 1
,s
t-n 2
,

,s
t
},然后可以调用目标季节流量预测模型根据季节预测序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据,第t 1个周期的季节流量数据可以表示为
[0098]
s506,根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据。
[0099]
由前述内容可知,节假日项序列{h
t-n
,h
t-n 1
,

,h
t
}可以包括n 1个周期中每个周期的节假日流量数据,根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据的过程可以包括:
[0100]
首先,可以调用节假日流量预测模型获取n 1个周期中每个周期的节假日流量数据对应的节假日数据序列,任一个节假日数据序列可以包括对应周期下的m个节假日的流量数据,m为正整数;以第t个周期为例,第t个周期对应的节假日数据序列可以表示为n 1个周期中所有周期的节假日流量数据对应的节假日数据序列可以总体表示为
[0101]
其次,可以确定m个节假日中每个节假日的预测流量数据,以m个节假日中的第i个节假日为例,m个节假日中的第i个节假日的预测流量数据可以是n 1个周期中每个周期下的第i个节假日的流量数据的平均值,i为小于或等于m的正整数;m个节假日中的第i个节假日的预测流量数据的确定过程可参见下述公式7:
[0102][0103]
在此对上述公式7中的参数进行解释:表示第i个节假日的预测流量数据;表示第t-j个周期下的第i个节假日的流量数据;表示n 1个周期下的第i个节假日的流量数据的总和。
[0104]
然后,可以根据m个节假日中每个节假日的预测流量数据,确定第t 1个周期的节假日流量数据。该过程具体可以参见下述公式8:
[0105][0106]
在此对上述公式8中的参数进行解释:表示第t 1个周期的节假日流量数据;表示第i个节假日的预测流量数据;di表示第i个节假日前后一段时间区间,表示如果t 1属于di指示的时间区间则取值为1,如果t 1不属于di指示的时间区间则取值为0。
[0107]
s507,根据第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期的节假日流量数据,确定第t 1个周期的总流量数据。
[0108]
根据第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期
的节假日流量数据,确定第t 1个周期的总流量数据可以包括:将第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期的节假日流量数据相加,得到第t 1个周期的总流量数据。根据第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期的节假日流量数据,确定第t 1个周期的总流量数据的过程可参见下述公式9:
[0109][0110]
下面对上述公式9中的参数进行解释:表示第t 1个周期的总流量数据;表示第t 1个周期的趋势流量数据;表示第t 1个周期的季节流量数据;表示第t 1个周期的节假日流量数据。
[0111]
本技术实施例中,当需要对目标对象在第t 1个周期的流量使用情况进行流量预测时,可以获取目标对象的流量特征序列和目标对象的整体流量序列,然后可以对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列,再然后可以根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。其中,流量特征序列可以包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据可以用于反映对应周期下目标对象在目标设备中的流量使用特征;总流量序列可以包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据可以用于指示对应周期下目标对象在目标设备中消耗的总流量。由上述内容不难看出,采用流量特征序列参与流量预测,可以使得流量预测结果更加符合目标对象在目标设备中的流量使用特征,提升流量预测结果的准确性;通过对总流量序列进行序列分解处理,可以从不同角度进行流量预测,进一步提升流量预测结果的准确性。
[0112]
上述详细阐述了本技术实施例的方法,为了便于更好地实施本技术实施例的上述方案,相应地,下面提供了本技术实施例的装置。
[0113]
请参见图6,图6是本技术实施例提供的一种基于流量的数据处理装置的结构示意图,该基于流量的数据处理装置可以设置于本技术实施例提供的计算机设备中。该基于流量的数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),该计算机设备可以是前述所提及的目标设备或服务器,该基于流量的数据处理装置可以用于执行图4或图5所示的方法实施例中的相应步骤。请参见图6,该基于流量的数据处理装置可以包括如下单元:
[0114]
获取单元601,用于获取目标对象的流量特征序列;流量特征序列包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据用于反映对应周期下目标对象在目标设备中的流量使用特征,n为正整数;以及,获取目标对象的总流量序列;总流量序列包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据用于指示对应周期下目标对象在目标设备中消耗的总流量;
[0115]
处理单元602,用于对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列;以及,根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。
[0116]
在一种实现方式中,任一个周期的流量特征数据包括以下至少一种:目标对象在目标设备运行的应用程序中消耗的流量数据、目标对象在目标设备中的剩余流量数据、目标对象在目标设备中的流量购买数据、针对目标对象的流量计费数据、所述目标对象在不
同节假日使用目标设备消耗的流量数据、以及目标对象在不同季节使用目标设备消耗的流量数据。
[0117]
在一种实现方式中,处理单元602,用于根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据时,具体用于执行如下步骤:
[0118]
根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据;根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据;根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据;根据第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期的节假日流量数据,确定第t 1个周期的总流量数据。
[0119]
在一种实现方式中,趋势项序列包括n 1个周期中每个周期的趋势流量数据;处理单元602,用于根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据时,具体用于执行如下步骤:
[0120]
在流量特征序列中确定特征预测序列,特征预测序列包括流量特征序列中从第t-n 1个周期开始到第t个周期结束的共n个周期的流量特征数据;调用目标趋势流量预测模型根据特征预测序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据。
[0121]
在一种实现方式中,处理单元602,还用于执行如下步骤:
[0122]
获取初始趋势流量预测模型;根据目标对象的对象标识对流量特征序列进行连接构建,得到趋势训练序列,趋势训练序列包括n 1个周期中每个周期的趋势训练数据;在趋势训练序列中确定训练样本序列和测试样本序列;根据趋势项序列、训练样本序列和测试样本序列对初始流量预测模型进行训练,以便于得到目标趋势流量预测模型。
[0123]
在一种实现方式中,季节项序列包括n 1个周期中每个周期的季节流量数据;处理单元602,用于根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据时,具体用于执行如下步骤:
[0124]
在季节项序列中确定季节预测序列,季节预测序列包括季节项序列中从第t-n 1个周期开始到第t个周期结束的共n个周期的季节流量数据;调用目标季节流量预测模型根据季节预测序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据。
[0125]
在一种实现方式中,处理单元602,还用于执行如下步骤:
[0126]
获取初始季节流量预测模型;在季节项序列中确定季节训练序列,季节训练序列包括季节项序列中从第t-n个周期开始到第t-1个周期结束的共n个周期的季节流量数据;从季节训练序列中确定训练样本序列和测试样本序列;根据训练样本序列和测试样本序列对初始季节流量模型进行训练,以便于得到目标季节流量预测模型。
[0127]
在一种实现方式中,节假日项序列包括n 1个周期中每个周期的节假日流量数据,处理单元602,用于根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据时,具体用于执行如下步骤:
[0128]
调用节假日流量预测模型获取n 1个周期中每个周期的节假日流量数据对应的节假日数据序列,节假日数据序列包括对应周期下的m个节假日的流量数据,m为正整数;确定m个节假日中每个节假日的预测流量数据,m个节假日中的第i个节假日的预测流量数据是n
1个周期中每个周期下的第i个节假日的流量数据的平均值,i为小于或等于m的正整数;根据m个节假日中每个节假日的预测流量数据,确定第t 1个周期的节假日流量数据。
[0129]
在一种实现方式中,处理单元602,用于对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列时,具体用于执行如下步骤:
[0130]
对总流量序列进行滑动平均处理,得到趋势项序列,趋势项序列包括n 1个周期中每个周期的趋势流量数据;根据总流量序列和趋势项序列,确定季节项序列;根据总流量序列、趋势项序列和季节项序列,确定节假日项序列。
[0131]
在一种实现方式中,处理单元602,用于根据总流量序列和趋势项序列,确定季节项序列时,具体用于执行如下步骤:
[0132]
根据总流量序列和趋势项序列,确定去趋势项序列;去趋势项序列包括n 1个周期中每个周期的去趋势流量数据,任一个周期的去趋势流量数据是根据对应周期的总流量数据和对应周期的趋势流量数据确定的;按照季节对去趋势项序列进行平均处理,得到季节项序列,季节项序列包括n 1个周期中每个周期的季节流量数据。
[0133]
在一种实现方式中,处理单元602,用于根据总流量序列、趋势项序列和季节项序列,确定节假日项序列时,具体用于执行如下步骤:
[0134]
根据总流量序列、趋势项序列和季节项序列,确定去趋势去季节项序列;去趋势去季节项序列包括n 1个周期中每个周期的去趋势去季节流量数据,任一个周期的去趋势去季节流量数据是根据对应周期的总流量数据、对应周期的趋势流量数据和对应周期的季节流量数据确定的;按照节假日对去趋势去季节项序列进行平均处理,得到节假日项序列,所述节假日项序列包括n 1个周期中每个周期的节假日流量数据。
[0135]
根据本技术的另一个实施例,图6所示的基于流量的数据处理装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本技术的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本技术的其它实施例中,基于流量的数据处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
[0136]
根据本技术的另一个实施例,可以通过在包括中央处理单元(cpu)、随机存取存储介质(ram)、只读存储介质(rom)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图4或图5所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)来构造如图6中所示的基于流量的数据处理装置,以及来实现本技术实施例的基于流量的数据处理方法。计算机程序可以记载于例如计算机可读存储介质上,并通过计算机可读存储介质装载于上述计算设备中,并在其中运行。
[0137]
本技术实施例中,当需要对目标对象在第t 1个周期的流量使用情况进行流量预测时,可以获取目标对象的流量特征序列和目标对象的整体流量序列,然后可以对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列,再然后可以根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。其中,流量特征序列可以包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据可以用于反映对应周期下目标对象在目标设备中的流量使用特征;
总流量序列可以包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据可以用于指示对应周期下目标对象在目标设备中消耗的总流量。由上述内容不难看出,采用流量特征序列参与流量预测,可以使得流量预测结果更加符合目标对象在目标设备中的流量使用特征,提升流量预测结果的准确性;通过对总流量序列进行序列分解处理,可以从不同角度进行流量预测,进一步提升流量预测结果的准确性。
[0138]
基于上述方法以及装置实施例,本技术实施例提供了一种计算机设备,请参见图7,图7是本技术实施例提供的一种计算机设备的结构示意图。图7所示的计算机设备至少包括处理器701、输入接口702、输出接口703以及计算机可读存储介质704。其中,处理器701、输入接口702、输出接口703以及计算机可读存储介质704可通过总线或其他方式连接。
[0139]
输入接口702可以用于获取流量特征序列、总流量序列等等;输出接口703可以用于输出预测得到的第t 1个周期的总流量数据等等。
[0140]
计算机可读存储介质704可以存储在计算机设备的存储器中,计算机可读存储介质704用于存储计算机程序,计算机程序包括计算机指令,处理器701用于执行计算机可读存储介质704存储的程序指令。处理器701(或称cpu(central processing unit,中央处理器))是计算机设备的计算核心以及控制核心,其适于实现一条或多条计算机指令,具体适于加载并执行一条或多条计算机指令从而实现相应方法流程或相应功能。
[0141]
本技术实施例还提供了一种计算机可读存储介质(memory),计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了计算机设备的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或多条的计算机指令,这些计算机指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速ram存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机可读存储介质。
[0142]
计算机设备可以是前述提及的目标设备或服务器,可由处理器701加载并执行计算机可读存储介质704中存放的一条或多条计算机指令,以实现上述有关图4或图5所示的基于流量的数据处理方法的相应步骤。具体实现中,计算机可读存储介质704中的计算机指令由处理器701加载并执行如下步骤:
[0143]
获取目标对象的流量特征序列;流量特征序列包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据用于反映对应周期下目标对象在目标设备中的流量使用特征,n为正整数;以及,获取目标对象的总流量序列;总流量序列包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据用于指示对应周期下目标对象在目标设备中消耗的总流量;对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列;以及,根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。
[0144]
在一种实现方式中,任一个周期的流量特征数据包括以下至少一种:目标对象在目标设备运行的应用程序中消耗的流量数据、目标对象在目标设备中的剩余流量数据、目标对象在目标设备中的流量购买数据、针对目标对象的流量计费数据、所述目标对象在不
同节假日使用目标设备消耗的流量数据、以及目标对象在不同季节使用目标设备消耗的流量数据。
[0145]
在一种实现方式中,计算机可读存储介质704中的计算机指令由处理器701加载并执行根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据时,具体用于执行如下步骤:
[0146]
根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据;根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据;根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据;根据第t 1个周期的趋势流量数据、第t 1个周期的季节流量数据和第t 1个周期的节假日流量数据,确定第t 1个周期的总流量数据。
[0147]
在一种实现方式中,趋势项序列包括n 1个周期中每个周期的趋势流量数据;计算机可读存储介质704中的计算机指令由处理器701加载并执行根据流量特征序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据时,具体用于执行如下步骤:
[0148]
在流量特征序列中确定特征预测序列,特征预测序列包括流量特征序列中从第t-n 1个周期开始到第t个周期结束的共n个周期的流量特征数据;调用目标趋势流量预测模型根据特征预测序列和趋势项序列对第t 1个周期进行趋势流量预测,得到第t 1个周期的趋势流量数据。
[0149]
在一种实现方式中,计算机可读存储介质704中的计算机指令由处理器701加载并还用于执行如下步骤:
[0150]
获取初始趋势流量预测模型;根据目标对象的对象标识对流量特征序列进行连接构建,得到趋势训练序列,趋势训练序列包括n 1个周期中每个周期的趋势训练数据;在趋势训练序列中确定训练样本序列和测试样本序列;根据趋势项序列、训练样本序列和测试样本序列对初始流量预测模型进行训练,以便于得到目标趋势流量预测模型。
[0151]
在一种实现方式中,季节项序列包括n 1个周期中每个周期的季节流量数据;计算机可读存储介质704中的计算机指令由处理器701加载并执行根据季节项序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据时,具体用于执行如下步骤:
[0152]
在季节项序列中确定季节预测序列,季节预测序列包括季节项序列中从第t-n 1个周期开始到第t个周期结束的共n个周期的季节流量数据;调用目标季节流量预测模型根据季节预测序列对第t 1个周期进行季节流量预测,得到第t 1个周期的季节流量数据。
[0153]
在一种实现方式中,计算机可读存储介质704中的计算机指令由处理器701加载并还用于执行如下步骤:
[0154]
获取初始季节流量预测模型;在季节项序列中确定季节训练序列,季节训练序列包括季节项序列中从第t-n个周期开始到第t-1个周期结束的共n个周期的季节流量数据;从季节训练序列中确定训练样本序列和测试样本序列;根据训练样本序列和测试样本序列对初始季节流量模型进行训练,以便于得到目标季节流量预测模型。
[0155]
在一种实现方式中,节假日项序列包括n 1个周期中每个周期的节假日流量数据,计算机可读存储介质704中的计算机指令由处理器701加载并执行根据节假日项序列对第t 1个周期进行节假日流量预测,得到第t 1个周期的节假日流量数据时,具体用于执行如下
步骤:
[0156]
调用节假日流量预测模型获取n 1个周期中每个周期的节假日流量数据对应的节假日数据序列,节假日数据序列包括对应周期下的m个节假日的流量数据,m为正整数;确定m个节假日中每个节假日的预测流量数据,m个节假日中的第i个节假日的预测流量数据是n 1个周期中每个周期下的第i个节假日的流量数据的平均值,i为小于或等于m的正整数;根据m个节假日中每个节假日的预测流量数据,确定第t 1个周期的节假日流量数据。
[0157]
在一种实现方式中,计算机可读存储介质704中的计算机指令由处理器701加载并执行对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列时,具体用于执行如下步骤:
[0158]
对总流量序列进行滑动平均处理,得到趋势项序列,趋势项序列包括n 1个周期中每个周期的趋势流量数据;根据总流量序列和趋势项序列,确定季节项序列;根据总流量序列、趋势项序列和季节项序列,确定节假日项序列。
[0159]
在一种实现方式中,计算机可读存储介质704中的计算机指令由处理器701加载并执行根据总流量序列和趋势项序列,确定季节项序列时,具体用于执行如下步骤:
[0160]
根据总流量序列和趋势项序列,确定去趋势项序列;去趋势项序列包括n 1个周期中每个周期的去趋势流量数据,任一个周期的去趋势流量数据是根据对应周期的总流量数据和对应周期的趋势流量数据确定的;按照季节对去趋势项序列进行平均处理,得到季节项序列,季节项序列包括n 1个周期中每个周期的季节流量数据。
[0161]
在一种实现方式中,计算机可读存储介质704中的计算机指令由处理器701加载并执行根据总流量序列、趋势项序列和季节项序列,确定节假日项序列时,具体用于执行如下步骤:
[0162]
根据总流量序列、趋势项序列和季节项序列,确定去趋势去季节项序列;去趋势去季节项序列包括n 1个周期中每个周期的去趋势去季节流量数据,任一个周期的去趋势去季节流量数据是根据对应周期的总流量数据、对应周期的趋势流量数据和对应周期的季节流量数据确定的;按照节假日对去趋势去季节项序列进行平均处理,得到节假日项序列,所述节假日项序列包括n 1个周期中每个周期的节假日流量数据。
[0163]
本技术实施例中,当需要对目标对象在第t 1个周期的流量使用情况进行流量预测时,可以获取目标对象的流量特征序列和目标对象的整体流量序列,然后可以对总流量序列进行序列分解处理,得到趋势项序列、季节项序列以及节假日项序列,再然后可以根据流量特征序列、趋势项序列、季节项序列以及节假日项序列进行流量预测,得到第t 1个周期的总流量数据。其中,流量特征序列可以包括在第t 1个周期之前的n 1个周期的流量特征数据,流量特征数据可以用于反映对应周期下目标对象在目标设备中的流量使用特征;总流量序列可以包括在第t 1个周期之前的n 1个周期的总流量数据,总流量数据可以用于指示对应周期下目标对象在目标设备中消耗的总流量。由上述内容不难看出,采用流量特征序列参与流量预测,可以使得流量预测结果更加符合目标对象在目标设备中的流量使用特征,提升流量预测结果的准确性;通过对总流量序列进行序列分解处理,可以从不同角度进行流量预测,进一步提升流量预测结果的准确性。
[0164]
根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算
机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选方式中提供的基于流量的数据处理方法。
[0165]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献