技术新讯 > 电子通信装置的制造及其应用技术 > 一种基于时空序列的网络流量预测方法及系统  >  正文

一种基于时空序列的网络流量预测方法及系统

  • 国知局
  • 2024-08-05 12:18:09

本发明涉及网络流量预测领域,具体涉及一种基于时空序列的网络流量预测方法及系统。

背景技术:

1、随着5g/b5g、边缘计算、nfv等技术的发展,网民数量以及网民上网时间不断增长,这导致近年来网络流量激增,对网络进行精细化、自动化、智能化运维及管理将成为新的挑战。为应对这一挑战,需要对应用级网络流量进行精准感知。而无线网络流量预测则是核心技术之一。精准及时的流量预测可以帮助改善通信网络管理,优化网络资源分配方式,改善资源浪费与网络拥堵,从而提高通信网络效能。

2、传统的流量预测方法可以分为基于统计学的方法和基于机器学习的方法,基于统计学的网络流量预测方法将流量预测视为时间序列预测问题,可以从大量流量数据中学习网络流量的线性和非线性特征,例如周期性和季节性,从而做出预测。这类方法包含例如经典的自回归(ar)和滑动平均(ma)以及自回归综合移动平均(arima)和α-稳定模型。但是无线网络流量的结构实际上非常复杂,包含网络基站空间拓扑结构、基站数量、用户移动性、用户行为需求、到达模式等多种影响因素,这些因素使不同基站的蜂窝流量之间的时空依赖性变得复杂。基于统计学的模型依赖于平稳假设,无法同时建模考虑多种因素的影响,无法克服随机事件的干扰,也无法处理多维复杂数据。

3、为了捕获隐藏在无线流量数据中的复杂和非线性依赖性,机器学习模型已被用于提高网络流量预测的精度。基于机器学习的预测方法主要包括基于决策树(dt)、支持向量机(svm)、贝叶斯网络(bn)、隐马尔可夫模型(hmm)等方法。基于机器学习的预测方法同时考虑了网络流量数据的时间和空间特性,在短期序列预测上取得了较好的结果,但是对于具有多维、动态时空特征的网络流量数据来说,机器学习方法难以捕获隐藏的复杂特征,并且较难实现全网范围和中长期流量预测。

技术实现思路

1、针对现有技术中的上述不足,本发明提供的一种基于时空序列的网络流量预测方法及系统解决了现有网络流量预测方法难以兼顾空间特征、时间特征和外部影响因素,导致预测效果差的问题。

2、为了达到上述发明目的,本发明采用的技术方案为:

3、提供一种基于时空序列的网络流量预测方法,其包括以下步骤:

4、s1、获取并对目标区域的流量数据进行时间和空间上的矩阵化,得到矩阵化后的数据;

5、s2、通过密集连接的卷积神经网络获取矩阵化后的数据中的空间特征;

6、s3、将矩阵化后的数据中的空间特征作为扩散卷积门控循环单元的输入,获取矩阵化后的数据中的时间特征;

7、s4、对目标区域的流量数据中的外部影响因素数据进行建模,通过卷积方法获取外部影响因素数据中的影响特征;

8、s5、将矩阵化后的数据中的空间特征、矩阵化后的数据中的时间特征和外部影响因素数据中的影响特征分别进行卷积后组合为一个矩阵,得到组合矩阵;将组合矩阵与权重矩阵相乘,通过sigmoid函数对相乘结果进行激活,得到网络流量预测结果。

9、进一步地,步骤s1中获取并对目标区域的流量数据进行时间和空间上的矩阵化的具体方法包括以下子步骤:

10、s1-1、将目标区域均分为n×n个单元,得到空间地理单元集合

11、s1-2、将短信服务、电话呼叫服务和互联网访问作为三种不同类型的服务;

12、s1-3、分别获取三种不同类型的服务在各个空间地理单元的流量数据;

13、s1-4、将第k种服务类型在t时间间隔内的蜂窝流量表示为一组时空矩阵:其中v=1,2,3,分别对应短信服务、电话呼叫服务和互联网访问;中每一个元素代表第k种服务类型在t时刻的相应空间地理单元位置处的流量数据;表示实数域;v(n,n)表示空间地理单元集合中第n行第n列处的空间地理单元。

14、进一步地,步骤s2中卷积神经网络包括l个采用密集连接的基本模块,每个基本模块均包括依次连接的卷积层、批归一化层和激活层;第l个基本模块的计算表达式为:

15、

16、其中表示卷积神经网络中第l个基本模块的输出;表示卷积神经网络的输入;表示卷积神经网络中第l-1个基本模块的输出;卷积神经网络中第l个基本模块的输出即为矩阵化后的数据中的空间特征。

17、进一步地,步骤s3中扩散卷积门控循环单元包括m个计算子单元,第m个计算子单元的表达式为:

18、

19、

20、

21、h(m)=u(m)⊙h(m-1)+(1-u(m))⊙c(m)

22、r(m)为第m个计算子单元的重置门的输出;u(m)为第m个计算子单元的更新门的输出;c(m)为第m个计算子单元的候选记忆细胞的输出,h(m)为第m个计算子单元输出的隐藏状态;和均为扩散卷积操作;x(m)为第m个计算子单元的输入;h(m-1)为第m-1个计算子单元输出的隐藏状态;tanh(.)表示双曲正切函数;br、bu、bc均为偏置项;σ(.)表示sigmoid函数;⊙表示哈达玛积;第m个计算子单元输出的隐藏状态为矩阵化后的数据中的空间特征中的时间特征当m取值为1时,x(m)为矩阵化后的数据,h(0)表示初始隐藏状态,h(0)的值通过全零初始化方法进行设定。

23、进一步地,步骤s4中获取外部影响因素数据中的影响特征的具体方法包括以下子步骤:

24、s4-1、通过google api抓取目标区域中的外部影响因素数据;其中外部影响因素数据包括基站数量、兴趣点分布和社交活动水平;

25、s4-2、将同一种外部影响因素数据划分为n×n的矩阵,使其映射到空间地理单元集合分别得到基站数量矩阵、兴趣点分布矩阵和社交活动水平矩阵;

26、s4-3、将基站数量矩阵、兴趣点分布矩阵和社交活动水平矩阵进行级联,得到外部影响矩阵;

27、s4-4、将外部影响矩阵与张量矩阵进行卷积操作后,对该卷积操作结果进行非线性变换,得到外部影响因素数据中的影响特征ocross。

28、进一步地,基站数量矩阵、兴趣点分布矩阵和社交活动水平矩阵的表达式分别为:

29、

30、

31、

32、其中dbs为基站数量矩阵;dpoi为兴趣点分布矩阵;dsocial为社交活动水平矩阵;表示第n行第n列处的空间地理单元中的基站数量;表示第n行第n列处的空间地理单元中的兴趣点值;表示第n行第n列处的空间地理单元中的社交活动水平值。

33、进一步地,非线性变换包括三个连续运算的复合函数;其中三个连续运算的复合函数分别为批归一化处理、修正线性和卷积。

34、进一步地,步骤s5中将组合矩阵与权重矩阵相乘的计算表达式为:

35、

36、其中y为网络流量预测结果,w为权重矩阵;为组合矩阵;为矩阵化后的数据中的空间特征经过卷积后的结果;为矩阵化后的数据中的时间特征经过卷积后的结果;ocross′为外部影响因素数据中的影响特征经过卷积后的结果。

37、提供一种基于时空序列的网络流量预测系统,其包括目标区域数据处理模块、空间处理模块、时间处理模块、外部因素处理模块和参数矩阵融合模块;

38、目标区域数据处理模块,用于获取并对目标区域的流量数据进行时间和空间上的矩阵化,得到矩阵化后的数据;对目标区域的流量数据中的外部影响因素数据进行建模;

39、空间处理模块,用于通过密集连接的卷积神经网络获取矩阵化后的数据中的空间特征;

40、时间处理模块,用于将矩阵化后的数据中的空间特征作为扩散卷积门控循环单元的输入,获取矩阵化后的数据中的时间特征;

41、外部因素处理模块,用于通过卷积方法获取外部影响因素数据中的影响特征;

42、参数矩阵融合模块,用于将矩阵化后的数据中的空间特征、矩阵化后的数据中的时间特征和外部影响因素数据中的影响特征分别进行卷积后组合为一个矩阵,得到组合矩阵;将组合矩阵与权重矩阵相乘,通过sigmoid函数对相乘结果进行激活,得到网络流量预测结果。

43、本发明的有益效果为:

44、1、本发明解决了现有方法存在的时空因素分析不足、非线性特征提取不充分、长期预测准确性低的技术问题,可以准确预测网络流量。

45、2、本发明综合考虑流量数据的时空因素和基站信息、poi分布和社交活动水平等外部影响因素,通过这种综合考虑,可以更全面地分析网络流量的变化规律,提高预测的准确性和可靠性;

46、3、本发明采用huber误差作为损失函数,既考虑了小误差范围内的模型精确度,又能在面对较大误差时,通过类似于绝对误差的形式减少异常值的不利影响,从而在多种情况下都能保持较好的性能和稳定性。由于网络流量数据在节假日时会出现一些异常值,所以采用huber误差作为损失函数提高了系统的性能。

本文地址:https://www.jishuxx.com/zhuanli/20240802/262044.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。