技术新讯 > 电子通信装置的制造及其应用技术 > 星地一体化网络的动态SFC映射方法及装置  >  正文

星地一体化网络的动态SFC映射方法及装置

  • 国知局
  • 2024-08-02 14:05:45

本发明涉及移动通信,特别涉及一种星地一体化网络的动态sfc映射方法和一种星地一体化网络的动态sfc映射装置。

背景技术:

1、6g星地一体化网络(satellite-ground integrated network,sgin)被视为一种典型的6g网络架构,扩展了无线网络的覆盖范围,被认为是6g移动通信网络的重要发展方向;sgin由地面网络段和空间网络段组成,通过利用地面网络具有丰富计算资源和空间网络段通信覆盖范围广的特征,为新兴的应用提供无处不在、高质量的网络服务。

2、在sgin中,需要一个灵活高效的资源管理框架分配不同网段(即卫星网段和地面网段)的异构网络资源(如计算和通信资源);网络功能虚拟化(network functionvirtualization,nfv)和软件定义网络(software defined network,sdn)技术能够进行高效的资源配置效率,实现地面网络与卫星网络的深度融合;利用nfv技术,网络功能(如防火墙和网络地址转换)从具有特定功能的硬件网络设备中解耦,并软件化为虚拟网络功能(virtualized network function,vnf),部署在通用的商用服务器上;为了保证高效的端到端数据传输,sdn技术通过openflow协议在可编程交换机上配置报文转发规则,将控制平面与数据平面解耦,实现网络集中控制。基于nfv和sdn技术,端到端的网络服务以服务功能链(service function chain,sfc)的形式提供,其中每个服务链由一系列vnfs按照预定义的顺序通过虚拟链路连接而成;这些vnfs可以在异构的网络节点(即卫星和地面节点)上部署和执行。

3、sgin是一个异构的网络,包含卫星网络段和地面网络段,它们具有互补的网络特征;卫星网络段能以一种低成本的方式实现全球通信覆盖,但其通信带宽和计算资源有限;地面网络段有充足的通信和计算资源,但它的覆盖范围受限。考虑到流量动态变化的应用场景,在星地一体化网络中,如何动态地选择sfc映射策略,利用不同网段的互补特性,实现网络资源和vnf迁移成本与服务收益的平衡,最大化网络的长期收益,是一个重要的问题。

4、目前,已有一些工作对sgin场景下的sfc映射问题进行研究,在稳定的网络拓扑和业务流量下,能够实现高效地sfc映射;但是,当发生网络状态变化(例如,链路连接或网络流量负载变化)时,需要动态地确定sfc映射决策,此外,卫星的移动和sfc映射策略的变化引起的vnf迁移成本也被考虑。

技术实现思路

1、本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本发明的一个目的在于提出一种星地一体化网络的动态sfc映射方法,能够根据不断变化的网络状态确定sfc映射策略集合,从而最大化长期的网络收益。

2、本发明的第二个目的在于提出一种星地一体化网络的动态sfc映射装置。

3、为达到上述目的,本发明第一方面实施例提出了一种星地一体化网络的动态sfc映射方法,包括以下步骤:构建星地一体化网络,并采用广度优先法搜索星地一体化网络中每个业务流所有的sfc映射策略,选取每个业务流的一个sfc映射策略进行组合,构建多业务流的sfc映射策略集合;获取历史的网络流量负载,并采用聚类算法对所述网络流量负载进行分类,以得到多类网络流量负载;采用贪婪算法根据资源共享率值和网络估计收益搜索每一类网络流量负载对应的最优sfc映射策略集合,以得到最终的sfc映射策略集合;将星地一体化网络场景下的动态sfc映射问题建模为马尔可夫决策过程,其中,决策过程被划分为多个时间段,每个时间段包含多个时隙,星地一体化网络的网络拓扑在每个时隙内保持不变;控制器在每个时间段的起始时隙获取星地一体化网络的网络状态,其中,网络状态包括估计的当前时间段的网络流量负载、当前时间段起始时隙的网络资源利用率、网络拓扑、vnf部署情况和上一个时间段采取的sfc映射策略集合;将搜索到的在不同网络流量负载下的最终sfc映射策略集合构成动作空间,其中,每个sfc映射策略集合的映射决策随卫星的移动而改变,以适应sgin拓扑的动态特征;对深度q网络进行训练,以便在每个时间段的起始时隙,根据获取到的星地一体化网络的网络状态在动作空间中选择sfc映射策略集合。

4、根据本发明实施例的星地一体化网络的动态sfc映射方法,首先,构建星地一体化网络,并采用广度优先法搜索星地一体化网络中每个业务流所有的sfc映射策略,选取每个业务流的一个sfc映射策略进行组合,构建多业务流的sfc映射策略集合;然后,获取历史的网络流量负载,并采用聚类算法对网络流量负载进行分类,以得到多类网络流量负载;接着,采用贪婪算法根据资源共享率值和网络估计收益搜索每一类网络流量负载对应的最优sfc映射策略集合,以得到最终的sfc映射策略集合;再接着,将星地一体化网络场景下的动态sfc映射问题建模为马尔可夫决策过程,其中,决策过程被划分为多个时间段,每个时间段包含多个时隙,星地一体化网络的网络拓扑在每个时隙内保持不变;再然后,控制器在每个时间段的起始时隙获取星地一体化网络的网络状态,其中,网络状态包括估计的当前时间段的网络流量负载、当前时间段起始时隙的网络资源利用率、网络拓扑、vnf部署情况和上一个时间段采取的sfc映射策略集合;将搜索到的在不同网络流量负载下的最终sfc映射策略集合构成动作空间,其中,每个sfc映射策略集合的映射决策随卫星的移动而改变,以适应sgin拓扑的动态特征;最后,对深度q网络进行训练,以便在每个时间段的起始时隙,根据获取到的星地一体化网络的网络状态在动作空间中选择sfc映射策略集合;由此,能够根据不断变化的网络状态确定sfc映射策略集合,从而最大化长期的网络收益。

5、另外,根据本发明上述实施例提出的星地一体化网络的动态sfc映射方法还可以具有如下附加的技术特征:

6、可选地,采用贪婪算法根据资源共享率值和网络估计收益搜索每一类网络流量负载对应的最优sfc映射策略集合,以得到最终的sfc映射策略集合,包括:

7、针对每一类网络流量负载,搜索资源共享率值由大到小依次对应的sfc映射策略集合,并计算每个sfc映射策略集合对应的网络估计收益,其中,所述资源共享率值为各业务流共享的计算资源总量和网络的计算资源总量的比率,所述网络估计收益等于获得的服务收益减去消耗的网络的通信资源成本和计算资源成本,当用户的服务需求被满足,可以获得相应的服务收益;在搜索过程中依次比较相邻搜索到的sfc映射策略集合的网络估计收益;如果当前搜索到的sfc映射策略集合的网络估计收益大于之前搜索到的sfc映射策略集合的网络估计收益,则将当前搜索到的sfc映射策略集合代替之前搜索到的sfc映射策略集合添加到动作空间中;如果当前搜索到的sfc映射策略集合的网络估计收益小于等于之前搜索到的sfc映射策略集合的网络估计收益,或者所有sfc映射策略集合都被遍历,则停止搜索,得到最终的sfc映射策略集合。

8、可选地,网络状态表示为:

9、

10、其中,表示对各业务流在第k个时间段的预测包到达率,λl(k)表示估计的业务流l在时间段k的预测包到达率服从参数为λl(k)的泊松过程,包括在第k个时间段的起始时隙的网络拓扑和vnf部署情况,物理节点的数据包处理速率和链路的传输速率,w(k-1)表示上一个时间段采取的sfc映射策略集。

11、可选地,根据以下公式计算时隙t的网络估计收益:

12、χ′t=-α1φ1,t-α2φ2,t+α4rt

13、

14、

15、

16、其中,φ1,t表示网络计算资源利用率,φtv是一个二进制变量,在时隙t,如果至少有一个vnf映射到节点v,则φtv=1,否则φtv=0,表示vnf实例使用的计算资源,表示网络中总的计算资源;φ2,t表示通信资源利用率,φt(v,u)是一个二进制变量,在时隙t,如果至少有一个虚拟链路映射到物理链路(v,u),则φt(v,u)=1,否则φt(v,u)=0,表示使用的通信资源,表示网络中总的通信资源;网络的服务收益表示为rt,dl,t表示业务流l的数据包端到端时延,d为服务的时延需求,λl,t(1-dl,t/d)为业务流l在时隙t的服务收益。

17、可选地,动作空间中的sfc映射策略集合表示为:

18、

19、

20、

21、

22、

23、其中,wm表示一个sfc映射策略集合;m表示此映射策略集合在动作空间的序列号,表示在wm中业务流l的sfc映射策略;表示卫星网络段的vnf映射策略,它是一个二进制变量,当表示将vnf映射到接入的卫星节点,否则表示地面网络段的vnf映射策略;表示卫星网络段的虚拟链路映射策略;表示地面网络的虚拟链路映射策略。

24、为达到上述目的,本技术第二方面实施例提出了一种星地一体化网络的动态sfc映射装置,包括:网络构建模块、第一获取模块、搜索模块、问题构建模块、第二获取模块和映射模块,其中,网络构建模块用于构建星地一体化网络,并采用广度优先法搜索星地一体化网络中每个业务流所有的sfc映射策略,选取每个业务流的一个sfc映射策略进行组合,构建多业务流的sfc映射策略集合;第一获取模块用于获取历史的网络流量负载,并采用聚类算法对网络流量负载进行分类,以得到多类网络流量负载;搜索模块用于采用贪婪算法根据资源共享率值和网络估计收益搜索每一类网络流量负载对应的最优sfc映射策略集合,以得到最终的sfc映射策略集合;问题构建模块用于将星地一体化网络场景下的动态sfc映射问题建模为马尔可夫决策过程,其中,决策过程被划分为多个时间段,每个时间段包含多个时隙,星地一体化网络的网络拓扑在每个时隙内保持不变;第二获取模块用于在每个时间段的起始时隙获取星地一体化网络的网络状态,其中,网络状态包括估计的当前时间段的网络流量负载、当前时间段起始时隙的网络资源利用率、网络拓扑、vnf部署情况和上一个时间段采取的sfc映射策略集合;映射模块用于将最终的sfc映射策略集合构成动作空间,其中,每个sfc映射策略集合的映射决策随卫星的移动而改变,以适应sgin拓扑的动态特征;对深度q网络进行训练,以便在每个时间段的起始时隙,根据获取到的星地一体化网络的网络状态在动作空间中选择sfc映射策略集合。

25、根据本技术实施例的星地一体化网络的动态sfc映射装置,通过将sgin中的sfc映射问题描述为马尔可夫决策过程(markov decision process,mdp),以刻画网络状态与sfc映射策略集合之间的关系,并提出了一种基于深度q学习(deep q-learning,dql)的动态sfc映射算法,在异构时变的sgin中,为具有时变的流量速率的多个业务流动态地确定sfc映射策略集合,并提出了一种新的参数,共享率(sharing ratio,sr)阐述sfc映射策略集合的计算资源共享水平,为了高效地分配异构网络资源,根据网络资源成本、服务收益和sr值,为不同网络负载选择最优的sfc映射策略集合构成动作空间,通过训练深度q网络,根据不断变化的网络状态动态地确定sfc映射策略集合,从而最大化长期的网络收益。

26、另外,根据本技术上述实施例提出的星地一体化网络的动态sfc映射装置还可以具有如下附加的技术特征:

27、可选地,搜索模块还用于,针对每一类网络流量负载,搜索资源共享率值由大到小依次对应的sfc映射策略集合,并计算每个sfc映射策略集合对应的网络估计收益,其中,所述资源共享率值为各业务流共享的计算资源总量和网络的计算资源总量的比率,所述网络估计收益等于获得的服务收益减去消耗的网络的通信资源成本和计算资源成本,当用户的服务需求被满足,可以获得相应的服务收益;在搜索过程中依次比较相邻搜索到的sfc映射策略集合的网络估计收益;如果当前搜索到的sfc映射策略集合的网络估计收益大于之前搜索到的sfc映射策略集合的网络估计收益,则将当前搜索到的sfc映射策略集合代替之前搜索到的sfc映射策略集合添加到动作空间中;如果当前搜索到的sfc映射策略集合的网络估计收益小于等于之前搜索到的sfc映射策略集合的网络估计收益,或者所有sfc映射策略集合都被遍历,则停止搜索,得到最终的sfc映射策略集合。

28、可选地,网络状态表示为:

29、

30、其中,表示对各业务流在第k个时间段的预测包到达率,λl(k)表示估计的业务流l在时间段k的预测包到达率服从参数为λl(k)的泊松过程,包括在第k个时间段的起始时隙的网络拓扑和vnf部署情况,物理节点的数据包处理速率和链路的传输速率,w(k-1)表示上一个时间段采取的sfc映射策略集合。

31、可选地,根据以下公式计算时隙t的网络估计收益:

32、χ′t=-α1φ1,t-α2φ2,t+α4rt

33、

34、

35、

36、其中,φ1,t表示网络计算资源利用率,φtv是一个二进制变量,在时隙t,如果至少有一个vnf映射到节点v,则φtv=1,否则φtv=0,表示vnf实例使用的计算资源,表示网络中总的计算资源;φ2,t表示通信资源利用率,φt(v,u)是一个二进制变量,在时隙t,如果至少有一个虚拟链路映射到物理链路(v,u),则φt(v,u)=1,否则φt(v,u)=0,表示使用的通信资源,表示网络中总的通信资源;网络的服务收益表示为rt,dl,t表示业务流l的数据包端到端时延,d为服务的时延需求,λl,t(1-dl,t/d)为业务流l在时隙t的服务收益。

37、可选地,动作空间中的sfc映射策略集合表示为:

38、

39、

40、

41、

42、

43、其中,wm表示一个sfc映射策略集合;m表示此映射策略集合在动作空间的序列号,表示在wm中业务流l的sfc映射策略;表示卫星网络段的vnf映射策略,它是一个二进制变量,当表示将vnf映射到接入的卫星节点,否则表示地面网络段的vnf映射策略;表示卫星网络段的虚拟链路映射策略;表示地面网络的虚拟链路映射策略。

本文地址:https://www.jishuxx.com/zhuanli/20240801/241693.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。