技术新讯 > 电子通信装置的制造及其应用技术 > 无线资源分配方法和装置与流程  >  正文

无线资源分配方法和装置与流程

  • 国知局
  • 2024-08-02 14:04:24

本技术涉及无线通信,尤其涉及一种无线资源分配方法和装置。

背景技术:

1、无线通信迅猛发展,第五代移动通信技术(5th generation mobilecommunication technology,5g)和第六代wi-fi(wi-fi 6,ieee 802.11ax)标准已经商用,下一代无线技术和标准化正在全球范围如火如荼的进行中。无线通信已经渗透日常生活和工作的各个方面,成为不可或缺的部分。随着智能终端数目的高速增长,以及物联网(internet of things,iot)设备的普及,催生了虚拟现实、增强现实和全息影像等层出不穷的新型无线应用。

2、新型无线技术、新型终端、新型无线应用等使得无线网络变得空前复杂。为了对抗无线网络的高复杂性发展趋势,人工智能(artificialintelligent,ai)作为无线网络设计和管理的有效工具已经成为业界的共识。现有的ai技术在无线网络设计和管理中的应用包括:将深度强化学习(deep reinforcement learning,drl)应用于无线资源的分配中,即通过神经网络模型来确定终端设备的无线资源分配策略。

3、然而上述现有技术中,不同的无线资源分配方式(例如速率配置、信道聚合或带宽配置等)之间会相互影响,从而使得最终确定的无线资源分配策略无法达到全局最优。

技术实现思路

1、本技术实施例提供了一种无线资源分配方法和装置,可以用统一的标准来评价无线资源分配策略(一种或多种无线资源分配方式),进而有效消除同时配置不同类型无线资源时存在的冲突,使得sta能够更好的进行无线资源分配,提升频谱效率。

2、第一方面,本技术提供了一种无线资源分配方法,所述方法应用于无线通信系统中的站点sta,所述方法包括:所述sta接收所述无线通信系统中的接入点ap发送的n组统计数据;其中,所述n组统计数据对应n种无线资源分配策略,所述n组统计数据是基于所述n种无线资源分配策略对应的报文分别计算得到的,所述n种无线资源分配策略对应m组报文,每种所述资源分配策略对应所述m组报文中的至少一组,所述m组报文是由m个所述sta分别向所述ap发送的,n为小于或等于m的正整数;所述sta基于所述n种无线资源分配策略和所述n组统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略。

3、其中,n种无线资源分配策略和n组统计数据之间一一对应,每组统计数据可以用于评价对应的一种无线资源分配策略。

4、从技术效果上看,本技术建立了无线资源分配策略和该种策略下报文的统计数据之间的对应关系,这样便可通过报文的统计数据来评价无线资源分配策略。无论无线资源分配策略包含一种或多种无线资源分配方式,都可以用报文的统计数据进行关联以及评价,即统一了无线资源分配策略的评价标准。同时,还有效消除了现有技术不同无线资源分配方式独立评价时所造成的不同无线资源配置方式之间存在的冲突,使得最终确定的无线资源分配策略可以达到全局最优,提升频谱效率。

5、本技术提出了针对不同资源分配策略的统一的回报值计算方法,将每种资源分配策略与该种资源分配策略下对应报文的统计数据相关联,并通过每种资源分配策略下对应的统计数据来进行计算该种资源分配策略对应的回报值,可以有效消除现有技术下由于不同类型无线资源分配方式(即速率配置、信道聚合、带宽配置)对应不同回报值计算方式而带来的不同类型无线资源分配方式之间的冲突,使得训练后的神经网络模型达到全局最优,进而sta能够依据神经网络模型更好地进行资源分配,提升频谱效率。此外,本技术中sta可以获取其它sta对应资源分配策略下的统计数据,提升本地训练数据的多样性,进而提升训练后本地神经网络模型的准确性。

6、在一种可行的实施方式中,每种所述无线资源分配策略包括速率配置、信道聚合、带宽配置中的至少一种,每组所述统计数据包括丢包率per、平均速率、等待时延中的一种或多种。

7、从技术效果上看,本技术由于采用报文的统计数据对无线资源分配策略进行评价,因此可以适用不同种类的无线资源分配策略,即每种无线资源分配策略可以是一种或多种无线资源分配方式的组合,进而实现对不同种类无线资源分配策略的评价标准进行统一。

8、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

9、其中,第一阈值可以是满足业务需求时所需的速率,可称为业务需求速率。

10、其中,无线资源分配策略的目标函数用于指示如何确定sta上的无线资源分配策略,即使确定出的无线资源分配策略达到目标函数所指示的目标,即使目标函数的值满足预设条件。

11、从技术效果上看,本技术采用两段式目标函数,使得最终确定的无线资源分配策略尽可能满足业务需求,且不会占用过多资源,有效减少在达到业务需求后对其它站点sta的干扰。

12、在一种可行的实施方式中,所述sta基于所述n种无线资源分配策略和所述n组统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略,包括:所述sta基于所述n组统计数据得到所述n组统计数据对应的n组回报值,每组所述回报值用于评价对应的所述无线资源分配策略;所述sta基于所述n种无线资源分配策略和所述n组回报值,训练所述sta上的神经网络模型,以及基于训练后的所述神经网络模型确定下一次发送报文时的资源分配策略。

13、其中,sta上的神经网络模型是通过强化学习训练得到的。

14、从技术效果上看,本技术可以计算出每组统计数据对应的一组回报值,然后通过强化学习方法训练神经网络模型,从而利用ai实现对历史数据的学习,以及对sta上无线资源分配策略地自动化确定,更加便捷和智能化。此外,本技术中sta可以获取其它sta对应无线资源分配策略下的统计数据,提升本地训练数据的多样性,进而提升训练后本地神经网络模型的准确性。

15、在一种可行的实施方式中,每组所述回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

16、其中,上述预设值可以是用户基于实际的场景进行设定,本技术对此不限定。例如,该预设值可以为0。

17、其中,报文发送成功时的回报值为强化学习中对该种无线资源分配策略的奖励,报文发送失败时的回报值为强化学习方式中对该种无线资源分配策略的惩罚。

18、从技术效果上看,在报文发送成功时,利用目标函数计算发送成功回报值,从而将评价无线资源分配策略的回报值和目标函数相关联,使得训练出的模型达到目标函数所指示的方向。

19、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述平均速率。

20、从技术效果上看,由ap直接统计每种无线资源分配策略对应报文的丢包率和平均速率,后续sta直接利用平均速率和丢包率计算回报值,sta上的操作简单方便。

21、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

22、其中,m组报文中每个报文中包含该报文发送时的等待时延。每组统计数据中的等待时延是通过其对应的一组或多组报文中所有报文等待时延的平均值、最大值或最小值等,本技术对此不限定。

23、从技术效果上看,sta接收到的统计数据中包含等待时延,使得sta计算出来的平均速率更加准确,进而使得回报值的计算更加准确,可以有效提升训练后神经网络模型的准确度。

24、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

25、从技术效果上看,sta接收到的统计数据只包含丢包率per,即在ap只传输丢包率per的情形下,sta可以通过per计算等待时延,进而计算平均速率,此种方式可以有效节省数据交互时的资源占用所需的开销。

26、在一种可行的实施方式中,每组所述统计数据包括对应的一组所述回报值,所述回报值由所述接入点计算得到。

27、从技术效果上看,此种数据交互方式中,每种无线资源分配策略对应的一组回报值由ap进行计算然后发送给各sta,可以便于统一评价。

28、第二方面,本技术实施例提供了一种无线资源分配方法,所述方法应用于无线通信系统中的站点sta,所述方法包括:所述sta向所述无线通信系统中的接入点ap发送第一请求,所述第一请求对应第一无线资源分配策略;所述sta接收所述ap在响应所述第一请求后发送的第一统计数据,所述第一统计数据与所述第一无线资源分配策略相对应;所述sta基于所述第一无线资源分配策略和所述第一统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略。

29、从技术效果上看,在前述第一方面实施例中利用每种无线资源分配方式下报文的统计数据来评价对应无线资源分配策略的基础上,本实施例只在sta向ap发送请求的情况下才向sta发送对应的无线资源分配策略的统计数据,可以有效减少ap发送全部无线资源分配策略对应统计数据时的开销。

30、在一种可行的实施方式中,所述第一统计数据包括丢包率per、平均速率、等待时延中的一种或多种,所述第一无线资源分配策略包括速率选择、信道聚合、带宽选择中的至少一种。

31、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

32、在一种可行的实施方式中,所述sta基于所述第一无线资源分配策略和所述第一统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略,包括:所述sta基于所述第一统计数据得到所述第一无线资源分配策略对应的一组回报值,所述一组回报值用于评价所述第一无线资源分配策略;所述sta基于所述第一无线资源分配策略和所述一组回报值更新所述sta上的神经网络模型的参数,以及基于更新后的所述神经网络模型确定下一次发送报文时的无线资源分配策略。

33、在一种可行的实施方式中,所述一组回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

34、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述平均速率。

35、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

36、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

37、在一种可行的实施方式中,所述第一统计数据包括所述一组回报值,所述一组回报值是由所述接入点ap计算得到的。

38、具体地,上述第二方面中各实施例的具体技术效果可参见前述第一方面中相关描述,此处不再赘述。

39、第三方面,本技术实施例提供了一种无线资源分配方法,所述方法应用于无线通信系统中的接入点ap,所述方法包括:所述ap接收m组报文,所述m组报文分别是由所述无线通信系统中的m个站点sta发送的,所述m组报文对应n种无线资源分配策略,每种所述无线资源分配策略对应所述m组报文中的至少一组,n为小于或等于m的正整数;所述ap基于每种所述无线资源分配策略对应的至少一组报文,计算出与所述n种无线资源分配策略分别对应的n组统计数据;所述ap向所述sta发送所述n组统计数据;其中,所述n组统计数据和所述n种无线资源分配策略之间的对应关系,被所述sta用于确定下一次发送报文时的无线资源分配策略。

40、在一种可行的实施方式中,每种所述无线资源分配策略包括速率配置、信道聚合、带宽配置中的至少一种,每组所述统计数据包括丢包率per、平均速率、等待时延的一种或多种。

41、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

42、在一种可行的实施方式中,所述n组统计数据被所述sta用于获取与所述n种无线资源分配策略分别对应的n组回报值,所述n种无线资源分配策略和所述n组回报值被所述sta用于训练神经网络模型,训练后的所述神经网络模型被所述sta用于确定下一次发送报文时的无线资源分配策略。

43、在一种可行的实施方式中,每组所述回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

44、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述平均速率。

45、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

46、其中,m组报文中每个报文中包含该报文发送时的等待时延。每组统计数据中的等待时延是通过其对应的一组或多组报文中所有报文等待时延的平均值、最大值或最小值等,本技术对此不限定。

47、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

48、在一种可行的实施方式中,每组所述统计数据包括对应的一组所述回报值,所述回报值由所述接入点计算得到。

49、具体地,上述第三方面中各实施例的具体技术效果可参见前述第一方面中相关描述,此处不再赘述。

50、第四方面,本技术实施例提供了一种无线资源分配方法,所述方法应用于无线通信系统中的接入点ap,所述方法包括:所述ap接收所述无线通信系统中站点sta发送的第一请求,所述第一请求对应第一无线资源分配策略;所述ap向所述sta发送所述第一无线资源分配策略对应的第一统计数据;其中,所述第一统计数据和所述第一无线资源分配策略之间的对应关系,被所述sta用于确定下一次发送报文时的无线资源分配策略。

51、在一种可行的实施方式中,所述第一统计数据包括丢包率per、平均速率、等待时延中的一种或多种,所述第一无线资源分配策略包括速率选择、信道聚合、带宽选择中的至少一种。

52、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

53、在一种可行的实施方式中,所述第一统计数据被所述sta用于获取与所述第一无线资源分配策略对应的一组回报值,所述第一无线资源分配策略和所述一组回报值被所述sta用于训练神经网络模型,训练后的所述神经网络模型被所述sta用于确定下一次发送报文时的无线资源分配策略。

54、在一种可行的实施方式中,所述一组回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

55、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述平均速率。

56、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

57、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

58、在一种可行的实施方式中,所述第一统计数据包括所述一组回报值,所述一组回报值是由所述接入点ap计算得到的。

59、具体地,上述第四方面中各实施例的具体技术效果可参见前述第一和第二方面中相关描述,此处不再赘述。

60、第五方面,本技术实施例提供了一种无线资源分配方法,所述方法应用于无线通信系统,所述无线通信系统包括接入点ap和站点sta,所述方法包括:所述ap接收m组报文,所述m组报文分别是由m个所述sta发送的,所述m组报文对应n种无线资源分配策略,每种所述无线资源分配策略对应所述m组报文中的至少一组,n为小于或等于m的正整数;所述ap基于每种所述无线资源分配策略对应的至少一组报文,计算出与所述n种无线资源分配策略分别对应的n组统计数据;所述sta接收所述ap发送的所述n组统计数据,并基于所述n种无线资源分配策略和所述n组统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略。

61、在一种可行的实施方式中,每种所述无线资源分配策略包括速率配置、信道聚合、带宽配置中的至少一种,每组所述统计数据包括丢包率per、平均速率、等待时延中的一种或多种。

62、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

63、在一种可行的实施方式中,所述基于所述n种无线资源分配策略和所述n组统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略,包括:所述sta基于所述n组统计数据得到所述n组统计数据对应的n组回报值,每组所述回报值用于评价对应的所述无线资源分配策略;所述sta基于所述n种无线资源分配策略和所述n组回报值,训练所述sta上的神经网络模型,以及基于训练后的所述神经网络模型确定下一次发送报文时的资源分配策略。

64、在一种可行的实施方式中,每组所述回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

65、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述平均速率。

66、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

67、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

68、在一种可行的实施方式中,每组所述统计数据包括对应的一组所述回报值,所述回报值由所述接入点计算得到。

69、具体地,上述第五方面中各实施例的具体技术效果可参见前述第一和第二方面中相关描述,此处不再赘述。

70、第六方面,本技术实施例提供了一种无线资源分配方法,所述方法应用于无线通信系统,所述无线通信系统包括接入点ap和站点sta,所述方法包括:所述sta向所述ap发送第一请求,所述第一请求对应第一无线资源分配策略;所述ap向所述sta发送所述第一无线资源分配策略对应的第一统计数据;所述sta基于所述第一统计数据和所述第一无线资源分配策略之间的对应关系,确定下一次发送报文时的无线资源分配策略。

71、在一种可行的实施方式中,所述第一统计数据包括丢包率per、平均速率、等待时延中的一种或多种;所述第一资源分配策略包括速率选择、信道聚合、带宽选择中的至少一种;

72、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

73、在一种可行的实施方式中,所述sta基于所述第一统计数据和所述第一无线资源分配策略之间的对应关系,确定下一次发送报文时的无线资源分配策略,包括:所述sta基于所述第一统计数据得到所述第一无线资源分配策略对应的一组回报值,所述一组回报值用于评价所述第一无线资源分配策略;所述sta基于所述第一无线资源分配策略和所述一组回报值更新所述sta上的神经网络模型的参数,以及基于更新后的所述神经网络模型确定下一次发送报文时的无线资源分配策略。

74、在一种可行的实施方式中,所述一组回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

75、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述平均速率。

76、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

77、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

78、在一种可行的实施方式中,所述第一统计数据包括所述一组回报值,所述一组回报值是由所述接入点ap计算得到的。

79、具体地,上述第六方面中各实施例的具体技术效果可参见前述第一和第二方面中相关描述,此处不再赘述。

80、第七方面,本技术实施例提供了一种无线资源分配装置,所述装置包括:接收单元,用于接收所述通信系统中的接入点ap发送的n组统计数据;其中,所述n组统计数据对应n种无线资源分配策略,所述n组统计数据是基于所述n种无线资源分配策略对应的报文分别计算得到的,所述n种无线资源分配策略对应m组报文,每种所述资源分配策略对应所述m组报文中的至少一组,所述m组报文是由m个所述sta分别向所述ap发送的,n为小于或等于m的正整数;处理单元,用于基于所述n种无线资源分配策略和所述n组统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略。

81、在一种可行的实施方式中,每种所述无线资源分配策略包括速率配置、信道聚合、带宽配置中的至少一种,每组所述统计数据包括丢包率per、平均速率、等待时延中的一种或多种。

82、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

83、在一种可行的实施方式中,所述处理单元具体用于:基于所述n组统计数据得到所述n组统计数据对应的n组回报值,每组所述回报值用于评价对应的所述无线资源分配策略;基于所述n种无线资源分配策略和所述n组回报值,训练所述sta上的神经网络模型,以及基于训练后的所述神经网络模型确定下一次发送报文时的资源分配策略。

84、在一种可行的实施方式中,每组所述回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

85、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述平均速率。

86、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

87、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

88、在一种可行的实施方式中,每组所述统计数据包括对应的一组所述回报值,所述回报值由所述接入点计算得到。

89、第八方面,本技术实施例提供了一种无线资源分配装置,所述装置包括:发送单元,用于向无线通信系统中的接入点ap发送第一请求,所述第一请求对应第一无线资源分配策略;接收单元,用于接收所述ap在响应所述第一请求后发送的第一统计数据,所述第一统计数据与所述第一无线资源分配策略相对应;处理单元,用于基于所述第一无线资源分配策略和所述第一统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略。

90、在一种可行的实施方式中,所述第一统计数据包括丢包率per、平均速率、等待时延中的一种或多种,所述第一无线资源分配策略包括速率选择、信道聚合、带宽选择中的至少一种。

91、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

92、在一种可行的实施方式中,所述处理单元具体用于:所述sta基于所述第一统计数据得到所述第一无线资源分配策略对应的一组回报值,所述一组回报值用于评价所述第一无线资源分配策略;所述sta基于所述第一无线资源分配策略和所述一组回报值更新所述sta上的神经网络模型的参数,以及基于更新后的所述神经网络模型确定下一次发送报文时的无线资源分配策略。

93、在一种可行的实施方式中,所述一组回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

94、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述平均速率。

95、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

96、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

97、在一种可行的实施方式中,所述第一统计数据包括所述一组回报值,所述一组回报值是由所述接入点ap计算得到的。

98、第九方面,本技术实施例提供了一种无线资源分配装置,所述装置包括:接收单元,用于接收m组报文,所述m组报文分别是由所述无线通信系统中的m个站点sta发送的,所述m组报文对应n种无线资源分配策略,每种所述无线资源分配策略对应所述m组报文中的至少一组,n为小于或等于m的正整数;处理单元,用于基于每种所述无线资源分配策略对应的至少一组报文,计算出与所述n种无线资源分配策略分别对应的n组统计数据;发送单元,用于向所述sta发送所述n组统计数据;其中,所述n组统计数据和所述n种无线资源分配策略之间的对应关系,被所述sta用于确定下一次发送报文时的无线资源分配策略。

99、在一种可行的实施方式中,每种所述无线资源分配策略包括速率配置、信道聚合、带宽配置中的至少一种,每组所述统计数据包括丢包率per、平均速率、等待时延的一种或多种。

100、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

101、在一种可行的实施方式中,所述n组统计数据被所述sta用于获取与所述n种无线资源分配策略分别对应的n组回报值,所述n种无线资源分配策略和所述n组回报值被所述sta用于训练神经网络模型,训练后的所述神经网络模型被所述sta用于确定下一次发送报文时的无线资源分配策略。

102、在一种可行的实施方式中,每组所述回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

103、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述平均速率。

104、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

105、在一种可行的实施方式中,每组所述统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

106、在一种可行的实施方式中,每组所述统计数据包括对应的一组所述回报值,所述回报值由所述接入点计算得到。

107、第十方面,本技术实施例提供了一种无线资源分配装置,所述装置包括:接收单元,用于接收所述无线通信系统中站点sta发送的第一请求,所述第一请求对应第一无线资源分配策略;发送单元,用于向所述sta发送所述第一无线资源分配策略对应的第一统计数据;其中,所述第一统计数据和所述第一无线资源分配策略之间的对应关系,被所述sta用于确定下一次发送报文时的无线资源分配策略。

108、在一种可行的实施方式中,所述第一统计数据包括丢包率per、平均速率、等待时延中的一种或多种,所述第一无线资源分配策略包括速率选择、信道聚合、带宽选择中的至少一种。

109、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

110、在一种可行的实施方式中,所述第一统计数据被所述sta用于获取与所述第一无线资源分配策略对应的一组回报值,所述第一无线资源分配策略和所述一组回报值被所述sta用于训练神经网络模型,训练后的所述神经网络模型被所述sta用于确定下一次发送报文时的无线资源分配策略。

111、在一种可行的实施方式中,所述一组回报值包含报文发送成功时的回报值和报文发送失败时的回报值;其中,所述报文发送成功时的回报值通过所述丢包率per和所述目标函数计算得到,所述报文发送失败时的回报值为预设值。

112、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述平均速率。

113、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per和所述等待时延,所述等待时延用于计算所述平均速率。

114、在一种可行的实施方式中,所述第一统计数据包括所述丢包率per;其中,所述丢包率用于计算所述等待时延,所述等待时延用于计算所述平均速率。

115、在一种可行的实施方式中,所述第一统计数据包括所述一组回报值,所述一组回报值是由所述接入点ap计算得到的。

116、第十一方面,本技术提供了一种无线通信系统,所述无线通信系统包括接入点ap和站点sta,所述方法包括:所述ap接收m组报文,所述m组报文分别是由m个所述sta发送的,所述m组报文对应n种无线资源分配策略,每种所述无线资源分配策略对应所述m组报文中的至少一组,n为小于或等于m的正整数;所述ap基于每种所述无线资源分配策略对应的至少一组报文,计算出与所述n种无线资源分配策略分别对应的n组统计数据;所述sta接收所述ap发送的所述n组统计数据,并基于所述n种无线资源分配策略和所述n组统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略。

117、在一种可行的实施方式中,每种所述无线资源分配策略包括速率配置、信道聚合、带宽配置中的至少一种,每组所述统计数据包括丢包率per、平均速率、等待时延中的一种或多种。

118、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

119、在一种可行的实施方式中,所述基于所述n种无线资源分配策略和所述n组统计数据之间的对应关系,确定所述sta下一次发送报文时的无线资源分配策略,包括:所述sta基于所述n组统计数据得到所述n组统计数据对应的n组回报值,每组所述回报值用于评价对应的所述无线资源分配策略;所述sta基于所述n种无线资源分配策略和所述n组回报值,训练所述sta上的神经网络模型,以及基于训练后的所述神经网络模型确定下一次发送报文时的资源分配策略。

120、第十二方面,本技术提供了一种无线通信系统,所述无线通信系统包括接入点ap和站点sta,所述方法包括:所述sta向所述ap发送第一请求,所述第一请求对应第一无线资源分配策略;所述ap向所述sta发送所述第一无线资源分配策略对应的第一统计数据;所述sta基于所述第一统计数据和所述第一无线资源分配策略之间的对应关系,确定下一次发送报文时的无线资源分配策略。

121、在一种可行的实施方式中,所述第一统计数据包括丢包率per、平均速率、等待时延中的一种或多种;所述第一资源分配策略包括速率选择、信道聚合、带宽选择中的至少一种;

122、在一种可行的实施方式中,所述无线资源分配策略对应目标函数的自变量包含所述平均速率;其中,当所述平均速率小于第一阈值时,所述目标函数的值随着所述平均速率增大而增大,当所述平均速率大于所述第一阈值时,所述目标函数的值随着所述平均速率增大而减少。

123、在一种可行的实施方式中,所述sta基于所述第一统计数据和所述第一无线资源分配策略之间的对应关系,确定下一次发送报文时的无线资源分配策略,包括:所述sta基于所述第一统计数据得到所述第一无线资源分配策略对应的一组回报值,所述一组回报值用于评价所述第一无线资源分配策略;所述sta基于所述第一无线资源分配策略和所述一组回报值更新所述sta上的神经网络模型的参数,以及基于更新后的所述神经网络模型确定下一次发送报文时的无线资源分配策略。

124、第十三方面,本技术提供了一种通信设备,所述通信设备包括至少一个处理器,存储器和接口电路,所述存储器、所述接口电路和所述至少一个处理器通过线路互联,所述至少一个存储器中存储有指令;所述指令被所述处理器执行时,上述第一方面至第六方面中任一所述的方法得以实现。

125、第十四方面,本技术提供了一种无线通信系统,所述无线通信系统包括至少一个前述第七方面的无线资源分配装置和至少一个前述第九方面的无线资源分配装置。

126、第十五方面,本技术提供了一种无线通信系统,所述无线通信系统包括至少一个前述第八方面的无线资源分配装置和至少一个前述第十方面的无线资源分配装置。

127、第十六方面,本技术实施例提供了一种芯片系统,所述芯片系统包括至少一个处理器,存储器和接口电路,所述存储器、所述接口电路和所述至少一个处理器通过线路互联,所述至少一个存储器中存储有指令;所述指令被所述处理器执行时,上述第一方面至第六方面中任一所述的方法得以实现。

128、第十七方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,该计算机程序被执行时,上述第一方面至第六方面中任意一项所述的方法得以实现。

129、第十八方面,本技术实施例提供了一种计算机程序产品,该计算机程序产品包括指令,当该指令被执行时,上述第一方面至第六方面中任意一项所述的方法得以实现。

本文地址:https://www.jishuxx.com/zhuanli/20240801/241620.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。