技术新讯 > 电子通信装置的制造及其应用技术 > 基于RSMA的功率分配方法、通信系统、设备及介质 > 正文

基于RSMA的功率分配方法、通信系统、设备及介质

国知局
2024-08-02 14:41:51

本发明涉及无线通信，尤其涉及一种基于rsma的功率分配方法、通信系统、设备及介质。

背景技术：

1、速率分割多址接入(rate-splitting multiple access，rsma)在频谱效率和能量效率等指标上显示出优越性，因此rsma在卫星通信系统中的应用饱受关注。在rsma中，用户的消息被分割为公共部分和私有部分，为了获得更好的rsma性能，低地球轨道(low earthorbit，leo)卫星基站(satellite base station，sbs)必须有效地将发射功率分配给公共部分和私有部分；而由于信道分布的不确定性，加上环境的动态变化特性，难以进行准确的信道估计，实现最优的功率分配方案是非常具有挑战性的，此外，相关技术中的功率分配方法通常使用传统的迭代方式来获得局部最优解，这种方法需要较高的计算复杂度，因此，如何在环境动态变化、信道信息受限的情况下，实现最优的功率分配策略，降低计算复杂度，是亟需解决的问题。

技术实现思路

1、本发明的目的在于至少解决现有技术中存在的技术问题之一，提供一种基于rsma的功率分配方法、通信系统、设备及介质，可以在环境动态变化、信道信息受限的情况下实现最优的功率分配策略，此外，可以大大降低计算复杂度，有效提高无线通信系统的传输速率。

2、第一方面，本发明实施例提供一种基于rsma的功率分配方法，应用于无线通信系统，所述无线通信系统包括至少一个卫星基站和多个地面站，所述功率分配方法包括：

3、所述卫星基站将发送至各个地面站的用户信息分割为第一公共信息和第一私有信息；

4、所述卫星基站对所有的第一公共信息和第一私有信息进行线性预编码处理后得到发送信号，并将所述发送信号通过公共频道广播给所有地面站；

5、所述地面站根据所述发送信号、所述卫星基站与所述地面站之间的信道增益和所述地面站的噪声信息得到对应的总接收信号；

6、所述地面站对所述总接收信号进行解码处理，并计算得到环境状态信息，其中，所述环境状态信息包括公共流信干噪比和私有流信干噪比；

7、所述卫星基站每隔预设时隙收集所述环境状态信息，并根据所述环境状态信息建立深度强化学习模型，其中，所述深度强化学习模型用于构建所述环境状态信息和功率分配方案的映射关系，所述功率分配方案表示所述卫星基站的总发送功率对公共流和各个私有流之间的功率分配；

8、所述卫星基站利用策略梯度算法优化所述深度强化学习模型，并根据所述地面站的当前环境状态输出对应的功率分配方案。

9、根据本发明实施例提供的基于rsma的功率分配方法，至少具有如下有益效果：卫星基站将用户信息分割为第一公共信息和第一私有信息，并对所有的第一公共信息和第一私有信息进行线性预编码处理后得到发送信号，接着将发送信号通过公共频道广播给所有地面站，各个地面站根据发送信号、卫星基站与地面站之间的信道增益和地面站的噪声信息得到对应的总接收信号，充分考虑了信道分布的不确定性和环境动态变化的特性，然后地面站对总接收信号进行解码处理，并计算得到环境状态信息，卫星基站每隔预设时隙收集环境状态信息，即收集公共流信干噪比和私有流信干噪比，并根据环境状态信息建立深度强化学习模型，通过不断与环境进行交互，可以在没有准确的信道信息的情况下做出智能决策，无需进行信道估计，还可以隐式地学习不同用户之间的潜在关系，此外，考虑到环境状态信息和功率分配方案之间的连续关联性，利用策略梯度算法优化深度强化学习模型，可以提高模型算法的稳定性，利用优化后的深度强化学习模型，可以根据各个地面站反馈的当前环境状态输出最优的功率分配方案，从而合理地将卫星基站的总发送功率分配给公共流和各个私有流，因此，本发明可以在环境动态变化、信道信息受限的情况下实现最优的功率分配策略，此外，可以大大降低计算复杂度，有效提高无线通信系统的传输速率。

10、在上述基于rsma的功率分配方法中，所述对所有的第一公共信息和第一私有信息进行线性预编码处理后得到发送信号，包括：

11、将所有的第一公共信息合并成第二公共信息，并对所述第二公共信息进行编码，得到所有地面站共享的公共流；

12、对所有的第一私有信息分别进行编码，得到对应每个地面站的私有流；

13、采用线性预编码的方式，将所述公共流和所有的私有流以非正交的方式叠加，得到发送信号，其中，所述发送信号根据所述公共流、所述公共流的第一预编码向量、所述私有流、所述私有流的第二预编码向量确定。

14、在上述基于rsma的功率分配方法中，所述对所述总接收信号进行解码处理，并计算得到环境状态信息，包括：

15、基于连续干扰消除算法，根据所述总接收信号解码公共流并将所有私有流当作干扰信号；

16、根据所述总接收信号解码私有流并将其它私有流当作干扰信号，得到所述总接收信号的解码接收信号；

17、根据所述第一预编码向量确定所述卫星基站的总发送功率分配给公共流的公共发送功率，以及根据所述第二预编码向量确定分配给私有流的私有发送功率；

18、根据所述公共发送功率、所述解码接收信号和所述地面站的噪声功率计算得到公共流信干噪比；

19、根据所述私有发送功率、所述解码接收信号和所述地面站的噪声功率计算得到私有流信干噪比。

20、在上述基于rsma的功率分配方法中，所述每隔预设时隙收集所述环境状态信息之后，所述功率分配方法还包括：

21、所述卫星基站根据所述公共流信干噪比确定所述公共流的公共速率；

22、根据所述私有流信干噪比确定所述私有流的第一私有速率；

23、根据所述公共发送功率、所述私有发送功率、所述公共速率和所述第一私有速率计算得到系统总速率。

24、在上述基于rsma的功率分配方法中，在所述根据所述环境状态信息建立深度强化学习模型时，所述功率分配方法还包括：

25、将所述环境状态信息输入至深度强化学习模型；

26、根据所述公共发送功率、所述私有发送功率和所述总发送功率确定第一功率分配约束条件；

27、利用所述深度强化学习模型，根据所述第一功率分配约束条件和预设策略执行与所述环境状态信息对应的分配动作，以输出对应的功率分配方案。

28、在上述基于rsma的功率分配方法中，所述根据所述第一功率分配约束条件和预设策略执行与所述环境状态信息对应的分配动作之后，所述功率分配方法还包括：

29、根据所述公共速率和所述第一私有速率确定对应的地面站的第二私有速率；

30、根据所述第二私有速率和所述地面站的预设最低速率确定第二功率分配约束条件；

31、在满足所述第二功率分配约束条件的前提下，从环境中获得当前分配动作的奖励信息，其中，所述奖励信息用于评估所述分配动作的好坏；

32、根据所述奖励信息不断对所述深度强化学习模型进行深度强化学习的训练，以使所述系统总速率最大化。

33、在上述基于rsma的功率分配方法中，所述深度强化学习模型包括新策略网络、旧策略网络和评论家网络，所述旧策略网络包括旧策略参数，所述利用策略梯度算法优化所述深度强化学习模型，包括：

34、初始化所述新策略网络的第一网络参数和所述评论家网络的第二网络参数；

35、通过所述新策略网络与环境进行多次交互，得到经验数据，其中，所述经验数据包括所述环境状态信息、所述功率分配方案和所述奖励信息；

36、根据所述经验数据多次更新所述第一网络参数和所述第二网络参数，并将所述旧策略参数更新为当前的第一网络参数。

37、第二方面，本发明实施例提供一种基于rsma的无线通信系统，所述无线通信系统包括至少一个卫星基站和多个地面站；

38、所述卫星基站用于将发送至各个地面站的用户信息分割为第一公共信息和第一私有信息；

39、所述卫星基站还用于对所有的第一公共信息和第一私有信息进行线性预编码处理后得到发送信号，并将所述发送信号通过公共频道广播给所有地面站；

40、所述地面站用于根据所述发送信号、所述卫星基站与所述地面站之间的信道增益和所述地面站的噪声信息得到对应的总接收信号；

41、所述地面站还用于对所述总接收信号进行解码处理，并计算得到环境状态信息，其中，所述环境状态信息包括公共流信干噪比和私有流信干噪比；

42、所述卫星基站还用于每隔预设时隙收集所述环境状态信息，并根据所述环境状态信息建立深度强化学习模型，其中，所述深度强化学习模型用于构建所述环境状态信息和功率分配方案的映射关系，所述功率分配方案表示所述卫星基站的总发送功率对公共流和各个私有流之间的功率分配；

43、所述卫星基站还用于利用策略梯度算法优化所述深度强化学习模型，并根据所述地面站的当前环境状态输出对应的功率分配方案。

44、根据本发明实施例提供的基于rsma的无线通信系统，至少具有如下有益效果：卫星基站将用户信息分割为第一公共信息和第一私有信息，并对所有的第一公共信息和第一私有信息进行线性预编码处理后得到发送信号，接着将发送信号通过公共频道广播给所有地面站，各个地面站根据发送信号、卫星基站与地面站之间的信道增益和地面站的噪声信息得到对应的总接收信号，充分考虑了信道分布的不确定性和环境动态变化的特性，然后地面站对总接收信号进行解码处理，并计算得到环境状态信息，卫星基站每隔预设时隙收集环境状态信息，即收集公共流信干噪比和私有流信干噪比，并根据环境状态信息建立深度强化学习模型，通过不断与环境进行交互，可以在没有准确的信道信息的情况下做出智能决策，无需进行信道估计，还可以隐式地学习不同用户之间的潜在关系，此外，考虑到环境状态信息和功率分配方案之间的连续关联性，利用策略梯度算法优化深度强化学习模型，可以提高模型算法的稳定性，利用优化后的深度强化学习模型，可以根据各个地面站反馈的当前环境状态输出最优的功率分配方案，从而合理地将卫星基站的总发送功率分配给公共流和各个私有流，因此，本发明可以在环境动态变化、信道信息受限的情况下实现最优的功率分配策略，此外，可以大大降低计算复杂度，有效提高无线通信系统的传输速率。

45、第三方面，本发明实施例提供一种计算机设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上第一方面实施例所述的功率分配方法。

46、根据本发明实施例提供的计算机设备，至少具有如下有益效果：卫星基站将用户信息分割为第一公共信息和第一私有信息，并对所有的第一公共信息和第一私有信息进行线性预编码处理后得到发送信号，接着将发送信号通过公共频道广播给所有地面站，各个地面站根据发送信号、卫星基站与地面站之间的信道增益和地面站的噪声信息得到对应的总接收信号，充分考虑了信道分布的不确定性和环境动态变化的特性，然后地面站对总接收信号进行解码处理，并计算得到环境状态信息，卫星基站每隔预设时隙收集环境状态信息，即收集公共流信干噪比和私有流信干噪比，并根据环境状态信息建立深度强化学习模型，通过不断与环境进行交互，可以在没有准确的信道信息的情况下做出智能决策，无需进行信道估计，还可以隐式地学习不同用户之间的潜在关系，此外，考虑到环境状态信息和功率分配方案之间的连续关联性，利用策略梯度算法优化深度强化学习模型，可以提高模型算法的稳定性，利用优化后的深度强化学习模型，可以根据各个地面站反馈的当前环境状态输出最优的功率分配方案，从而合理地将卫星基站的总发送功率分配给公共流和各个私有流，因此，本发明可以在环境动态变化、信道信息受限的情况下实现最优的功率分配策略，此外，可以大大降低计算复杂度，有效提高无线通信系统的传输速率。

47、第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如上第一方面实施例所述的功率分配方法。

48、根据本发明实施例提供的计算机可读存储介质，至少具有如下有益效果：卫星基站将用户信息分割为第一公共信息和第一私有信息，并对所有的第一公共信息和第一私有信息进行线性预编码处理后得到发送信号，接着将发送信号通过公共频道广播给所有地面站，各个地面站根据发送信号、卫星基站与地面站之间的信道增益和地面站的噪声信息得到对应的总接收信号，充分考虑了信道分布的不确定性和环境动态变化的特性，然后地面站对总接收信号进行解码处理，并计算得到环境状态信息，卫星基站每隔预设时隙收集环境状态信息，即收集公共流信干噪比和私有流信干噪比，并根据环境状态信息建立深度强化学习模型，通过不断与环境进行交互，可以在没有准确的信道信息的情况下做出智能决策，无需进行信道估计，还可以隐式地学习不同用户之间的潜在关系，此外，考虑到环境状态信息和功率分配方案之间的连续关联性，利用策略梯度算法优化深度强化学习模型，可以提高模型算法的稳定性，利用优化后的深度强化学习模型，可以根据各个地面站反馈的当前环境状态输出最优的功率分配方案，从而合理地将卫星基站的总发送功率分配给公共流和各个私有流，因此，本发明可以在环境动态变化、信道信息受限的情况下实现最优的功率分配策略，此外，可以大大降低计算复杂度，有效提高无线通信系统的传输速率。

49、本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书以及附图中所特别指出的结构来实现和获得。