一种协同抗干扰通信方法及系统
- 国知局
- 2024-09-05 14:25:35
本发明涉及无线通信抗干扰,尤其涉及一种协同抗干扰通信方法及系统。
背景技术:
1、随着无线通信网络用户规模的不断扩大,网络内往往拥有多个用频设备,通信用户在对抗外部恶意干扰的同时还需要解决内部协调用频的问题,研究多用户协同抗干扰方法更具有实际意义。
2、然而,目前对于多智能体系统抗干扰问题的研究多针对于小范围密集部署的通信场景,网络内的用户仅通过使用正交的频率避免同频干扰,面对广域、大规模通信场景,存在频谱资源浪费、正交性易受干扰破坏的问题;且现有研究中多智能体系统多使用依赖可靠控制信道进行用户间信息交互的集中式或分布式学习算法,虽然能够获得良好的学习效果,但在复杂多变、资源短缺的通信对抗场景中,通信用户间频繁、可靠的信息交互难以实现。
技术实现思路
1、本发明提供一种协同抗干扰通信方法及系统,用以解决在复杂多变、资源短缺的通信对抗场景中,通信用户间频繁、可靠的信息交互难以实现的技术缺陷。
2、第一方面,本发明提供一种协同抗干扰通信方法,所述方法包括:
3、获取频谱感知结果,所述频谱感知结果包括不同观测状态下所获得的业务信道的状态信息;所述观测状态包括抗外部恶意干扰和抗多用户通信干扰;
4、获取所述业务信道的信息传输结果,所述信息传输结果包括信息传输成功和信息传输不成功;
5、基于通信用频决策模型以及所述频谱感知结果,获取所述通信用频决策模型输出的不同观测状态下对应的决策结果;所述通信用频决策模型是基于待训练样本集和信息传输结果对待训练决策模型进行训练得到;所述决策结果包括不同观测状态下的下一接入业务信道信息;
6、基于不同观测状态下对应的决策结果,确定协同不同观测状态后的通信用频策略。
7、根据所述的协同抗干扰通信方法,所述获取所述通信用频决策模型输出的不同观测状态下对应的决策结果的步骤包括:
8、将所述频谱感知结果作为所述通信用频决策模型的输入,获取所述通信用频决策模型中的卷积层输出的频谱感知结果的频谱特征信息。
9、根据所述的协同抗干扰通信方法,所述通信用频决策模型是基于待训练样本集和信息传输结果对待训练决策模型进行训练得到的步骤包括:
10、获取待训练样本集;所述待训练样本集包括多个样本频谱感知数据;
11、针对所述多个样本频谱感知数据中的任一样本频谱感知数据,将所述样本频谱感知数据作为待训练决策模型的输入,获取所述待训练决策模型输出的不同观测状态下对应的决策结果;
12、基于所述决策结果和信息传输结果,对所述待训练决策模型进行参数调整,并确定通信决策模型。
13、根据所述的协同抗干扰通信方法,所述基于所述决策结果和信息传输结果,对所述待训练决策模型进行参数调整的步骤包括:
14、基于所述信息传输结果更新奖励函数。
15、根据所述的协同抗干扰通信方法,所述基于所述决策结果和信息传输结果,对所述待训练决策模型进行参数调整的步骤还包括:
16、采用经验回放机制对所述待训练决策模型进行参数调整。
17、根据所述的协同抗干扰通信方法,所述基于不同观测状态下对应的决策结果,确定协同不同观测状态后的通信用频策略的步骤包括:
18、基于不同观测状态下对应的决策结果进行拟合获得复合动作价值函数;
19、基于所述复合动作价值函数确定不同观测状态下对应的决策结果的加权平均值,
20、根据所述加权平均值采用纯贪婪策略确定协同不同观测状态后的通信策略,所述通信策略包括协同不同观测状态后的下一接入业务信道信息。
21、根据所述的协同抗干扰通信方法,所述频谱感知结果包括不同观测状态下的频谱瀑布图。
22、第二方面,本发明提供一种协同抗干扰通信系统,所述系统包括接收机和发射机,所述发射机执行如上述任一项所述协同抗干扰通信方法的步骤;
23、接收机用于确定多个业务信道的传输信息是否传输成功,若传输信息传输成功,则向发射机发送反馈信息,若传输信息未传输成功,则不向发射机发送反馈信息;
24、所述发射机根据所述接收机发送的反馈信息生成多个业务信道的信息传输结果并基于获取到的频谱感知结果确定协同不同观测状态后的通信用频策略。
25、根据所述的协同抗干扰通信系统,所述接收机和发射机以时隙为单位进行通信,每个时隙包含数据传输、确认字符(ack)传输和学习决策3个阶段。
26、第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述任一项所述协同抗干扰通信方法的步骤。
27、本发明提供一种协同抗干扰通信方法及系统相比与现有技术,具有以下优势:
28、(1)本发明提出的广域多用户通信用频决策模型,构建完备,且充分考虑信道衰落及用户位置分布带来的频率复用特性,解决了传统多用户抗干扰问题中,用户间仅依靠正交频率避免同频互扰存在的频率资源浪费,正交性易受干扰破坏等问题;
29、(2)创新性地建模通信用户发射机为具备学习决策能力的智能体,设计通信时隙结构,使发射机与接收机之间的决策结果及ack等控制信息同数据信息一起通过业务信道进行传输,解决了复杂恶劣频谱环境下控制信道不可靠的问题,同时,本发明提出的通信系统无需通过信息交互和可靠控制信道,就能实现多用户独立学习达到协同效果。
30、(3)创新深度强化学习算法设计,提出的基于智能频率复用的协同抗干扰方法,设计了网络模型及复合奖励函数,使通信用户能够独立学习不同观测状态下抗干扰及频率复用策略,实现对提出模型的有效求解。
技术特征:1.一种协同抗干扰通信方法,其特征在于,所述方法包括:
2.根据权利要求1所述的协同抗干扰通信方法,其特征在于,所述获取所述通信用频决策模型输出的不同观测状态下对应的决策结果的步骤包括:
3.根据权利要求1所述的协同抗干扰通信方法,其特征在于,所述通信用频决策模型是基于待训练样本集和信息传输结果对待训练决策模型进行训练得到的步骤包括:
4.根据权利要求3所述的协同抗干扰通信方法,其特征在于,所述基于所述决策结果和信息传输结果,对所述待训练决策模型进行参数调整的步骤包括:
5.根据权利要求4所述的协同抗干扰通信方法,其特征在于,所述基于所述决策结果和信息传输结果,对所述待训练决策模型进行参数调整的步骤还包括:
6.根据权利要求1所述的协同抗干扰通信方法,其特征在于,所述基于不同观测状态下对应的决策结果,确定协同不同观测状态后的通信用频策略的步骤包括:
7.根据权利要求1所述的协同抗干扰通信方法,其特征在于,所述频谱感知结果包括不同观测状态下的频谱瀑布图。
8.一种协同抗干扰通信系统,其特征在于,所述系统包括接收机和发射机,所述发射机执行如上述权利要求1-7中任一项所述协同抗干扰通信方法的步骤;
9.根据权利要求8所述的协同抗干扰通信系统,其特征在于,所述接收机和发射机以时隙为单位进行通信,每个时隙包含数据传输、确认字符(ack)传输和学习决策3个阶段。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述协同抗干扰通信方法的步骤。
技术总结本发明提供一种协同抗干扰通信方法及系统,属于无线通信抗干扰技术领域,所述方法包括:获取频谱感知结果和业务信道的信息传输结果,进而基于通信用频决策模型以及频谱感知结果,获取通信用频决策模型输出的不同观测状态下对应的决策结果,从而基于不同观测状态下对应的决策结果,确定协同不同观测状态后的通信用频策略。本发明提出的通信用频决策模型,构建完备,且充分考虑信道衰落及用户位置分布带来的频率复用特性,解决了传统多用户抗干扰问题中,用户间仅依靠正交频率避免同频互扰存在的频率资源浪费,正交性易受干扰破坏等问题。此外,应用上述方法的通信系统无需通过信息交互和可靠控制信道,就能实现多用户独立学习达到协同效果。技术研发人员:汪西明,可臻怡,熊涛,杜智勇,陈嘉琦受保护的技术使用者:中国人民解放军国防科技大学技术研发日:技术公布日:2024/9/2本文地址:https://www.jishuxx.com/zhuanli/20240905/286410.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表