一种基于多注意力机制的大规模MIMO的CSI反馈方法
- 国知局
- 2024-10-09 16:22:54
本发明属于无线通信,具体涉及一种基于多注意力机制的大规模mimo的csi反馈方法。
背景技术:
1、随着移动通信技术的迅速发展,大规模多输入多输出(multiple-inputmultiple-out-put,mimo)作为第五代移动通信技术的主要使能技术之一,为实现更高速率和更可靠的通信提供了重要支持。在频分双工(frequency division duplexing,fdd)模式下,基站(base station,bs)获得准确的下行链路信道状态信息(channel stateinformation,csi)对提高大规模mimo的性能十分重要。但mimo系统中csi开销巨大,这限制了大规模mimo系统的实际应用。传统的csi反馈方法,如矢量量化或基于码本的方案,虽然能够减少反馈开销,但损失了部分信道信息,并且随着发射天线数量的增加,反馈开销也呈线性增长。为了解决这一问题,压缩感知算法被引入到csi反馈中,但这些算法存在一定的局限性,如对信道稀疏性的依赖、高斯随机分布矩阵的使用以及计算复杂度高等。因此,需要寻找一种能够在低压缩率下既准确又快速地恢复信道的csi反馈方法。
2、近年来,深度学习技术因其强大的数据建模和特征提取能力而备受瞩目。在解决大规模mimo系统中的csi反馈问题时,基于深度学习的方法也逐渐引起了广泛关注。与传统的信号处理算法相比,深度学习能够更好地应对复杂多变的物理环境,提取复杂的信道特征,从而提高csi反馈的性能。有大量研究者针对基于深度学习的csi反馈进行了研究,但也存在一定的局限性与不足。
3、现有研究大多通过不同尺度的卷积核以及残差网络的结构对网络重建性能进行优化,但网络较简单,计算复杂度低,存在重建精度低的情况。因此有研究者通过增加网络深度,或者利用长短期记忆(long short term memory,lstm)网络结合前面时刻的输出和当前时刻的输入提取到数据之间隐含的时间相关性并学习出当前时刻的输出,从而提高重建能力,但大大增加了运算复杂度。现有网络以计算复杂度为代价提高了重建性能,但这种牺牲是不值得的,因此应该寻找一种能在不增加计算复杂度的情况下尽可能提高重建精度的方法。
技术实现思路
1、有鉴于此,本发明的目的是提供一种基于多注意力机制的大规模mimo的csi反馈方法。
2、本发明的目的是通过以下技术方案实现的:
3、一种基于多注意力机制的大规模mimo的csi反馈方法,包括:
4、步骤1:获取待反馈压缩的csi数据表示复数集,nc表示子载波数量,nt表示基站天线数;
5、步骤2:通过离散傅里叶变换将h变换到角度时延域,生成稀疏信道矩阵
6、步骤3:将稀疏信道矩阵的前na行进行截断,得到截断矩阵
7、步骤4:构建csi反馈模型,并利用训练好的csi反馈模型对截断矩阵进行重建,生成重建的csi矩阵其中,csi反馈模型包括多注意力机制网络manet,所述多注意力机制网络manet包括编码器和解码器,编码器包括依次连接的空洞卷积注意力机制模块、第一多头注意力机制模块和第一全连接层,用于从截断矩阵中提取特征,生成编码的压缩码字v;压缩码字v通过上行链路传输到基站进行解码,其中,解码器包括依次连接的第二全连接层和第二多头注意力机制模块,用于对接收到信息进行解码,生成重建的csi矩阵
8、步骤5:将重建的csi矩阵进行零填充和逆傅里叶变换,生成恢复的csi矩阵
9、进一步地,步骤2具体用公式表示为:
10、
11、其中,fc和ft分别表示维度为nc×nc和nt×nt的离散傅里叶变换矩阵,fth表示对ft进行共轭转置。
12、进一步地,步骤4中,空洞卷积注意力机制模块包括三个并行支路,每个支路均包含依次连接的空洞卷积层、bn层和激活层,每个空洞卷积层中的空洞卷积的卷积核为3×3,且每个空洞卷积的空洞率均不相同,每个支路的输出进行叠加,并将叠加结果进行3×3卷积,从而得到第一输出。
13、进一步地,步骤4中,编码器中的第一多头注意力机制模块和解码器中的第二多头注意力机制模块结构相同,包括多头注意力层、第一层归一化层、前馈层和第二层归一化层,其中,多头注意力层的输入与多头注意力层的输出进行叠加之后输入第一层归一化层,第一层归一化层的输出作为前馈层的输入,第一层归一化层的输出以及前馈层的输出进行叠加后作为第二层归一化层的输入。
14、进一步地,步骤4中,
15、
16、其中,fe表示编码过程,θe表示编码过程的参数;
17、
18、其中,fd表示解码过程,θd表示解码过程的参数,表示对重建后的结果,z表示高斯白噪声,表示受到噪声影响的码字。
19、进一步地,csi反馈模型还包括去噪子网络,去噪子网络位于编码器和解码器之间,用于去除压缩码字v在传输过程中的噪声,去噪子网络包括第三多头注意力机制模块,其中,第三多头注意力机制模块与第一多头注意力机制模块和第二多头注意力机制模块的结构相同,第三多头注意力机制模块中的前馈层采用多层感知器结构。
20、进一步地,所述方法还包括对csi反馈模型的训练,具体包括:
21、对多注意力机制网络manet和去噪子网络分别进行预训练,获得多注意力机制网络manet和去噪子网络的初始权系数;
22、对多注意力机制网络manet和去噪子网络进行交替训练,从而获得对多注意力机制网络manet和去噪子网络的最优权系数。
23、本发明的有益效果是:
24、本发明提出的多注意力机制网络manet采用了不同的注意力机制进行结合,将空洞卷积注意力机制与多头注意力机制相结合,提高了网络对于csi压缩和重建能力,具体地,采用空洞卷积可以在不增加计算复杂度的情况下,增加感受野,以更好地捕捉特征,而且,本发明使用不同空洞率的空洞卷积,通过利用不同尺度的信息,从而更全面地提取特征;本发明采用的多头注意力机制能够关注输入信息的不同方面,从而捕获更全面多样化的信息,提高了系统模型的表征能力与泛化能力;本发明中的多头注意力机制允许多个注意力头并行计算,能够更加高效地处理大规模数据和复杂任务,提高模型的训练和推理速度;针对传输过程中产生的噪声,本发明又通过单独的纠错网络,即去噪子网络,进行消除误差,使得基站最终获得的信道状态信息更加准确;本发明采用联合训练策略对manet和去噪子网络进行训练,能够有效地实现去噪。
25、本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
技术特征:1.一种基于多注意力机制的大规模mimo的csi反馈方法,其特征在于,包括:
2.根据权利要求1所述的基于多注意力机制的大规模mimo的csi反馈方法,其特征在于,步骤2具体用公式表示为:
3.根据权利要求1所述的基于多注意力机制的大规模mimo的csi反馈方法,其特征在于,步骤4中,空洞卷积注意力机制模块包括三个并行支路,每个支路均包含依次连接的空洞卷积层、bn层和激活层,每个空洞卷积层中的空洞卷积的卷积核为3×3,且每个空洞卷积的空洞率均不相同,每个支路的输出进行叠加,并将叠加结果进行3×3卷积,从而得到第一输出。
4.根据权利要求1所述的基于多注意力机制的大规模mimo的csi反馈方法,其特征在于,步骤4中,编码器中的第一多头注意力机制模块和解码器中的第二多头注意力机制模块结构相同,包括多头注意力层、第一层归一化层、前馈层和第二层归一化层,其中,多头注意力层的输入与多头注意力层的输出进行叠加之后输入第一层归一化层,第一层归一化层的输出作为前馈层的输入,第一层归一化层的输出以及前馈层的输出进行叠加后作为第二层归一化层的输入。
5.根据权利要求1所述的基于多注意力机制的大规模mimo的csi反馈方法,其特征在于,步骤4中,
6.根据权利要求1所述的基于多注意力机制的大规模mimo的csi反馈方法,其特征在于,csi反馈模型还包括去噪子网络,去噪子网络位于编码器和解码器之间,用于去除压缩码字v在传输过程中的噪声,去噪子网络包括第三多头注意力机制模块,其中,第三多头注意力机制模块与第一多头注意力机制模块和第二多头注意力机制模块的结构相同,第三多头注意力机制模块中的前馈层采用多层感知器结构。
7.根据权利要求6所述的基于多注意力机制的大规模mimo的csi反馈方法,其特征在于,所述方法还包括对csi反馈模型的训练,具体包括:
技术总结本发明公开了一种基于多注意力机制的大规模MIMO的CSI反馈方法,包括:获取待反馈压缩的CSI数据H;通过离散傅里叶变换将H变换到角度时延域,生成稀疏信道矩阵将稀疏信道矩阵的前N<subgt;a</subgt;行进行截断,得到截断矩阵步骤4:构建CSI反馈模型,并利用训练好的CSI反馈模型对截断矩阵进行重建,生成重建的CSI矩阵其中,CSI反馈模型包括多注意力机制网络MANet;步骤5:将重建的CSI矩阵进行零填充和逆傅里叶变换,生成恢复的CSI矩阵本发明的方法能够在不增加复杂度的情况下,提高重建CSI的精度。技术研发人员:曾孝平,张青青,樊知轩,赵权宇,李炜基受保护的技术使用者:重庆大学技术研发日:技术公布日:2024/9/26本文地址:https://www.jishuxx.com/zhuanli/20240929/312845.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。