一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于GPU的PCM/FM遥测信号非相干解调实现方法与流程

2021-11-22 13:43:00 来源:中国专利 TAG:

一种基于gpu的pcm/fm遥测信号非相干解调实现方法
技术领域
1.本发明涉及通信技术领域,尤其涉及一种基于gpu的pcm/fm遥测信号非相干解调实现方法。


背景技术:

2.飞行器遥测是导弹、火箭、卫星等航天器试验和运行过程中必不可少的重要支持系统,能够实时监测航天器内部工作状态、电气性能、环境参数等重要信息,为航天器性能检测、效能评估及故障分析提供依据。现如今随着航天事业的深入发展,全球各个航天大国对宇宙的探索和对宇宙资源的争夺愈加强烈,这就使得遥测技术突显出更为重要的作用。
3.脉冲编码调制/调频(pcm/fm)技术具有较强的抗尾焰效应能力、抗噪声性能强、发射机功率高等特点,成为国内外航空航天遥测领域长期采用的一种主流体制。pcm/fm体制在遥测系统中运用多年,调频信号本身具有较好的抗干扰能力,传统解调方式为非相干解调,非相干解调具有结构简单的解调设计电路。
4.经过几十年的发展,遥测系统已经从早期的功能分立的专用设备逐步发展成为多功能数字遥测系统,具有数字化程度高、多功能一体化等优点,较好地满足了现有任务的需要。面向未来任务日益多样化,试验环境日趋复杂化,对遥测系统的灵活适应性提出了更高要求。传统基于软件无线电设计理念的遥测系统侧重于功能的“软件实现”,尽管近年来软件化程度越来越高,但其灵活适应性仍然受到限制,主要体现在:

系统控制和执行设备仍然相互依赖,硬件资源不可切割和按需分配,性能升级与功能扩展需要对硬件环境进行重新部署,这种单纯通过扩展设备量和增加系统复杂度的方式,不适应未来日益增多的试验任务需求;

面向既定任务和功能需求的定制化研发模式,难以快速响应用户的即时需求,不适应未来复杂多变的试验任务需求。因此,迫切需要寻求对传统软件无线电遥测系统的设计理念和研发模式的转型,进一步提高遥测系统的灵活适应性。
5.传统的pcm/fm遥测解调多采用基于fpga的硬件板卡实现,核心解调算法由fpga完成。常用的基于fpga的pcm/fm遥测信号解调器由信号处理模块、接口模块和数据采集模块组成,系统的结构框图如图1所示。其中数据采集模块将模拟信号进行数字采样,信号处理模块完成信号的下变频、滤波、鉴频解调,接口模块负责将解调数据输出。
6.图1所示的结构以基于fpga的信号处理板卡为核心,外加一些时钟管理和电源管理等模块,该板卡主要完成遥测信号的解调以及数据格式转换,但存在以下不足:
7.(1)硬件系统结构复杂,嵌入式系统开发周期长、成本高,升级维护难度大;(2)软硬件之间高度的耦合性使得系统专用性强,一旦设计制造完成,功能扩展和修改困难大;(3)系统开发门槛高,完成系统的整体开发和调试需要开发人员克服硬件系统、软件语言、处理算法等多方面困难。


技术实现要素:

8.为解决上述技术问题,本发明提出了一种基于gpu的pcm/fm遥测信号非相干解调
实现方法,所述方法,用于解决现有技术中系统控制和执行设备仍然相互依赖,单纯通过扩展设备量和增加系统复杂度的方式,不适应未来日益增多的试验任务需求;面向既定任务和功能需求的定制化研发模式,难以快速响应用户的即时需求,不适应未来复杂多变的试验任务需求;硬件系统结构复杂,功能难于扩展,软硬件之间耦合度高的技术问题。
9.根据本发明的第一方面,提供一种基于gpu的pcm/fm遥测信号非相干解调实现方法,
10.所述具有gpu的遥测解调系统包括信号采集模块、高速接口模块、核心运算模块和系统控制模块;所述信号采集模块包括adc模块、10mhz频标,用于对信号进行数字采样及调节信号幅度;所述高速接口模块包括高速以太网卡、存储服务器及处理模块,所述高速接口模块用于接收所述信号采集模块输出的数据信号,并将所述数据信号发送到系统控制模块;所述系统控制模块包括cpu及缓存单元,所述缓存单元用于缓存所述数据信号,cpu用于调度任务,对所述缓存单元中的数据分段,并将分段后的数据分配给所述核心运算模块;所述核心运算模块包括多个gpu,所述核心运算模块以并行方式处理所述系统控制模块发送的分段后的数据,gpu之间通过nvlink总线互联;cpu和gpu之间的数据交互以及cpu对gpu的系统调度通过pcie总线完成;
11.所述方法包括以下步骤:
12.步骤s601:所述信号采集模块包括adc模块和数据分发服务(dds,data distribution servic)中间件,在所述数据采集模块中,模拟数据经过幅度调节后由模数转换模块进行采样;采样后的数字信号利用dds中间件进行发布,然后通过万兆网络发送到所述高速接口模块的万兆网卡;
13.步骤s602:所述高速接口模块通过16x pcie总线将采集到的数据输入到dds中间件的缓存区,并在系统控制模块的调度下开始数据的循环缓存;
14.步骤s603:在所述系统控制模块的调度下,对dds中间件缓冲区内的数据分段,gpu按段订阅数据,获取pcm/fm信号;
15.步骤s604:各gpu收到调度指令并获得数据后,将数据转化为浮点数;
16.步骤s605:各gpu利用数字控制振荡器(nco)产生的信号进行并行下变频以降低频率,并根据估计的多普勒频偏误差对该数字控制振荡器的信号作实时消除误差处理;
17.步骤s606:对并行下变频后的数据进行并行时域滤波运算,以消除高频信号的干扰;
18.步骤s607:将滤波后的数据进行并行叉积鉴频运算,鉴频结果即为所需的调制信号f(t);将得到的鉴频结果分为两路,一路用于解调数据的输出,即对滤波后的数据进行累加操作并执行帧同步后作为输出数据;另一路用于估计多普勒频偏误差;
19.步骤s608:根据鉴频运算得到的鉴频结果估计多普勒频偏误差,并将此误差作为所述估计的多普勒频偏误差,反馈给nco,以供下次下变频运算时使用;
20.步骤s609:基于解调数据接口要求对同步后的数据进行格式化输出。
21.根据本发明的第二方面,提供一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于gpu的pcm

fm遥测信号非相干解调实现方法。
22.根据本发明第三方面,提供一种计算机可读存储介质,所述存储介质中存储有多
条指令;所述多条指令,用于由处理器加载并执行如前所述的基于gpu的pcm/fm遥测信号并行非相干解调实现方法。
23.根据本发明的上述方案,本发明对传统软件无线电遥测系统的设计思路进行改进,采用cpu gpu的异构并行计算平台,以gpu作为核心的数据处理器件,用cpu完成任务的分配和调度,设计了基于gpu的pcm/fm遥测信号解调方法及装置,利用图形处理单元(gpu)的高灵活性和高效并行数据处理能,进一步提高遥测系统的灵活适应性,本发明可以有效降低遥测解调器的开发难度;商用器件和软件运算可有效提高系统对各种不同接口遥测解调系统的适应能力,可根据性能需求灵活配置gpu,克服现有技术不足。具有重构灵活、扩展性好等优势。利用gpu并行运算提高运算效率。可靠性更高,扩展性更好,设计实现更简单,可满足测控系统中pcm/fm遥测信号的实时解调需求。与传统基于fpga的pcm/fm遥测信号解调器相比,本发明可靠性更高,扩展性更好;与传统基于gpu的pcm/fm遥测信号解调器相比,本发明并行性更好,可实现信号的实时解调。
24.基于gpu的pcm/fm遥测信号非相干解调方法充分利用gpu强大的并行浮点运算能力和灵活的可重构特性,重新设计系统架构并映射和优化解调算法。由于适应了软件无线电发展的趋势,具有更高的可重构特性,该系统将在我国未来的遥测系统中具有广泛的应用前景。本发明提出和设计的pcm/fm遥测信号解调方法具有如下明显优势:
25.(1)系统开发周期短。opencl和cuda等基于gpu的开发框架使得gpu上的编程较fpga开发门槛更低,这些开发框架里包含大量的接口函数和库文件,可以像开发普通的c程序一样灵活调用这些库函数,这一特性大大节省了gpu程序的开发周期。
26.(2)系统重构简单方便。gpu核函数的运行是在cpu的调度下顺序执行的,而数字信号处理的流程可以被分成多个部分通过不同的核函数执行完成。数字信号处理流程的修改可通过仅修改这些核函数完成,而不必更改底层硬件。这就使得gpu数字信号处理流程的修改和重置与全硬件实现相比更加快速简便。
27.(3)浮点运算能力强,运算精度高。gpu本身具备超强的双精度和单精度并行浮点运算能力,同时gpu具数十gb的片上存储空间,这些优异的性能为本地信号的高精度实现生成提供了更多可供选择的形式,为高精度数字信号处理提供了可能。
28.(4)扩展性好,升级维护方便,更加易于增加新的功能。基于cuda开发的数字信号处理系统基于同一架构的硬件平台而实现了所有软件无线电的算法,数据重用性更好。该系统经过一次adc便可将采样数据反复用于信道综合、信号同步、频率相位提取、数据解调等软件无线电功能的实现,终端功能的扩展仅需要增加软件模块,而不需要重新设计硬件平台。
29.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
30.构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明提供如下附图进行说明。在附图中:
31.图1为现有技术中基于fpga的pcm/fm遥测解调系统结构示意图;
32.图2为本发明一个实施方式的基于gpu的pcm/fm遥测解调系统结构示意图;
33.图3为本发明一个实施方式的基于gpu的pcm/fm遥测信号非相干解调实现方法流程示意图;
34.图4为本发明pcm/fm遥测信号解调实现原理示意图;
35.图5为本发明一个实施方式的基于gpu的pcm/fm遥测信号非相干鉴频解调示意图;
36.图6为本发明一个实施方式的并行非相干鉴频方法流程示意图;
37.图7为本发明一个实施方式的帧头eb90的调制信号序列;
38.图8为本发明一个实施方式的pcm/fm调制信号时域图;
39.图9为本发明一个实施方式的pcm/fm调制信号频谱图;
40.图10为本发明一个实施方式的基于gpu的正交下变频后频谱图;
41.图11为本发明一个实施方式的fir低通滤波后频谱图;
42.图12为本发明一个实施方式的基于gpu的pcm/fm遥测信号解调出的信号幅度;
43.图13为本发明一个实施方式的基于gpu的pcm/fm遥测信号非相干解调输出信号。
具体实施方式
44.首先结合图2

3说明本发明一个实施方式的基于gpu的pcm/fm遥测信号非相干解调方法流程。所述基于gpu的pcm/fm遥测信号非相干解调方法,基于具有gpu的遥测解调系统实现,如图2所示,所述具有gpu的遥测解调系统包括信号采集模块、高速接口模块、核心运算模块和系统控制模块;所述信号采集模块包括adc模块、10mhz频标,用于对信号进行数字采样及调节信号幅度;所述高速接口模块包括高速以太网卡、存储服务器及处理模块,所述高速接口模块用于接收所述信号采集模块输出的数据信号,并将所述数据信号发送到系统控制模块;所述系统控制模块包括cpu及缓存单元,所述缓存单元用于缓存所述数据信号,cpu用于调度任务,对所述缓存单元中的数据分段,并将分段后的数据分配给所述核心运算模块;所述核心运算模块包括多个gpu,所述核心运算模块以并行方式处理所述系统控制模块发送的分段后的数据,进行并行数字下变频、并行fir滤波、并行鉴频、多普勒频偏估计以及位同步,gpu之间通过nvlink总线互联,cpu和gpu之间的数据交互以及cpu对gpu的系统调度通过pcie总线完成。
45.本实施例中,所述具有gpu的遥测解调系统采用cpu gpu的异构并行计算平台,所述具有gpu的遥测解调系统包括信号采集模块、高速接口模块、核心运算模块和系统控制模块。所述数据采集模块由adc模块、10mhz频标等部分构成,用于完成模拟中频信号的数字采样,同时辅以信号的幅度调节功能。所述系统控制模块是系统管控中心,由pc主机和缓存组成,用于分发数据、各模块的管理调度以及逻辑控制计算。所述核心运算模块由多块gpu计算显卡组成,是具有gpu的遥测解调系统的核心模块,此模块上进行并行运算,进行并行数字下变频、并行fir滤波、并行鉴频、多普勒频偏估计以及位同步。
46.本实施例中,多个gpu之间通过高速nvlink总线互联,完成中间数据的交互,cpu和gpu之间的数据交互以及cpu对gpu的系统调度通过高速pcie总线完成。各个模块之间通过高速以太网连接,上述实现方式提高了灵活性和可扩展性。
47.从调频特征来看待pcm/fm信号,其解调可以采用鉴频方式。但是遥测传输信道复杂,遥测信号在传输过程中受多径衰落的影响,难以提取相干载波,所以相干解调鉴频难于实施。在工程上常采用非相干鉴频解调方法,这种方法结构简单,容易实现,且对因多径衰
落造成的幅度和相位方面的失真有较强的抗干扰能力,pcm/fm遥测信号解调原理如图4所示,首先使用ad转换模块将模拟信号转换成数字信号。然后数字下变频模块(digital down converter,简称ddc),将中频输入信号下变频到零中频信号,低通滤波器滤除高频干扰信号。之后进行内插、重采样以减小解调计算量,加快解调速度。利用i路、q路信号进行非相干叉积鉴频,将得到的鉴频结果分为两路,一路用于估计多普勒频偏,然后将频率偏差反馈到nco进行频率修正;另一路用于解调数据的输出。
48.本实施例中,将数据并行与任务并行相结合,由系统控制模块中的数据预处理模块将缓存单元中的数据分解为多个片段,每个片段的端部均与其相邻的片段端部具有部分数据重叠,用以保持数据的连续性和依赖性。例如,将每一片段的头部与其相邻的片段的尾部作若干字节重叠,将每一片段的尾部与其相邻的片段的头部作若干字节重叠。再对每个片段按流水方式进行任务分解,所述核心运算模块包括并行下变频模块、并行fir低通滤波模块和并行鉴频模块,由一个核函数各自完成一个任务,多个核函数实现任务的并行处理。本实施例的方式,在遥测解调中,既解决了数据连续性问题,又解决了并行处理问题。
49.如图3、图5

图6所示,图6为基于cuda(compute unified device architecture,统一计算设备架构)架构的并行非相干鉴频流程,数据需要经过下变频、fir低通滤波和鉴频操作。数据的处理包括:(1)在数据预处理阶段,根据数据特性和计算资源数量将数据分解为m段;(2)对每一个数据段,在数据段内,根据频率生成nco,执行并行下变频,将中心频率搬移到基带;(3)对下变频后的数据执行并行滤波;(4)对滤波后的数据进行差分鉴频;并利用鉴频结果计算多普勒频偏,并根据多普勒频偏结果对nco进行多普勒误差补偿;(5)对m个数据段产生的鉴频结果进行同步处理,输出处理结果。
50.本实施例中,利用数据分段将数据和流程最大限度解耦合,提高系统的并行性,用空间复杂度换取数据处理时间复杂度,实现处理数据的并行化。基于gpu的pcm/fm遥测信号并行非相干解调方法包括:
51.步骤s601:所述信号采集模块包括adc模块和数据分发服务(dds,data distribution servic)中间件,在所述数据采集模块中,模拟数据经过幅度调节后由模数转换模块进行采样;采样后的数字信号利用dds中间件进行发布,然后通过万兆网络发送到所述高速接口模块的万兆网卡;
52.步骤s602:所述高速接口模块通过16x pcie总线将采集到的数据输入到dds中间件的缓存区,并在系统控制模块的调度下开始数据的循环缓存;
53.步骤s603:在所述系统控制模块的调度下,对dds中间件缓冲区内的数据分段,gpu按段订阅数据,获取pcm/fm信号;
54.本实施例中,获取的pcm/fm信号为:
[0055][0056]
其中,t为时间,s
pcm/fm
(t)为接收到的pcm/fm信号,a
c
为幅度,ω
c
为载波频率,k
f
为调制指数,f(τ)为调制信号,θ为初始相位;
[0057]
步骤s604:各gpu收到调度指令并获得数据后,将数据转化为浮点数;
[0058]
步骤s605:各gpu利用数字控制振荡器(nco)产生的信号进行并行下变频以降低频率,并根据估计的多普勒频偏误差对该数字控制振荡器的信号作实时消除误差处理;
[0059]
本实施例中,进行数字下变频以降低频率,即将接收到的pcm/fm信号分别与nco产生的正交本振的信号cos(ω
c
t)和sin(ω
c
t)相乘,得到:
[0060][0061][0062]
步骤s606:对并行下变频后的数据进行并行时域滤波运算,以消除高频信号的干扰;
[0063]
本实施例中,滤波后获得同相分量与正交分量,
[0064][0065][0066]
其中,i(t)为同相分量,q(t)为正交分量。
[0067]
步骤s607:将滤波后的数据进行并行叉积鉴频运算,鉴频结果即为所需的调制信号f(t);将得到的鉴频结果分为两路,一路用于解调数据的输出,即对滤波后的数据进行累加操作并执行帧同步后作为输出数据;另一路用于估计多普勒频偏误差;
[0068]
本实施例中,所述鉴频运算是通过i路、q路信号进行非相干叉积鉴频,
[0069]
鉴频的目的是计算所需的调制信号f(t),
[0070][0070][0071]
本实施例中,频率鉴别的目的即为找到所需的调制信号f(t),由于调频信号的振幅是确定的,所以:
[0072]
i2(t) q2(t)=1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式4)
[0073]
因此,公式4转化为:
[0074]
f(t)=i'(t)q(t)

q'(t)i(t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式5)
[0075]
采用数字化鉴频,由数学运算可得:
[0076][0077]
其中,i'(n)为同相分量i(n)的导数,i(n)为数字化形式的同相分量,i(n

1)为延迟一位的同相分量,q'(n)为数字化形式的正交分量q(n)的导数,q(n

1)为延迟一位的正交分量。
[0078]
数字化形式的同相分量i(n)、数字化形式的正相分量q(n),两路基带信号的表达式为:
[0079][0080]
其中,t为采样周期;
[0081]
然后对相位进行差分,则公式5化简为:
[0082][0083]
由公式8可知,当2πk
f
tf(n)小于预设量级时,“≈”关系成立。2πk
f
和f(n)的值是固定不变的,因此,在公式8中能够调整的值只有采样周期t。所以要采样频率f
s
足够大,本实施例中,f
s
=56m,能保证非相干鉴频解调的准确性,就能得到调制信号f(t)。
[0084]
步骤s608:根据鉴频运算得到的鉴频结果估计多普勒频偏误差,并将此误差作为所述估计的多普勒频偏误差,反馈给nco,以供下次下变频运算时使用;
[0085]
步骤s609:基于解调数据接口要求对同步后的数据进行格式化输出。
[0086]
进一步地,又一实施例用以说明本技术的有效性。
[0087]
本实施例的实验环境为:1)通用计算机:型号为w580

g20;2)cpu:2颗英特尔xeon(至强)e5

2680处理器,主频2.4ghz;3)操作系统:centos linux release 7.9.2009;4)gpu:nvida tesla k20c;5)软件环境:nvidia显卡驱动455.23,cuda11.1。
[0088]
首先以随机方式仿真产生调制信号,帧头采用eb90、码型为nrz

l,生成的数据序列如图7所示;把信号加到高斯白噪声信道中,以这些随机数为种子进行扩展。通过对信号调频,实现数字正交调制的中频信号。生成的pcm/fm调制信号如图8所示,载波频率14mhz、码速率2mbit/s,采样率56mhz,频谱图如图9所示。
[0089]
正交下变频成基带信号,下变频后的频谱图以及fir滤波后的频谱图分别如图10和图11所示,从图中可以看出下变频后信号变成零中频、fir低通滤波很好的滤除干扰。图12展示的是解调后的信号幅度,进行判决后的解调信号如图13所示,可以看出解调信号的
波形和原输入信号的波形一致,因此可知本文设计可以正确的解调出原信号。
[0090]
对1s调制信号进行解调,利用matlab软件进行完全串行的解调用时295s;而基于gpu的实验平台进行解调用时367ms,加速比804。从实验结果看,基于gpu可以实现pcm/fm信号的实时解调。
[0091]
本发明实施例进一步给出一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于gpu的pcm/fm遥测信号并行非相干解调方法。
[0092]
本发明实施例进一步给出一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于gpu的pcm/fm遥测信号非相干解调方法。
[0093]
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
[0094]
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0095]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0096]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0097]
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,实体机服务器,或者网络云服务器等,需安装windows、linux或者windows server操作系统)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0098]
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献