技术新讯 > 测量装置的制造及其应用技术 > 一种空间引力波探测的激光外差干涉频率分配方法与流程  >  正文

一种空间引力波探测的激光外差干涉频率分配方法与流程

  • 国知局
  • 2024-07-30 10:42:13

本发明涉及干涉测量,提供了一种空间引力波探测的激光外差干涉频率分配方法。

背景技术:

1、航天器之间存在相对运动,在空间引力波探测任务期间会产生与轨道选择相关的多普勒频移。因此需要使用外差干涉测量法,并且拍频读数也要随时间变化。由于航天器间远距离传播和激光干涉仪接收孔径有限,本地航天器只能接收到来自远程航天器的传输光的极少数,因此需要采用合适的锁相方案。另外,航天器的排列方式影响时变多普勒频移数值的大小,从而会影响引力波探测效果。

2、因受激光相对强度噪声和相位检测器带宽的影响,拍频的最小值和最大值受到了限制。在检测过程中为将拍频控制在允许的范围内,有固定拍频和固定激光偏移频率两种基本方法来解决这个问题。与固定拍频方法相比,固定偏移频率方法具有数据处理相对简单的优点,但偏移频率需要通过算法进行优化。一旦偏移频率发生变化,就需要通过从地面上传指令进行修改,并且需要重新启动干涉测量,这将不可避免地导致观测数据的中断。且由于低频区域更便于相位计调制,因此频率分配方案应该综合考虑偏频持续时长以及是否靠近低频。

技术实现思路

1、为了解决背景技术中提到的至少一个技术问题,本发明的目的在于提供一种空间引力波探测的激光外差干涉频率分配方法,解决现有技术中存在偏移频率分配方案不合理的问题。

2、为实现上述目的,本发明提供如下技术方案:

3、一种空间引力波探测的激光外差干涉频率分配方法,包括步骤:

4、s1:构建激光外差干涉测量模型,根据对称锁相方案和多种排列方式的组合,形成多个激光外差干涉测量模型来模拟不同环境和条件下的激光干涉现象;

5、s2:基于星间时变多普勒数据,结合gru网络训练模型并扩展时变多普勒数据集;

6、s3:训练偏移频率方案生成模型,在先验禁止频率域为5-25hz范围内,利用随机生成偏移频率法得到多个激光外差干涉测量模型满足对应约束条件的偏移频率,并将偏移频率存入经验池;利用经验回放机制训练网络,基于深度强化学习算法ddpg生成经验数据并更新网络参数与经验池;

7、s4:利用偏移频率方案生成模型生成一组偏移频率,将偏移频率引入时变多普勒频移数据中,并根据限制条件进行切换,当所有时变多普勒数据都被代入并满足限制条件后,完成一个训练周期,生成一组最优偏移频率分配方案。

8、进一步地,所述步骤s3中训练网络的过程包括:

9、s31:定义state变量,随机生成action变量,通过与环境交互,得到reward变量;根据环境反馈,得到next_state变量;

10、s32:将state变量、action变量、reward变量和next_state变量放入经验池进行评级并存储;

11、s33:建立价值网络与策略网络架构,包括网络输入层、隐藏层和输出层的维度以及输出层数据的范围;根据评级从经验池中选取一组数据,计算损失并与网络参数进行更新;循环送入经验数据,直到训练结束,得到偏移频率方案生成模型。

12、进一步地,所述步骤s2包括:

13、s21:根据时变多普勒数据集,设置时间窗口timestep为二,滑动制作时序数据产生len(data)-timestep个时序样本;

14、s22:将时序样本送入gru网络进行迭代训练生成gru网路模型,并扩展时变多普勒数据集用于生成偏移频率方案。

15、进一步地,所述步骤s3中深度强化学习算法ddpg的网格结构为:

16、所述策略网络的输入变量维度包括三个线性层,输入特征的维度为一组时变多普勒频移的数据维度为三,第一个隐藏层和第二个隐藏层分别有256个神经元,输出层维度为一组偏移频率维度为五。

17、所述价值网络的输入变量维度为包括三个线性层,输入特征的维度为一组时变多普勒频移的数据维度与一组偏移频率数据维度为八,第一个隐藏层和第二个隐藏层分别有256个神经元,输出层维度为一。

18、进一步地,所述步骤s3中的经验池包括:

19、s34:将state变量定义为当前时刻一组时变多普勒频移数据,action变量定义为生成的一组偏移频率数据,next_state变量定义为迭代action变量到时序多普勒位移数据集直到不满足约束条件的下一组时变多普勒频移;reward变量定义为生成next_state变量所需的迭代次数;

20、s35:根据生成的偏移频率数据平均值是否靠近低频以及reward大小来进行评级,并将该组四个变量送入经验池进行存储。

21、进一步地,所述步骤s3中的更新网络参数包括:

22、s36:采用梯度下降法迭代更新策略网络和价值网络的参数。

23、进一步地,所述步骤s1中的排列方式为:

24、采用对称结构的锁相方案,以一颗卫星的一个激光器作为主激光器,顺时针或逆时针排列另外两颗卫星的位置,得到多种卫星的排列方式。

25、与现有技术相比,本发明的有益效果是:

26、本发明通过确定排列方式与禁止频率域,使用gru算法模型根据有限监测数据模拟扩展数据集。参考先验经验,设置禁止频率域范围,使用改进的深度强化学习算法ddpg算法得到频率分配方案。ddpg强化学习算法步骤包括:定义价值网络与策略网络架构;定义环境变量、动作变量与奖励函数;定义经验回放池和取样机制;定义损失函数以及网络参数更新方法;训练网络模型。该方法可以在给定锁相方案和不同排列方式组合的情况下,迭代计算最优分配方案,使得偏频持续时长较长、偏频切换次数较少、偏移频率低频化,从而解决偏移频率分配方案不合理的问题。

技术特征:

1.一种空间引力波探测的激光外差干涉频率分配方法,其特征在于,包括步骤:

2.根据权利要求1所述的空间引力波探测的激光外差干涉频率分配方法,其特征在于,所述步骤s3中训练网络的过程包括:

3.根据权利要求1所述的空间引力波探测的激光外差干涉频率分配方法,其特征在于,所述步骤s2包括:

4.根据权利要求2所述的空间引力波探测的激光外差干涉频率分配方法,其特征在于,所述步骤s3中深度强化学习算法ddpg的网格结构为:

5.根据权利要求2所述的空间引力波探测的激光外差干涉频率分配方法,其特征在于,所述步骤s3中的经验池包括:

6.根据权利要求2所述的空间引力波探测的激光外差干涉频率分配方法,其特征在于,所述步骤s3中的更新网络参数包括:

7.根据权利要求1所述的空间引力波探测的激光外差干涉频率分配方法,其特征在于,所述步骤s1中的排列方式为:

技术总结本发明公开了一种空间引力波探测的激光外差干涉频率分配方法,涉及干涉测量技术领域,包括步骤S1:构建激光外差干涉测量模型,根据对称锁相方案和多种排列方式的组合,形成多个激光外差干涉测量模型来模拟不同环境和条件下的激光干涉现象;S2:基于星间时变多普勒数据,结合GRU网络训练模型并扩展时变多普勒数据集;S3:训练偏移频率方案生成模型,利用随机生成偏移频率法得到多个激光外差干涉测量模型满足对应约束条件的偏移频率,并将偏移频率存入经验池;利用经验回放机制训练网络,基于深度强化学习算法DDPG生成经验数据并更新网络参数与经验。本方法能够解决偏移频率分配方案不合理的问题。技术研发人员:杨涛,聂嘉良,曾励霄,梁新栋,贾建军受保护的技术使用者:国科大杭州高等研究院技术研发日:技术公布日:2024/7/23

本文地址:https://www.jishuxx.com/zhuanli/20240730/153920.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。