技术新讯 > 控制调节装置的制造及其应用技术 > 一种障碍环境下无人艇集群微分追逃博弈方法及装置  >  正文

一种障碍环境下无人艇集群微分追逃博弈方法及装置

  • 国知局
  • 2024-07-31 23:42:38

本发明涉及无人艇追逃博弈领域,特别是一种障碍环境下无人艇集群微分追逃博弈方法及装置。

背景技术:

1、无人艇作为一种具有远程控制或自主导航功能的智能多用途无人载体平台,具有低成本、体积小、速度快、机动灵活、可拓展性高等优点,能够代替有人船舶执行多种高风险、高强度的海上作业任务,被广泛应用于军事和民用领域。无人艇集群作业具有高效率、广覆盖、群智能等显著优点,是未来海上岛礁保护、海域维权、应急救援、海上执法等海洋任务的必然趋势,将为维护国家海洋权益、保障海上空间安全提供强大支持。追逃博弈是无人艇集群运动的一个典型场景,其主要任务是实现无人艇集群对逃逸无人艇的追击与规避。研究人员在多智能体领域针对多智能体追逃博弈问题开展了广泛的研究工作,并提出了多种追逃博弈方法。其中,微分追逃博弈方法因其在建立不同博弈者策略交互模型及能够描述连续动态博弈并求解多方最优控制策略的显著优势而备受关注。然而,关于无人艇集群微分追逃博弈的研究仍相对有限。现有微分追逃博弈研究仍存在如下不足:

2、第一,现有多智能体微分追逃博弈策略大多基于单积分智能体模型设计,无法直接应用于高度非线性、强耦合、欠驱动的实际无人艇系统的微分追逃博弈策略设计中。

3、第二,现有无人艇集群追逃博弈方法通常基于双方完全相互感知的假设,即追逃双方能够获得对方所有成员的状态信息,无法解决双方获取信息能力不一致情形下的追逃博弈问题。

4、第三,现有无人艇集群追逃博弈方法仅关注如何实现对对方无人艇集群的追击与逃避,而没有关注群体内部如何进一步通过协作方式,提高对对方无人艇集群的追逃成功率。

技术实现思路

1、为解决现有技术中的不足,本发明提出了一种障碍环境下无人艇集群微分追逃博弈方法,包括以下步骤:

2、基于n个追击无人艇中第i艘追击无人艇实际位置信息、第i艘追击无人艇可感知到的逃逸无人艇的位置信息,以及n艘追击无人艇中其余追击无人艇的位置信息,基于追击方单积分模型,设计追击无人艇集群运动学控制器,通过博弈策略得到的第i艘追击无人艇速度;采用上述方式设计逃逸无人艇集群运动学控制器,得到的第j艘逃逸无人艇速度;

3、基于第i艘追击无人艇位置信息、第i艘追击无人艇的实际航向角、其余追击无人艇位置信息、第i艘追击无人艇感知的障碍物位置信息、追击无人艇中第i艘追击无人艇速度及其余追击无人艇的优化速度,设计追击方优化器,得到第i艘追击无人艇避障后的速度;采用上述方式设计逃逸方优化器,得到第j艘逃逸无人艇避障后的速度;

4、基于第i艘追击无人艇的实际航向角和避障后的速度,设计追击方控制信号转换器,得到第i艘追击无人艇的欠驱动运动学模型控制输入信号;采用上述方式,设计逃逸方控制信号转换器,得到第j艘逃逸无人艇的欠驱动运动学模型控制输入信号;

5、基于第i艘追击无人艇的欠驱动运动学模型控制输入信号及第j艘逃逸无人艇的欠驱动运动学模型控制输入信号,实现n艘艇追击无人艇和m艘逃逸无人艇艇在障碍环境下追逃博弈过程的控制。

6、所述追击方单积分模型表示为:

7、

8、其中,pip=[xip,yip]t表示追击无人艇位置,υip=[uipx,uipy]t表示地球坐标系下追击无人艇速度,uipx、uipy分别表示了υip在x轴和y轴上的分量;

9、进一步地:所述基于n个追击无人艇中第i艘追击无人艇实际位置信息、第i艘追击无人艇可感知到的逃逸无人艇中位置信息,以及n艘追击无人艇中其余追击无人艇的位置信息,基于追击方单积分模型,设计追击无人艇集群运动学控制器,通过博弈策略得到的第i艘追击无人艇速度的过程如下:

10、第i艘追击无人艇运动学控制器的输入信号为第i艘追击无人艇实际位置信息i=1,2…n、第i艘追击无人艇可感知到的逃逸无人艇位置信息j=1,2…m,追击方其余追击无人艇的位置信息k=1,2…n,且k≠i;

11、设计追击无人艇集群运动学控制器如下:

12、

13、所述追击无人艇集群运动学控制器输出信号为通过博弈策略得到的第i艘追击无人艇速度其中分别表示该速度在x轴和y轴上的分量;

14、其中,是一个单位矩阵;表示控制增益参数,在追击无人艇集群中建立通讯,aik表示第i艘追击无人艇与其余追击无人艇的通讯关系,存在通讯则为1,否则为0;采用二分图来描述追击方与逃逸方之间的互相感知情况,cij表示第i艘追击无人艇对每一艘逃逸无人艇的位置信息感知情况,若能感知到位置信息则为1,否则为0,dip表示与第i艘追击无人艇存在通讯的追击无人艇个数,dipe表示能被第i艘追击无人艇感知到的逃逸无人艇个数。

15、进一步地:基于第i艘追击无人艇位置信息、第i艘追击无人艇的实际航向角、其余追击无人艇位置信息、第i艘追击无人艇感知的障碍物位置信息、追击无人艇中第i艘追击无人艇速度及其余追击无人艇的优化速度,设计追击方优化器,得到第i艘追击无人艇避障后的速度的过程如下:

16、基于第i艘追击无人艇位置信息pip=[xip,yip]t、第i艘无人艇的实际航向角ψip,追击方其余追击无人艇位置信息pkp=[xkp,ykp]t、第i艘追击无人艇感知的障碍物位置信息追击无人艇中第i艘追击无人艇速度及其余追击无人艇的优化速度υkp=[ukpx,ukpy]t,其中ukpx、ukpy分别表示υkp在x轴和y轴上的分量;

17、设计追击方优化器表达式如下:

18、

19、st:

20、

21、所述追击方优化器输出信息为第i艘追击无人艇优化后的速度υip=[uipx,uipy]t,其中uipx、uipy分别表示υip在x轴和y轴上的分量;

22、其中,lip>0为常量参数;d1表示第i艘无人艇与其余追击无人艇之间应保持的安全距离,d1满足大于或等于两艇之间的半径之和,d2表示第i艘无人艇与障碍物间应保持的安全距离,d2应满足大于或等于无人艇与障碍物半径之和,表示障碍物的运动速度,若障碍物为静态障碍物,为0,否则不为0;为第i艘无人艇的侧滑角速度,uimax、uimin是无人艇实际合速度的最大值和最小值,rimax、rimin是无人艇艏摇角速度的最大值和最小值。

23、进一步地:所述基于第i艘追击无人艇的实际航向角和避障后的速度,设计追击方控制信号转换器,得到第i艘追击无人艇的欠驱动运动学模型控制输入信号的过程如下:

24、基于第i艘追击无人艇的实际航向角ψip及优化速度υip=[uipx,uipy]t;

25、设计追击方控制信号转换器如下:

26、

27、其中,辅助变量

28、所述追击方控制信号转换器输出信号为第i艘追击无人艇的欠驱动运动学模型控制输入信号[uip,rip]t,其中uip、rip分别是该无人艇的实际合速度和艏摇角速度。

29、进一步地,逃逸方单积分模型表示为:

30、

31、其中,pje=[xje,yje]t表示逃逸无人艇位置,υje=[ujex,ujey]t表示地球坐标系下逃逸无人艇速度,ujex、ujey分别表示了υje在x轴和y轴上的分量。

32、进一步地:所述采用上述方式设计逃逸无人艇集群运动学控制器,得到的第j艘逃逸无人艇速度;

33、基于第j艘逃逸无人艇位置信息j=1,2…m、可感知到的追击无人艇位置信息i=1,2…n、逃逸方其余逃逸无人艇的位置信息l=1,2…m,且l≠j;

34、设计逃逸无人艇集群运动学控制器如下:

35、

36、所述逃逸无人艇集群运动学控制器输出信号为通过博弈策略得到的第j艘逃逸无人艇速度其中分别表示在x轴和y轴上的分量;

37、其中,表示控制增益参数,bjl表示第j艘逃逸无人艇与其余逃逸无人艇的通讯关系,存在通讯则为1,否则为0。用二分图来描述追击方与逃逸方之间的感知情况,eji表示第j艘逃逸无人艇对每一艘追击无人艇的位置信息感知情况,若能感知到位置信息则为1,否则为0,dje表示与第j艘逃逸无人艇存在通讯的逃逸无人艇个数,djep表示能被第j艘逃逸无人艇感知到的追击无人艇个数。

38、进一步地:所述采用上述方式设计逃逸方优化器,得到第j艘逃逸无人艇避障后的速度的过程如下:

39、基于第j艘逃逸无人艇的位置信息pje=[xje,yje]t、第j艘逃逸无人艇的实际航向角ψje,其余逃逸无人艇的位置信息ple=[xle,yle]t、可感知到的障碍物的位置信息逃逸无人艇中第j艘逃逸无人艇速度及其余追击无人艇优化后的速度υle=[ulex,uley]t,其中ulex、uley分别表示υle在x轴和y轴上的分量;

40、设计逃逸方优化器如下:

41、

42、st:

43、

44、所述逃逸方优化器输出信号为第j艘逃逸无人艇优化后的速度υje=[ujex,ujey]t,其中uipx、uipy分别表示优化速度υje在x轴和y轴上的分量;

45、其中,lje>0为常量参数;d3表示第j艘逃逸无人艇与其余逃逸无人艇之间应保持的安全距离,d3满足大于或等于两艇之间的半径之和;d4表示第j艘逃逸无人艇与障碍物之间应保持的安全距离,d4应满足大于或等于无人艇与障碍物半径之和,表示障碍物的运动速度,若障碍物为静态障碍物,为0,否则不等于0,表示第j艘逃逸无人艇的侧滑角速度,ujmax、ujmin是无人艇实际合速度的最大值和最小值,rjmax、rjmin是无人艇艏摇角速度的最大值和最小值。

46、进一步地:所述采用上述方式,设计逃逸方控制信号转换器,得到第j艘逃逸无人艇的欠驱动运动学模型控制输入信号;

47、基于第j艘逃逸无人艇的实际航向角ψje及优化速度υje=[ujex,ujey]t;

48、设计逃逸方控制信号转换器如下:

49、

50、其中,辅助变量

51、所述逃逸方控制信号转换器输出信号为第j艘逃逸无人艇的欠驱动运动学模型控制输入信号[uje,rje]t,其中uje、rje分别是该无人艇的实际合速度和艏摇角速度。

52、一种障碍环境下无人艇集群微分追逃博弈装置,包括:

53、追击无人艇集群运动学控制器:用于基于n个追击无人艇中第i艘追击无人艇实际位置信息、第i艘追击无人艇可感知到的逃逸无人艇中位置信息,以及n艘追击无人艇中其余追击无人艇的位置信息,基于追击方单积分模型,设计追击无人艇集群运动学控制器,通过博弈策略得到的第i艘追击无人艇速度;

54、逃逸无人艇集群运动学控制器:采用追击无人艇集群运动学控制器设计方式设计逃逸无人艇集群运动学控制器,得到的第j艘逃逸无人艇速度;

55、追击方优化器:用于基于第i艘追击无人艇位置信息、第i艘追击无人艇的实际航向角、其余追击无人艇位置信息、第i艘追击无人艇感知的障碍物位置信息、追击无人艇中第i艘追击无人艇速度及其余追击无人艇的优化速度,设计追击方优化器,得到第i艘追击无人艇避障后的速度;

56、逃逸方优化器:用于采用追击方优化器设计方式,设计逃逸方优化器,得到第j艘逃逸无人艇避障后的速度;

57、追击方控制信号转换器:用于基于第i艘追击无人艇的实际航向角和避障后的速度,设计追击方控制信号转换器,得到第i艘追击无人艇的欠驱动运动学模型控制输入信号;

58、逃逸方控制信号转换器:采用追击方控制信号转换器设计方式,设计逃逸方控制信号转换器,得到第j艘逃逸无人艇的欠驱动运动学模型控制输入信号。

59、与现有技术相比,本发明具有以下有益效果:

60、第一,与现有多智能体微分追逃博弈方法相比,本方法通过设计控制信号转换器将单积分智能体模型映射到欠驱动无人艇模型,实现了微分追逃博弈策略在实际无人艇系统的应用。

61、第二,与现有无人艇集群追逃博弈方法相比,本方法可以应用于追逃双方完全相互感知或仅感知对方部分成员状态信息的两种情况,有效提高算法实用性。

62、第三,与现有无人艇集群追逃博弈方法相比,本方法利用通讯网络建立团队内部合作,使未检测到对方成员的无人艇能产生追击或逃避动作,有效提高无人艇集群追逃成功率。

本文地址:https://www.jishuxx.com/zhuanli/20240730/198207.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。