技术新讯 > 控制调节装置的制造及其应用技术 > 一种复杂系统的协同输出优化方法  >  正文

一种复杂系统的协同输出优化方法

  • 国知局
  • 2024-07-31 23:54:00

本发明涉及自动控制,尤其是指一种复杂系统的协同输出优化方法。

背景技术:

1、随着社会的发展和科技的进步,越来越多的复杂系统的输出调节问题在编队控制,且复杂系统在集群控制、目标跟踪以及航天器姿态控制等领域的广泛应用,从本质上来讲,解决复杂系统输出调节的问题,其目的是设计一个分布式控制控制器,使得各个子智能体的输出能够渐近地跟踪参考信号,同时抑制外部系统产生的干扰信号。

2、但是,在实际应用中,复杂系统不仅存在系统模型无法建立的情况,而且由于各智能体节点动力学模型不同,各个子系统的状态、控制输入以及通信往往都会具有一定的延时,因此,对于时滞复杂系统的协同输出调节问题在近些年来掀起了一番研究热潮,传统的对于时滞复杂系统的协同输出调节无法自适应系统的状态和控制输入同时具有多重时滞,进而导致复杂系统的协同输出调节的准确率低且效率差。

技术实现思路

1、有鉴于此,本技术的目的在于提供一种复杂系统的协同输出优化方法,本技术提升了复杂系统协同输出调节最优分布式控制器的准确率和效率。

2、为解决上述技术问题,本技术提供了一种复杂系统的协同输出优化方法,所述复杂系统的协同输出优化方法包括:

3、获取待检测的时滞复杂系统的目标任务需求,其中,所述目标任务需求中包括各个子智能体的控制输入信息;

4、基于所述时滞复杂系统中各个子智能体的状态延时信息、各个所述控制输入信息以及所述时滞复杂系统对应的初始系统模型,确定所述时滞复杂系统对应的目标系统模型;

5、基于所述目标系统模型和所述目标任务需求,判断所述目标系统模型的类型;

6、若所述目标系统模型的类型为参数已知类型,则基于各个所述子智能体对应的预设观测器、各个所述子智能体之间的跟踪误差以及预设最优控制算法,确定所述时滞复杂系统对应的第一最优分布式控制器;

7、若所述目标系统模型的类型为参数未知类型,则基于所述时滞复杂系统中各个子智能体的状态延时信息、各个所述控制输入信息、预设强化学习模型以及预设数据驱动算法,确定所述时滞复杂系统对应的第二最优分布式控制器。

8、在本发明的一个实施例中,所述基于所述时滞复杂系统中各个子智能体的状态延时信息、各个所述控制输入信息以及所述时滞复杂系统对应的初始系统模型,确定所述时滞复杂系统对应的目标系统模型,包括:

9、根据时滞复杂系统中各个子智能体的状态延时信息中的最大状态延时数据、各个控制输入信息中的最大控制输入延时数据,对所述时滞复杂系统对应的初始系统模型进行状态转换,确定所述时滞复杂系统对应的目标系统模型。

10、在本发明的一个实施例中,所述基于所述目标系统模型和所述目标任务需求,判断所述目标系统模型的类型,包括:

11、若目标任务需求中包括所述目标系统模型的参数,则确定所述目标系统模型的类型为参数已知类型;

12、若目标任务需求中不包括所述目标系统模型的参数,则确定所述目标系统模型的类型为参数未知类型。

13、在本发明的一个实施例中,所述预设最优控制算法包括预设线性最优控制算法,所述基于各个所述子智能体对应的预设观测器、各个所述子智能体之间的跟踪误差以及预设最优控制算法,确定所述时滞复杂系统对应的第一最优分布式控制器,包括:

14、根据时滞复杂系统对应的第一初始分布式控制器、各个子智能体之间的跟踪误差,确定所述时滞复杂系统对应的第一候选分布式控制器;

15、根据所述第一候选分布式控制器、各个所述子智能体对应的预设观测器以及预设线性最优控制算法,确定所述时滞复杂系统对应的第一最优分布式控制器。

16、在本发明的一个实施例中,所述基于所述时滞复杂系统中各个子智能体的状态延时信息、各个所述控制输入信息、预设强化学习模型以及预设数据驱动算法,确定所述时滞复杂系统对应的第二最优分布式控制器,包括:

17、根据时滞复杂系统中各个子智能体的状态延时信息、各个控制输入信息以及预设强化学习模型,确定时滞复杂系统对应的第二候选分布式控制器;

18、根据预设智能体探测噪声、各个所述子智能体的状态延时信息、各个所述控制输入信息、所述第二候选分布式控制器以及预设数据驱动算法,确定所述时滞复杂系统对应的第二最优分布式控制器。

19、在本发明的一个实施例中,所述根据时滞复杂系统中各个子智能体的状态延时信息、各个控制输入信息以及预设强化学习模型,确定时滞复杂系统对应的第二候选分布式控制器,包括:

20、根据时滞复杂系统中各个子智能体的状态延时信息、各个控制输入信息以及预设强化学习模型中的数据迭代原理,确定所述时滞复杂系统对应的第二反馈增益矩阵;

21、根据所述第二反馈增益矩阵,对强化学习过程中的过程数据进行增益计算,确定所述时滞复杂系统对应的第二前馈增益矩阵;

22、根据所述第二前馈增益矩阵和所述第二反馈增益矩阵,确定所述时滞复杂系统对应的第二候选分布式控制器。

23、本技术实施例还提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的复杂系统的协同输出优化方法的步骤。

24、本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的复杂系统的协同输出优化方法的步骤。

25、本技术的上述技术方案相比现有技术具有以下优点:

26、本技术提供实施例基于时滞复杂系统中各个子智能体的状态延时信息、各个控制输入信息以及时滞复杂系统对应的初始系统模型,确定时滞复杂系统对应的目标系统模型,并基于目标系统模型和目标任务需求,判断目标系统模型的类型,并在目标系统模型的类型为参数已知类型的情况下,基于各个子智能体对应的预设观测器、各个子智能体之间的跟踪误差以及预设最优控制算法,确定时滞复杂系统对应的第一最优分布式控制器,以及在目标系统模型的类型为参数未知类型的情况下,基于时滞复杂系统中各个子智能体的状态延时信息、各个控制输入信息、预设强化学习模型以及预设数据驱动算法,确定时滞复杂系统对应的第二最优分布式控制器,提升了复杂系统协同输出调节最优分布式控制器的准确率和效率。

27、为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

28、附图说明

29、为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

30、图1示出了本技术实施例所提供的一种复杂系统的协同输出优化方法的流程框图;

31、图2示出了本技术实施例所提供的一种复杂系统的协同输出优化方法中最优分布式控制器在应用过程中的曲线示意图;

32、图3示出了本技术实施例所提供的一种复杂系统的协同输出优化装置的结构框图;

33、图4示出了本技术实施例所提供的一种电子设备的结构示意图。

本文地址:https://www.jishuxx.com/zhuanli/20240730/199047.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。