一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种一致性跟踪控制方法、装置、电子设备及存储介质与流程

2023-09-07 09:59:39 来源:中国专利 TAG:


1.本发明涉及多智能体系统一致性控制技术领域,尤其涉及一种一致性跟踪控制方法、装置、电子设备及存储介质。


背景技术:

2.作为一种多智能体系统群体行为,一致性跟踪又称领导-跟随一致性,意味着跟跟随者的状态跟踪上领导者的状态。
3.目前,对于多智能体系统的一致性跟踪方法多是在线性系统下进行的,也就是说,现有技术多是针对理想状态下的领导者和跟随对象的运动状态进行一致性跟踪控制。但是由于在实际应用中,多智能体系统中的领导者和跟随对象的运动状态通常是非线性的,因此,基于在线性控制系统下确定的一致性跟踪方法在实际应用中难以实现真正的一致性跟踪。
4.为了解决上述问题,需要提出非线性多智能体系统的一致性跟踪方法。


技术实现要素:

5.本发明提供了一种一致性跟踪控制方法、装置、电子设备及存储介质,以解决对于非线性多智能体系统中的各跟随对象来说,在无法获取多智能体系统中的全局状态信息的前提下,难以准确达到与目标对象一致性跟踪的问题。
6.第一方面,本发明实施例提供了一种一致性跟踪控制方法,包括:
7.确定多智能体系统中的目标对象,以及与所述目标对象相关联的至少一个跟随对象;其中,所述多智能体系统为非线性多智能体系统;
8.针对各跟随对象,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定所述当前跟随对象所对应的待确定状态;其中,所述相对状态信息中包括相对速度、相对加速度和相对位置中的至少一种;
9.当各所述跟随对象所对应的待确定相对状态均满足预设状态信息时,确定所述多智能体系统中的各跟随对象达到一致性跟踪。
10.第二方面,本发明实施例还提供了一种一致性跟踪控制装置,包括:
11.跟随对象确定模块,用于确定多智能体系统中的目标对象,以及与所述目标对象相关联的至少一个跟随对象;其中,所述多智能体系统为非线性多智能体系统;
12.待确定状态确定模块,用于针对各跟随对象,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定所述当前跟随对象所对应的待确定状态;其中,所述相对状态信息中包括相对速度、相对加速度和相对位置中的至少一种;
13.一致性跟踪确定模块,用于当各所述跟随对象所对应的待确定相对状态均满足预设状态信息时,确定所述多智能体系统中的各跟随对象达到一致性跟踪。
14.第三方面,本发明实施例还提供了一种电子设备,包括:
15.至少一个处理器;以及
16.与所述至少一个处理器通信连接的存储器;其中,
17.所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的一致性跟踪控制方法。
18.第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的一致性跟踪控制方法。
19.本发明实施例的技术方案,确定多智能体系统中的目标对象,以及与目标对象相关联的至少一个跟随对象;针对各跟随对象,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定当前跟随对象所对应的待确定状态;当各跟随对象所对应的待确定相对状态均满足预设状态信息时,确定多智能体系统中的各跟随对象达到一致性跟踪。解决了对于非线性多智能体系统中的各跟随对象来说,在无法获取多智能体系统中的全局状态信息的前提下,难以准确达到与目标对象一致性跟踪的问题,通过多智能体系统的目标对象通过向少量的跟随对象进行状态信息的传递,并根据各跟随对象之间的通信信息传递,在各跟随对象无法获取全局状态信息的前提下,基于少量的跟随对象控制多智能体系统中的所有跟随对象均达到与目标对象的一致性跟踪的效果。
20.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
21.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1是根据本发明实施例一提供的一种一致性跟踪控制方法的流程图;
23.图2是根据本发明实施例一提供的一种有向图的示意图;
24.图3是根据本发明实施例二提供的一种耦合增益随时间变化的状态示意图;
25.图4是根据本发明实施例二提供的一致性跟踪控制方法下跟踪误差随时间变化的状态示意图;
26.图5是根据本发明实施例三提供的一种一致性跟踪控制装置的结构示意图;
27.图6是实现本发明实施例的一致性跟踪控制方法的电子设备的结构示意图。
具体实施方式
28.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
29.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
30.在对本技术方案进行详细阐述之前,先对本技术方案的应用场景进行简单介绍,以便更加清楚地理解本技术方案。协同控制在一致性控制、编队控制、传感器网络、任务机器人、无人机、无人驾驶车辆以及水下航行器等领域的应用,受到广泛学者的关注。一致性控制是指在多智能体系统中的智能体通过与邻居智能体协商,最终达到各智能体的状态一致。现有的一致性控制可以大致分为两类,无领导者的一致性控制和有领导者的一致性控制,其中有领导者的一致性控制又称为一致性跟踪控制。本技术方案主要针对在智能体系统中存在领导者的一致性跟踪控制方法进行改进。
31.可以理解的是,所谓的一致性跟踪控制方法是指在一个多智能体系统中包括一个领导者智能体和n个跟随者智能体,并根据领导者智能体的状态对各跟随者智能体的状态进行调节控制,以使各跟随者智能体的状态与领导者智能体的状态保持一致。需要说明的是,本技术方案中提出的一致性跟踪控制方法主要应用于非线性多智能体系统中,如,以多智能体系统为无人机群攻击为例,多智能体系统中的各无人机飞行过程中会受到多方面因素的影响,如,空气阻力、空气气流以及气象因素等,导致无人机在实际飞行过程中呈现非线性状态,而本技术方案主要用于在多智能体系统为非线性多智能体系统时,实现各跟随者智能体跟踪上领导者智能体的状态。
32.实施例一
33.图1为本发明实施例一提供了一种一致性跟踪控制方法的流程图,本实施例可适用于对于非线性多智能体系统来说,在各跟随对象无法获取多智能体系统的全局状态信息的前提下,通过目标对象控制少量跟随对象,以基于少量的跟随对象多智能体系统中所有的跟随对象与目标对象实现一致性跟踪的效果情况,该方法可以由一致性跟踪控制装置来执行,该一致性跟踪控制装置可以采用硬件和/或软件的形式实现,该一致性跟踪控制装置可配置于可执行一致性跟踪控制方法的计算设备中。
34.如图1所示,该方法包括:
35.s110、确定多智能体系统中的目标对象,以及与目标对象相关联的至少一个跟随对象。
36.其中,多智能体系统是由一系列相互作用的智能体构成,内部的各个智能体之间通过相互通信、合作、竞争等方式,完成单个智能体不能完成的,大量而又复杂的工作。目前,多智能体系统被广泛应用于多个领域,如,飞行器的编队、传感器网络、数据融合、多机械臂协同装备、并行计算、多机器人合作控制、交通车辆控制、网络的资源分配等。
37.需要说明的是,多智能体系统包括无领导者智能体的系统和有领导者智能体的系统,在本技术方案中所涉及的多智能体系统为包含领导者智能体的智能体系统,且多智能体系统为非线性多智能体系统。所谓非线性多智能体系统是指在实际使用过程中,系统中的各智能体由于空气阻力或天气因素等外界因素,使得智能体在运动过程中呈现非线性运动的系统。
38.在实际应用中,可以设置多智能体系统中的领导者智能体,即,目标对象,同时,将除了领导者智能体以外的其他智能体设置为跟随者智能体,即,本技术方案中的跟随对象,
进一步的,通过系统调控使得各跟随者智能体与领导者智能体实现一致。
39.可选的,确定多智能体系统中的目标对象,以及与目标对象相关联的至少一个跟随对象,包括:获取与多智能体系统相对应的有向图;其中,有向图为通信拓扑图;根据有向图,确定多智能体系统中的目标对象以及与目标对象相关联的至少一个跟随对象。
40.其中,有向图为通信拓扑图,可以基于多智能体系统中的各智能体构建得到。以目标对象作为有向图的中心顶点,在有向图中包括至少一个关联顶点,每个关联顶点对应一个智能体(即,跟随对象),且在有向图中各顶点之间存在带有方向的线段,其中,箭头指向的关联顶点所对应的智能体(即,跟随对象)可以从箭头起始位置的顶点所对应的智能体中获取通信信息。
41.需要说明的是,在本技术方案中,将跟随对象划分为两类,具体为直接从目标对象获取通信信息的第一跟随对象,和无法直接从目标对象获取通信信息的第二跟随对象。
42.示例性地,如图2所示,编号“0”表示目标对象,编号“1”表示第一跟随对象,编号“2”“3”“4”均为第二跟随对象。不难看出,在所谓的第一跟随对象为可以直接从目标对象中获取通信信息的跟随对象,第二跟随对象为无法直接从目标对象中获取通信信息的跟随对象。
43.以编号“1”为例,在编号“0”和编号“1”之间存在有向线段,且方向从编号“0”指向编号“1”,其中,编号“0”对应目标对象,编号“1”对应第一跟随对象,其表明,编号“1”所对应的第一跟随对象可以直接从编号“0”所对应的目标对象中获取通信信息,如,目标对象的速度、加速度和位置信息等。
44.以编号“4”为例,在编号“1”和编号“4”存在有向线段,且方向从编号“1”指向编号“4”;同时编号“3”和编号“4”之间也存在有向线段,且方向从编号“3”指向编号“4”。其中,编号“1”对应第一跟随对象,编号“3”和编号“4”均表示第二跟随对象。其表明,编号“4”所对应的第二跟随对象既可以从编号“1”所对应的第一跟随对象中获取与编号“1”对应的通信信息,也可以从编号“3”所对应的第二跟随对象中获取与编号“3”对象的通信信息。
45.需要说明的是,以编号“3”为例,编号“2”和编号“3”之间存在有向线段,表明,编号“3”所对应的第二跟随对象可以从编号“2”所对应的第二跟随对象中获取相应的通信信息。但是在编号“3”和编号“1”之间,以及编号“3”和编号“0”之间均不存在有向线段,也就是说,编号“3”所对应的第二跟随对象无法从与编号“1”对应的第一跟随对象或与编号“0”对应的目标对象中获取相应的通信信息。
46.也就是说,通过与多智能体系统相对应的有向图中的线段指向信息,可以确定多智能体系统中各智能体之间的通信流向信息。很明显的是,通过有向图可以看出,在多智能体系统中,并不是所有的跟随对象都可以从目标对象处获取与目标对象相对应的通信信息,而只能从与自身直接关联的上级智能体中获取相应的通信信息。
47.为了更加方便理解,在本技术方案中,将有向图中箭头起始端对应的智能体作为箭头指向端的智能体的邻居智能体,若想在各跟随者无法直接获取与目标对象相对应的通信信息的前提下,使得各跟随者与目标对象的状态保持一致,则需要保证自身的状态信息与其相关联的邻居智能体的状态信息之间的跟随误差尽量达到最小。当所有智能体和邻居智能体之间的跟随误差均最小时,如,跟随误差均为0,则可以确定多智能体系统中的各智能体达到一致性跟踪。
48.s120、针对各跟随对象,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定当前跟随对象所对应的待确定状态。
49.其中,以当前跟随对象为例,可以将多智能体系统中当前跟随对象可以直接获取通信信息的智能体,作为与当前跟随对象相关联的关联对象。相对状态信息中包括相对速度、相对加速度和相对位置中的至少一种。需要注意的是,第一跟随对象的关联对象可以为目标对象,也可以为除自身以外的其他第一跟随对象。对于第二跟随对象来说,其关联对象可以为第一跟随对象,也可以为第二跟随对象。
50.在本技术方案提供的多智能体系统中,以当前跟随对象为例,若当前跟随对象为第一跟随对象,第一跟随对象可以直接从目标对象中获取目标对象的状态信息,以调节自身与目标对象之间的相对状态信息,确定与当前跟随对象相对应的待确定状态,并根据待确定状态确定当前跟随对象是否达到与目标对象保持一致性跟踪的效果。但是,若当前跟随对象为第二跟随对象,由于第二跟随对象无法直接获取目标对象的状态信息,若想使得第二跟随对象与目标对象达到一致性跟踪效果,则可以根据第二跟随对象与相关联的至少一个关联对象之间的相对状态信息,以间接确定与当前跟随对象相对应的待确定状态,并根据待确定状态确定当前跟随对象是否达到与目标对象保持一致性跟踪的效果。
51.可选的,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定当前跟随对象所对应的待确定状态,包括:根据有向图中的通信流向信息,确定与当前跟随对象相关联的至少一个关联对象;根据至少一个关联对象所对应的关联对象数量,确定与当前跟随对象相对应的状态确定方式;基于状态确定方式,确定相应的关联对象与当前跟随对象之间的相对状态信息,以基于至少一个相对状态信息,确定当前跟随对象所对应的待确定状态。
52.其中,通信流向信息可以理解为通信数据的流向信息,如,第一跟随对象从目标对象中获取通信信息,则通信流向信息为从目标对象流向第一跟随对象。关联对象数量为一个或多个。所谓状态确定方式是指根据当前跟随对象所对应的关联对象数量,所确定的与当前跟随对象相对应的状态处理方式。
53.示例性地,当关联对象数量为一个时,可以直接根据当前跟随对象与关联对象之间的相对状态信息,确定当前跟随对象的待确定状态。当关联对象数量为多个时,则需要确定当前跟随对象与各关联对象之间的相对状态信息,以综合考虑当前跟随对象与各关联对象之间的相对状态信息,并根据各相对状态信息共同确定与当前跟随对象相对应的待确定状态。
54.具体的,根据有向图中的箭头指向信息可以确定多智能体系统中各智能体之间的通信路径,并根据通信路径中的通信流向信息确定相应智能体所关联的邻居智能体。也就是说,根据有向图中的通信流向信息,可以确定与各跟随对象相对应的至少一个关联对象。进一步的,判断与各跟随对象相对应的关联对象数量,以调取与相应的跟随对象所对应的状态确定方式。
55.可选的,基于状态确定方式,确定相应的关联对象与当前跟随对象之间的相对状态信息,包括:确定关联对象数量是否为一个;若是,则确定状态确定方式为第一状态确定方式,并基于第一状态确定方式确定关联对象与当前跟随对象之间的待确定误差,以基于待确定误差确定当前跟随对象与相应的关联对象之间的相对状态信息;若否,则确定状态
确定方式为第二状态确定方式,并基于第二状态确定方式,分别确定各关联对象与当前跟随对象之间的待叠加误差,并基于各待叠加误差之和,得到与当前跟随对象相对应的目标跟随误差,以基于目标跟随误差,确定当前跟随对象所对应的相对状态信息。
56.具体的,在有向图中的有向线段可以表示通信路径,若在两个顶点之间存在有向线段,则表明有向线段连接的两顶点所对应的目标对象或跟随对应之间存在通信路径。在多智能体系统中,对于任一跟随对象1,通过有向图中的指向跟随对象1的有向线段,可以确定与跟随对象1相对应的至少一条通信路径,并根据至少一条通信路径的路径数量,确定与该跟随对象1所对应的关联对象数量。若关联对象数量为一个,则基于第一状态确定方式确定与当前跟随对象相对应的待确定状态。若关联对象数量为多个,则基于第二状态确定方式确定与当前跟随对象相对应的待确定状态。
57.对于第一状态确定方式来说,确定与当前跟随对象相对应的关联对象后,分别获取当前跟随对象和关联对象所对应的状态信息,如,位置信息、速度信息和加速度信息。进一步的,调取第一动力学模型对当前跟随对象和关联对象所对应的状态信息进行计算,以得到当前跟随对象与关联对象之间的待确定误差,以基于待确定误差确定当前跟随对象所对应的相对状态信息。其中,第一动力学模型可以理解为当关联对象数量为一个时,根据状态信息计算当前跟随对象与关联对象之间的误差信息的模型。
58.对于第二状态确定方式来说,确定与当前跟随对象相对应的多个关联对象后,若当前跟随对象达到一致性跟踪,则需要获取当前跟随对象的状态信息,以及多个关联对象的状态信息。进一步的,基于第二动力学模型对各状态信息进行处理,分别得到当前跟随对象与各关联对象之间的待叠加误差,进而,通过将各待叠加误差进行叠加处理,即可得到与当前跟随对象相对应的目标跟随误差,以基于目标跟随误差确定当前跟随对象所对应的相对状态信息。其中,第二动力学模型可以理解为当关联对象数量为多个时,用于根据状态信息计算当前跟随对象与各关联对象之间的误差信息的模型。
59.s130、当各跟随对象所对应的待确定相对状态均满足预设状态信息时,确定多智能体系统中的各跟随对象达到一致性跟踪。
60.在实际应用中,根据各相对状态信息所对应的误差信息,构建当前跟随对象所对应的误差向量;当误差向量为零时,确定多智能体系统中的各跟随对象达到一致性跟踪。
61.其中,误差信息为待确定误差或目标跟随误差。
62.具体的,若与跟随对象相关联的关联对象为一个,且跟随对象所对应的待确定误差为零,则表明跟随对象与相应的关联对象之间的相对状态达到一致。若跟随对象相关联的关联对象为多个,且目标跟随误差为零,则表明跟随对象与相关联的多个关联对象之间的相对状态达到一致。基于此,可以根据各相对状态信息中的误差信息构建误差向量,当且仅当误差向量为零时,表明多智能体系统中的各跟随对象与相关联的关联对象之间的相对状态均达到一致,则可以确定多智能体系统中的各跟随对象达到一致性跟踪效果。
63.在此基础上。为了验证本技术方案中提供的一致性跟踪控制方法是否可以控制各跟随对象与目标跟随对象达到一致性跟踪,可以通过构建李雅普诺夫函数的方式对多智能体系统中的各跟随对象进行验证。具体的,基于各跟随对象所对应的相对状态信息,构建一致性跟踪控制输入和相对状态列向量;基于相对状态列向量,以及一致性跟踪控制器中输入的时变耦合增益函数和光滑单调递增函数,构建李雅普诺夫函数;其中,一致性跟踪控制
器输入设置于多智能体系统中的各跟随对象中;当李雅普诺夫函数满足预设函数检测条件,且相对状态列向量为零时,确定多智能体系统中的各跟随对象达到一致性跟踪;其中,预设函数检测条件包括李雅普诺夫函数为连续可微径向无界函数,且李雅普诺夫函数的导数小于等于零。
64.本发明实施例的技术方案,确定多智能体系统中的目标对象,以及与目标对象相关联的至少一个跟随对象;针对各跟随对象,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定当前跟随对象所对应的待确定状态;当各跟随对象所对应的待确定相对状态均满足预设状态信息时,确定多智能体系统中的各跟随对象达到一致性跟踪。解决了对于非线性多智能体系统中的各跟随对象来说,在无法获取多智能体系统中的全局状态信息的前提下,难以准确达到与目标对象一致性跟踪的问题,通过多智能体系统的目标对象通过向少量的跟随对象进行状态信息的传递,并根据各跟随对象之间的通信信息传递,在各跟随对象无法获取全局状态信息的前提下,基于少量的跟随对象控制多智能体系统中的所有跟随对象均达到与目标对象的一致性跟踪的效果。
65.实施例二
66.在一个具体的例子中,在控制多智能体系统中的各智能体进行一致性跟踪时,如无特殊说明,表示所有实矩阵组成的集合。表示n维单位矩阵。表示所有元素均为1的n维列向量。表示矩阵a和b的克罗内克积(kronecker product)。对向量,和分别表示x的2范数(即euclidean范数)和无穷范数。对,sgn(x)表示符号函数。表示由元素构成的对角矩阵。对于给定的矩阵a,a
t
表示a的转置。对于相同维数的对称实矩阵x和y,矩阵不等式x》y(x≥y)表示矩阵x-y是对称正定的(半正定的)。对,表示z的实部。
67.根据多智能体系统构建领导者(即,目标对象)和跟随者(即,跟随对象)的动力学模型具体为:
[0068][0069]
其中,为第i个智能体状态,为第i个智能体的控制输入。下标代表领导者,下标1,2,
……
,n代表n个跟随者,即x0代表领导者的状态代表跟随者的状态、u0代表领导者的控制输入代表跟随者的控制输入。其中,非线性函数是连续可微函数。
[0070]
在本技术方案中,控制多智能体系统中的智能体进行一致性跟踪时,需要预先构建相应的有向图,其中,有向图为通信拓扑图。
[0071]
在本技术方案中,用有向图表示多智能体系统中1个领导者和n个跟随者之间的通讯。
[0072]
n个跟随者之间的通讯用有向图表示。
[0073]
有向图满足:,即的子图。
[0074]
有向图的邻接矩阵满足当且
仅当智能体i可以接收到智能体j的信息,否则。
[0075]
有向图的拉普拉斯矩阵:,其中,
[0076][0077]
定义领导者的邻接矩阵,如果跟随者智能体i,i=1,2,
……
,n能够接收到领导者的状态信息x0,则a
i0
》0,否则a
i0
=0。
[0078]
需要说明的是,在本技术方案中提供的多智能体系统中,不是所有的跟随者都能够接收到领导者的状态信息,而是仅有一部分跟随者能够接收到领导者的状态信息。换句话说,在本技术方案中,可以直接从目标对象中获取目标对象的状态信息的跟随对象为第一跟随对象,无法直接获取目标对象的状态信息的跟随对象为第二跟随对象。在实际应用中,以其中一个跟随对象为当前跟随对象为例,根据当前跟随对象所对应的关联对象的数量确定相应的状态确定方式,以根据相应的状态确定方式确定与当前跟随对象相对应的相对状态信息。进一步的,若当前跟随对象与其相对应的至少一个关联对象的状态达到一致,则可以确定当前跟随对象与多智能体系统中的目标对象的状态达到一致性跟踪。
[0079]
基于此,可以定义矩阵,则有:
[0080]
引理1:如果有向图包含以领导者作为根节点的有向生成树,那么矩阵可逆。定义矩阵,则矩阵g,均为正定矩阵。
[0081]
引理2:对任意实值连续可微函数,存在光滑标量函数a(x)≥1,b(y)≥1,使得
[0082][0083]
如果满足,则存在光滑标量函数,使得
[0084][0085]
具体而言,定义每一个跟随者的跟踪误差为;定义多智能体系统的跟踪误差为。(在本技术方案中,跟随者所对应的关联对象的数量不同时,确定跟随对象与多智能体系统的一致性跟踪状态的方式也不同。具体而言,在确定与各跟随者相对应的一致性跟踪状态时,若与跟随者相对应的关联对象的数量为一个,则跟踪误差称为待确定误差,若与跟随者相对应的关联对象的数量为多个,则跟踪误差称为目标跟随误差)。
[0086]
其中,对多智能体系统中每个跟随者i,i=1,2,
……
,n,设计只使用局部相对信息的分布式控制器ui,使得对任意初始状态,
[0087][0088]
本技术方案中的多智能体系统满足以下假设:
[0089]
假设1 :领导者的控制输入连续且有界,即:,其中d是已知正常数;且
领导者的状态有界,即:,其中是未知正常数。
[0090]
假设2 :有向图包含一棵以领导者0作为根节点的有向生成树。
[0091]
在此基础上,针对多智能体系统,定义跟随者与其邻居(即,关联对象)之间的相对状态信息,并基于相对状态设计相应的一致性跟踪控制器。
[0092]
具体的,在多智能体系统(1)中,第i个跟随者与其邻居之间的相对状态zi(即,待确定状态)定义为:
[0093][0094]
根据公式(2),是n维列向量。定义所有zi构成的列向量为多智能体系统的相对状态,则有,其中,列向量e为前文已经定义的多智能体系统的跟踪误差。
[0095]
由引理1,在假设1下,矩阵可逆。
[0096]
因此,想要设计控制器实现一致性跟踪,即:使得多智能体系统的跟踪误差渐近收敛到零,等价于设计分布式控制器(即,一致性跟踪控制器) ,使得多智能体系统的相对状态z渐近收敛到零。
[0097]
根据公式(1)和(2),第个跟随者相对状态zi的动力学模型为:
[0098][0099]
定义
[0100][0101]
其中,是使得多项式为hurwitz稳定的常数。则有:
[0102][0103]
其中,
[0104][0105]
根据假设1和平均值定理,存在光滑函数,使得
[0106][0107]
由于,根据式(3)得到
[0108][0109]
根据引理2,存在光滑函数,使得
[0110][0111]
其中,常数依赖于矩阵h、未知正常数和。
[0112]
定义矩阵,选择p》0满足和线性矩阵不等式:
[0113]
,其中表示矩阵的特征值。
[0114]
对于正定矩阵p,存在实非奇异矩阵s,使得。定义,结合和式(7),可以得到:
[0115][0116]
其中,。
[0117]
定义。
[0118]
则:
[0119][0120]
取列向量,
[0121]
定义
[0122]

[0123]
则存在光滑函数,使得
[0124]
其中常数。
[0125]
基于,设计如下分布式自适应非线性一致性跟踪控制器:
[0126][0127]
其中,控制器参数为正常数,d是领导者控制输入的上界,由假设1给出。是时变耦合增益(即,耦合增益函数),。
[0128]
是光滑单调递增函数。是光滑函数,满足公式(9)。
[0129]
定理1:在假设1和假设2成立的条件下,分布式自适应控制器(10)可实现多智能体系统(1)的一致性跟踪控制,此外,时变耦合增益分别收敛到某些常数。
[0130]
步骤4、通过选择合适的李雅普诺夫函数,运用lasalle定理(即,拉塞尔定理)证明设计的分布式自适应控制器(10)可实现多智能体系统(1)的一致性跟踪控制。
[0131]
证明:考虑如下lyapunov函数(李雅普诺夫函数):
[0132][0133]
其中为列向量中元素。
[0134]
显然,v1是正定的,lyapunov函数v1沿着系统(4)
[0135][0136]
定义列向量
[0137][0138]
。根据引理1和设计的控制器(10),结合式(9),通过推导计算可以得到:
[0139][0140]
考虑如下lyapunov函数(即,李雅普诺夫函数):
[0141][0142]
其中,h是常数,。lyapunov函数沿着系统(4)导数为:
[0143][0144]
令,根据不等式(12)和(13),有
[0145][0146]
其中,常数。根据控制器(10),是光滑单调递增函数,,则
[0147][0148]
考虑如下lyapunov函数
[0149][0150]
选择常数。根据控制器(10),控制器参数k≥8,时变耦合增益,光滑单调递增函数。根据不等式(14),lyapunov函数v沿着系统(4)导数为:
[0151][0152]
当是连续可微径向无界函数,,根据拉赛尔定理,当渐近收敛到零,有界。根据公式(4)和,有。
[0153]
由于分别收敛到某些常数。
[0154]
以一个具体的例子来说:
[0155]
步骤1、根据多智能体系统构建由一个领导者和4个跟随者组成的多智能体系统,如图2所示。每个智能体动力学模型为:
[0156][0157]
其中,下标代表领导者。非线性函数不满足全局lipschitz条件(即,利普希茨连续条件)。假设领导者的控制输入,智能体的初始状态,其中,在区间内随机选取,则有。
[0158]
步骤2、定义每一个跟随者的跟踪误差:
[0159][0160]
定义多智能体系统的跟踪误差:
[0161][0162]
步骤3、针对多智能体系统,定义跟随者与它邻居之间的相对状态:
[0163]
定义第个跟随者与它邻居之间的相对状态定义为:
[0164][0165]
根据步骤3和步骤4,选取,则。
定义,,根据式(6)
[0166][0167]
其中,定义:
[0168][0169]
考虑非线性函数:
[0170][0171]
其中,。
[0172]
根据式(8)和式(9):
[0173][0174]
控制器参数选取,选择,则分布式自适应非线性一致性跟踪控制器为:
[0175][0176]
其中,。
[0177]
图3为耦合增益随时间变化的曲线,从图中可以看到耦合增益分别收敛到确定的常数。图4为跟随者的跟踪误差随时间变化的曲线,从图中可以看到跟踪误差渐近收敛到零。这证明了本技术方案中提出的完全分布式的一致性跟踪控制方法的有效性。
[0178]
本发明实施例的技术方案,确定多智能体系统中的目标对象,以及与目标对象相关联的至少一个跟随对象;针对各跟随对象,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定当前跟随对象所对应的待确定状态;当各跟随对象所对应的待确定相对状态均满足预设状态信息时,确定多智能体系统中的各跟随对象达到一致性跟踪。解决了对于非线性多智能体系统中的各跟随对象来说,在无法获取多智能体系统中的全局状态信息的前提下,难以准确达到与目标对象一致性跟踪的问题,通过多智能体系统的目标对象通过向少量的跟随对象进行状态信息的传递,并根据各跟随对象之间的通信信息传递,在各跟随对象无法获取全局状态信息的前提下,基于少量的跟随对象控制多智能体系统中的所有跟随对象均达到与目标对象的一致性跟踪的效果。
[0179]
实施例三
[0180]
图5为本发明实施例三提供的一种一致性跟踪控制装置的结构示意图。如图5所示,该装置包括:跟随对象确定模块210、待确定状态确定模块220和一致性跟踪确定模块230。
[0181]
其中,跟随对象确定模块210,用于确定多智能体系统中的目标对象,以及与所述目标对象相关联的至少一个跟随对象;其中,所述多智能体系统为非线性多智能体系统;
[0182]
待确定状态确定模块220,用于针对各跟随对象,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定所述当前跟随对象所对应的待确定状态;其中,所述相对状态信息中包括相对速度、相对加速度和相对位置中的至少一种;
[0183]
一致性跟踪确定模块230,用于当各所述跟随对象所对应的待确定相对状态均满足预设状态信息时,确定所述多智能体系统中的各跟随对象达到一致性跟踪。
[0184]
本发明实施例的技术方案,确定多智能体系统中的目标对象,以及与目标对象相关联的至少一个跟随对象;针对各跟随对象,根据当前跟随对象与相关联的至少一个关联对象之间的相对状态信息,确定当前跟随对象所对应的待确定状态;当各跟随对象所对应的待确定相对状态均满足预设状态信息时,确定多智能体系统中的各跟随对象达到一致性跟踪。解决了对于非线性多智能体系统中的各跟随对象来说,在无法获取多智能体系统中的全局状态信息的前提下,难以准确达到与目标对象一致性跟踪的问题,通过多智能体系统的目标对象通过向少量的跟随对象进行状态信息的传递,并根据各跟随对象之间的通信信息传递,在各跟随对象无法获取全局状态信息的前提下,基于少量的跟随对象控制多智能体系统中的所有跟随对象均达到与目标对象的一致性跟踪的效果。
[0185]
可选的,跟随对象确定模块包括:有向图确定子模块,用于获取与多智能体系统相对应的有向图;其中,有向图为通信拓扑图;
[0186]
跟随对象确定子模块,用于根据有向图,确定多智能体系统中与目标对象相关联的至少一个跟随对象。
[0187]
可选的,所述至少一个跟随对象包括直接从所述目标对象获取通信信息的第一跟随对象,和/或无法直接从所述目标对象获取通信信息的第二跟随对象。
[0188]
可选的,待确定状态确定模块包括:关联对象确定单元,用于根据有向图中的通信流向信息,确定与所述当前跟随对象相关联的至少一个关联对象;
[0189]
状态确定方式确定单元,用于根据所述至少一个关联对象所对应的关联对象数量,确定与所述当前跟随对象相对应的状态确定方式;其中,所述关联对象数量为一个或多个;
[0190]
待确定状态确定单元,用于基于所述状态确定方式,确定相应的关联对象与所述当前跟随对象之间的相对状态信息,以基于至少一个相对状态信息,确定所述当前跟随对象所对应的待确定状态。
[0191]
可选的,待确定状态确定单元,包括:数量判断子单元,用于确定所述关联对象数量是否为一个;
[0192]
第一子单元,用于若是,则确定所述状态确定方式为第一状态确定方式,并基于所述第一状态确定方式确定所述关联对象与所述当前跟随对象之间的待确定误差,以基于所述待确定误差确定所述当前跟随对象与相应的关联对象之间的相对状态信息;
[0193]
第二子单元,用于则确定所述状态确定方式为第二状态确定方式,并基于所述第二状态确定方式,分别确定各关联对象与所述当前跟随对象之间的待叠加误差,并基于各待叠加误差之和,得到与所述当前跟随对象相对应的目标跟随误差,以基于所述目标跟随误差,确定所述当前跟随对象所对应的相对状态信息。
[0194]
可选的,一致性跟踪确定模块,包括:误差向量确定单元,用于根据各相对状态信息所对应的误差信息,构建所述当前跟随对象所对应的误差向量;其中,所述误差信息为所述待确定误差或所述目标跟随误差;
[0195]
一致性跟踪确定单元,用于当所述误差向量为零时,确定所述多智能体系统中的各跟随对象达到一致性跟踪。
[0196]
可选的,一致性跟踪控制装置,还包括:相对状态列向量确定模块,用于基于各所述跟随对象所对应的相对状态信息,构建一致性跟踪控制输入和相对状态列向量;
[0197]
函数构建模块,用于基于所述相对状态列向量,以及一致性跟踪控制器中输入的时变耦合增益函数和光滑单调递增函数,构建李雅普诺夫函数;其中,所述一致性跟踪控制器输入设置于所述多智能体系统中的各跟随对象中;
[0198]
一致性跟踪验证模块,用于当所述李雅普诺夫函数满足预设函数检测条件,且所述相对状态列向量为零时,确定所述多智能体系统中的各跟随对象达到一致性跟踪;其中,所述预设函数检测条件包括所述李雅普诺夫函数为连续可微径向无界函数,且所述李雅普诺夫函数的导数小于等于零。
[0199]
本发明实施例所提供的一致性跟踪控制装置可执行本发明任意实施例所提供的一致性跟踪控制方法,具备执行方法相应的功能模块和有益效果。
[0200]
实施例四
[0201]
图6示出了本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0202]
如图6所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
[0203]
电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0204]
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如一致性跟踪控制方法。
[0205]
在一些实施例中,一致性跟踪控制方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的一致性跟踪控制方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行一致性跟踪控制方法。
[0206]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统
的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0207]
用于实施本发明的一致性跟踪控制方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0208]
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0209]
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0210]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0211]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0212]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例
如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
[0213]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表