群体编队处理方法、装置、电子设备及可读存储介质与流程
- 国知局
- 2024-08-01 00:19:23
本申请涉及群体控制,尤其涉及一种群体编队处理方法、装置、电子设备及可读存储介质。
背景技术:
1、目前常用的群体编队方法,多采用中心式控制,需要依赖中央计算器和全局定位信息,受通信和计算能力的限制,编队控制的可扩展性和鲁棒性均不高。由于依赖中央计算器进行控制,中央计算器作为中央节点,一旦中央节点崩溃,整体的控制也将瘫痪。此外,传统的控制方法受参数、经验等因素影响,其性能优化的范围有限,且随着群体规模的增长,控制的难度也大幅度增长,不能够满足大规模群体控制的需求。
技术实现思路
1、为了解决上述技术问题,本申请实施例提供了一种群体编队处理方法、装置、电子设备及可读存储介质。
2、第一方面,本申请实施例提供了一种群体编队处理方法,所述方法包括:
3、将群体的n个同质个体设置为二维空间的n个圆形个体;
4、获取各个所述圆形个体的多个相对视觉信息;
5、向判决神经网络模型输入各个所述圆形个体的多个所述相对视觉信息,通过所述判决神经网络模型输出各所述圆形个体的速度矢量变化信息;
6、根据各所述圆形个体的速度矢量变化信息确定各所述同质个体对应的速度控制量。
7、在一实施方式中,所述相对视觉信息包括相对方位和相对距离,所述获取各个所述圆形个体的多个相对视觉信息,包括:
8、将第i个所述圆形个体的视觉观察过程采用光影透射方式进行表示,确定二维空间内的离散化光影线的数量,其中,1≤i≤n;
9、根据所述离散化光影线的数量确定第i个圆形个体的多个相对方位和多个相对距离。
10、在一实施方式中,所述判决神经网络模型包括变化获取模块和加权融合模块,所述通过所述判决神经网络模型输出各所述圆形个体的速度矢量变化信息,包括:
11、通过所述变化获取模块对各圆形个体的多个相对方位进行响应,输出对应单个相对方位的速度矢量变化的均值和方差;
12、基于正态分布,对单个相对方位响应进行随机选择,得到对应单个相对方位的速度矢量变化;
13、通过所述加权融合模块生成各圆形个体对单个相对方位的响应的权重,根据各圆形个体的单个相对方位的速度矢量变化、及各圆形个体的单个相对方位的响应的权重,加权计算各所述圆形个体在当前时刻的速度矢量变化。
14、在一实施方式中,所述根据各所述圆形个体的速度矢量变化信息确定各所述同质个体对应的速度控制量,包括:
15、根据各圆形个体在当前时刻的速度矢量变化,确定各所述圆形个体的速度更新方程;
16、根据所述速度更新方程确定定各所述同质个体对应的速度控制量。
17、在一实施方式中,所述方法还包括:
18、根据各所述圆形个体的速度矢量确定各所述同质个体的位置更新信息。
19、在一实施方式中,所述方法还包括:
20、在每个时间步控制各所述同质个体计算瞬时群体奖励;
21、基于强化学习算法查找最大化瞬时群体奖励。
22、在一实施方式中,所述方法还包括:
23、在仿真时间内,根据所述群体的当前构型与所述群体的期望构型的差异计算瞬时群体奖励。
24、第二方面,本申请实施例提供了一种群体编队处理装置,所述群体编队处理装置包括:
25、设置模块,用于将群体的n个同质个体设置为二维空间的n个圆形个体;
26、获取模块,用于获取各个所述圆形个体的多个相对视觉信息;
27、处理模块,用于向判决神经网络模型输入各个所述圆形个体的多个所述相对视觉信息,通过所述判决神经网络模型输出各所述圆形个体的速度矢量变化信息;
28、确定模块,根据各所述圆形个体的速度矢量变化信息确定各所述同质个体对应的速度控制量。
29、第三方面,本申请实施例提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储计算机程序,所述计算机程序在所述处理器运行时执行第一方面提供的群体编队处理方法。
30、第四方面,本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序在处理器上运行时执行第一方面提供的群体编队处理方法。
31、上述本申请提供的群体编队处理方法、装置、电子设备及可读存储介质,将群体的n个同质个体设置为二维空间的n个圆形个体;获取各个所述圆形个体的多个相对视觉信息;向判决神经网络模型输入各个所述圆形个体的多个所述相对视觉信息,通过所述判决神经网络模型输出各所述圆形个体的速度矢量变化信息;根据各所述圆形个体的速度矢量变化信息确定各所述同质个体对应的速度控制量,以相对方位和相对距离为判决神经网络模型的输入,同质个体的速度控制量为判决神经网络模型的输出,实现群体编队的分布式控制,现适应性更强、鲁棒性更高、可扩展性更大的群体编队控制。
技术特征:1.一种群体编队处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述相对视觉信息包括相对方位和相对距离,所述获取各个所述圆形个体的多个相对视觉信息,包括:
3.根据权利要求2所述的方法,其特征在于,所述判决神经网络模型包括变化获取模块和加权融合模块,所述通过所述判决神经网络模型输出各所述圆形个体的速度矢量变化信息,包括:
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据各所述圆形个体的速度矢量变化信息确定各所述同质个体对应的速度控制量,包括:
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
8.一种群体编队处理装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括存储器以及处理器,所述存储器存储有计算机程序,所述计算机程序在所述处理器运行时执行权利要求1至7中任一项所述的群体编队处理方法。
10.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序在处理器上运行时执行权利要求1至7中任一项所述的群体编队处理方法。
技术总结本申请实施例提供了一种群体编队处理方法、装置、电子设备及可读存储介质,属于群体控制技术领域。该方法包括:将群体的N个同质个体设置为二维空间的N个圆形个体;获取各个所述圆形个体的多个相对视觉信息;向判决神经网络模型输入各个所述圆形个体的多个所述相对视觉信息,通过所述判决神经网络模型输出各所述圆形个体的速度矢量变化信息;根据各所述圆形个体的速度矢量变化信息确定各所述同质个体对应的速度控制量,以相对方位和相对距离为判决神经网络模型的输入,同质个体的速度控制量为判决神经网络模型的输出,实现群体编队的分布式控制,现适应性更强、鲁棒性更高、可扩展性更大的群体编队控制。技术研发人员:张华喜,徐朋朋,陈春玉,谭欢受保护的技术使用者:深圳市优必选科技股份有限公司技术研发日:技术公布日:2024/7/15本文地址:https://www.jishuxx.com/zhuanli/20240730/200588.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。