一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于认知搜索策略的多机器人源搜索方案生成方法及系统与流程

2022-03-09 07:13:24 来源:中国专利 TAG:


1.本发明涉及机器人控制领域,具体涉及一种基于认知搜索策略的多机器人源搜索方案生成方法及系统,可适用于多种气体源搜索场景包括化工园区危害化学品泄漏事故寻源、住宅楼内瓦斯泄漏源搜索等需求。


背景技术:

2.各类危害气体泄漏事故的发生,会导致严重的人员伤亡和经济财产损失。为了维护人员安全,避免财产损失,快速的搜索泄漏源位置,并获取源项参数成为一项重要的工作。利用机器人等配备各种传感器的移动设备自主进行源搜索是一种有效的方法,机器人根据传感器采集到的信息一步一步地向泄漏源移动,直到找到泄漏源。在这过程中,如何生成具体的行动方案控制机器人的移动是急需探索的目标。对于气体泄漏源的感知和搜索问题,主要有四种方法可以支持行动方案的生成,即基于梯度的算法、仿生学算法、基于概率和地图的算法以及基于信息论原理的算法。
3.纯粹的基于气体浓度梯度的算法是该领域最原始的实现方法。这种方法利用浓度梯度将机器人引导至泄漏源所在位置,但由于真实环境下气体在扩散的过程中分布的不确定性受湍流等因素的影响较大,因此这种方法在真实场景下很难实现。仿生学算法是通过研究动物发现气味来源和进行路径规划的方法来实现的,这种方法同样需要稳定的浓度梯度,多被用于小场景的寻源实验。基于概率和地图的算法将气味源的位置建模为概率分布,通过连续的观测,概率分布将变为狄拉克函数,进而确定源位置所在。这类算法产生较晚且数学计算复杂,但因效果较好而被广泛研究,如利用粒子滤波方法在室内搜寻气体扩散源。
4.为了解决湍流环境下的源定位问题,基于信息论原理的认知搜索策略得到了广泛的研究和应用。这种策略利用概率估计来定位气味源,同时在不确定情况下使用基于信息状态的奖励函数进行序贯决策。具体而言,源搜索过程可以被描述为一个部分可观马尔可夫决策过程(pomdp),由三个元素组成:信息状态、行动集和奖励函数。vergassola等人提出了最早的认知搜索策略infotaxis算法,它采用基于网格的方法来维持信息状态。随后,研究人员采用基于粒子滤波的序贯蒙特卡洛框架代替了infotaxis算法中基于网格的方法,从而使该算法可以估计源强和源位置。不同的认知搜索策略会采用不同的奖励函数。最初的infotaxis算法设计了一个包含两项的奖励函数,以实现探索(exploration)与开发(exploitation)之间的权衡。哈钦森等人提出了另一种名为entrotaxis的认知搜索算法该算法设计了一个基于最大熵抽样原则的奖励函数。这个奖励函数衡量了未来期望探测事件的不确定性,而不是infotaxis算法中考虑的源项信息的不确定性。
5.气体泄漏源搜索场景的一个特点是空间尺度大。在这个场景中,使用单个机器人搜索扩散源可能会花费过多的时间,或者由于距离源较远,可能无法进行有效的迭代计算,导致找不到源。使用多机器人系统——多个机器人通过协调动作完成任务,可以有效地完成许多单个机器人难以完成的复杂任务。多机器人协作控制问题已经引起了广泛的关注。soares等人提出了一种基于图的编队控制算法,该算法可以将机器人组织成任意的、进化
的形状,实现对气体扩散源溯源。由jatmiko提出的基于粒子群算法的气味源定位算法,在改进的基于粒子群优化算法中结合趋化性和趋风性方法,可以在有障碍物的环境中定位源,解决动态对流扩散问题。此外,hajieghrary和ani提出了一种多机器人协作的“信息出租”策略来应对大规模的机器人。但是,考虑到寻源过程中存在的不确定性,如何控制多个机器人在大空间尺度的场景中进行协同寻源以提高寻源效率和寻源准确率,仍然有广阔的研究空间。


技术实现要素:

6.本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于认知搜索策略的多机器人源搜索方案生成方法及系统,本发明能够实现多机器人的气体泄漏源搜索,考虑到寻源过程中存在的不确定性,利用多机器人协同算法,控制多个机器人在大空间尺度的场景中进行协同寻源,可以有效的提高寻源效率和寻源准确率,适用于多种气体源搜索场景包括化工园区危害化学品泄漏事故寻源、住宅楼内瓦斯泄漏源搜索等需求。
7.为了解决上述技术问题,本发明采用的技术方案为:
8.一种基于认知搜索策略的多机器人源搜索方案生成方法,包括:
9.1)建立气体泄漏模型和传感器的探测模型;
10.2)基于气体泄漏模型和传感器的探测模型,对泄漏源搜索过程建模;
11.3)运用粒子滤波的方法表示泄漏源搜索过程中源项参数估计的迭代更新,建立基于认知搜索策略的寻源行动方案;
12.4)针对实际障碍场景对寻源行动方案进行避障功能的改进;
13.5)针对改进后的寻源行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案。
14.可选地,步骤1)中建立的气体泄漏模型的函数表达式为:
[0015][0016]
上式中,v为平均风速,为y轴方向的梯度,c(r|θ0)为位置r={x,y}上的气体浓度,θ0={r0,q}为泄漏源r0的位置r0={x0,y0}的源项参数,q为扩散强度,d为气体有效扩散系数,δc(r|θ0)为浓度的变化量,τ为气体分子寿命,δ为狄拉克函数。
[0017]
可选地,步骤1)中建立的传感器的探测模型的函数表达式为:
[0018][0019]
上式中,p(d(r)|θ0)为传感器在位置r={x,y}上的单位时间内接触到d次气体分子的概率,d为传感器在位置r={x,y}上的单位时间内接触到气体分子的次数,r(r|θ0)为传感器与气体分子在单位时间内的平均接触次数,且有:
[0020]
r(r|θ0)=4πdac(r|θ0)
[0021]
上式中,d为气体有效扩散系数,a为球形的传感器半径,c(r|θ0)为位置r={x,y}上的气体浓度,且有:
[0022][0023]
上式中,c(r|θ0)为位置r={x,y}上的气体浓度,θ0={r0,q}为泄漏源r0的位置r0={x0,y0}的源项参数,q为扩散强度,v为平均风速,中间变量λ的函数表达式为:
[0024][0025]
可选地,步骤2)包括:将需要被估计的源项参数为θ0={r0,q}用概率密度函数来表示对源项参数的估计,将表示任意第k步后得到的信息状态的第k步的后概率密度函数p(θk|dk)由前k步已经收集到的所有信息决定,其中θk为第k步估计的源项参数,dk={d1(r1),d2(r2),

,dk(rk)}表示第k步在位置rk={xk,yk}的上收集到的所有信息,d1(r1)~dk(rk)分别为第1~k步得到的传感器读数;且初始的后概率密度函数p(θ0)由先验知识预设得到,任意第k步的后验概率密度函数p(θk|dk)利用贝叶斯公式根据下式进行更新:
[0026][0027]
上式中,p(θk|d
k-1
)为k-1步的后验概率密度,p(dk(rk)|θk)为密度权重,p(dk(rk)|d
k-1
)为归一化因子;考虑四连通情况下的可选行动集u为u={

,

,

,

},可选行动集u中的四个元素

,

,

,

分别表示行动的上下左右四个方向,将寻源机器人在每一步中采用奖励函数来计算可选行动集u中各候选位置上能获取到的信息增益i(u),并根据下式选取信息增益i(u)最大的位置u
*
作为下一位置,从而得到对泄漏源搜索过程的模型函数表达式如下式所示:
[0028][0029]
上式中,u
*
为选取的下一位置,u为可选行动集u中的元素对应的候选位置,i(u)为候选位置上能获取到的信息增益,arg max表示选取信息增益i(u)最大的位置。
[0030]
可选地,步骤3)包括:对任意第k步的后概率密度函数p(θk|dk)进行采样产生n个带权值的随机样本其中表示第k步的第i个粒子对源项参数的估计,为粒子对应的权值,n个权值总和为1,用n个带权值的随机样本作为粒子滤波方法的n个粒子近似表示第k步的后概率密度函数p(θk|dk)为:
[0031][0032]
上式中,δ为狄拉克函数;从而将泄漏源搜索过程中任意第k步的后概率密度函数p(θk|dk)的更新表示为粒子滤波方法的粒子更新,且在现金粒子滤波方法的粒子更新时,计算有效采样尺度n
eff
来定义粒子滤波的退化程度,若有效采样尺度n
eff
下降到小于设定阈值η时,采取残差重采样的方法从原有的粒子集总采样得到新的粒子集。
[0033]
可选地,所述采取残差重采样的方法从原有的粒子集总采样得到新的粒子集包括:根据下式计算第k步的累积概率:
[0034]
[0035]
上式中,为第k步的前j个累积概率,为第k步的前j-1个累积概率,表示原有的粒子集中的第j个权值,n为粒子集的粒子数;生成n个在[0,1]区间内均匀分布的随机数集合对于随机数集合中的每一个随机数寻找最小的j值使得满足若找到满足的j值则令新的粒子集中的例子且从而得到重采样后的粒子集)然后在针对重采样后的粒子集)运用metropolis-hastings算法采样出新的粒子集,且采用正态分布概率函数作为metropolis-hastings算法进行采样的转移概率。
[0036]
可选地,步骤4)包括:
[0037]
4.1)初始化源项参数,确定参数估计范围;初始化粒子滤波参数以及步k的值为1;
[0038]
4.2)获得第k步位置r={x,y}上的传感器度数dk(rk);
[0039]
4.3)执行第k步更新粒子滤波;
[0040]
4.4)计算第k步的可通行行动集ujk中各候选位置的信息熵,计算第k步的行动集uk中各候选位置的信息熵,根据下式计算第k步最佳可通行行动方向uj
*k
和最佳行动方向u
*k

[0041][0042]
上式中,i(ujk)为第k步的可选行动集ujk中各候选位置的信息熵,i(uk)为第k步的可选行动集ujk中各候选位置的信息熵;
[0043]
4.5)判断第k步的uj
*k
和u
*k
两者是否相等,若第k步的uj
*k
和u
*k
两者相等,则选择uj
*k
作为下一位置并移动,跳转至步骤4.7);
[0044]
4.6)从1到近期记忆步数m遍历满足&的数量count,其中,uj
*k-m
未k-m步的最佳可通行行动方向,u
*k-m
为k-m步的最佳行动方向;若数量count于预设阈值n,则选取uj
*k
方向进行移动,到下一个路口转向u
*k
方向;否则,选择uj
*k
作为下一位置并移动,跳转至步骤4.7);
[0045]
4.7)判断是否满足预设的停止条件,若满足则寻源结束,跳转至步骤5);否则,跳转至步骤4.2)继续迭代。
[0046]
可选地,步骤5)中针对改进后的寻源行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案时,多机器人中每个机器人i都在每一步都将自己的位置以及传感器度数传给附近的其他机器人,每个机器人i接收附近机器人收集到的传感器度数,单独执行相同的寻源搜索并维持着各自第k步的后概率密度函数pi(θk|dk),且每个机器人第k步的后概率密度函数pi(θk|dk)的大小相同。
[0047]
此外,本发明还提供一种基于认知搜索策略的多机器人源搜索方案生成系统,包括相互连接的微处理器和存储器,该微处理器被编程或配置以执行所述基于认知搜索策略的多机器人源搜索方案生成方法的步骤。
[0048]
此外,本发明还提供一种计算机可读存储介质,该计算机可读存储介质中存储有被编程或配置以执行所述基于认知搜索策略的多机器人源搜索方案生成方法的计算机程序。
[0049]
和现有技术相比,本发明具有下述优点:本发明方法包括建立气体泄漏模型和传
感器的探测模型;基于气体泄漏模型和传感器的探测模型,对泄漏源搜索过程建模;运用粒子滤波的方法表示泄漏源搜索过程中源项参数估计的迭代更新,建立基于认知搜索策略的寻源行动方案;针对实际障碍场景对寻源行动方案进行避障功能的改进;针对改进后的寻源行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案。本发明能够实现多机器人的气体泄漏源搜索,考虑到寻源过程中存在的不确定性,利用多机器人协同算法,控制多个机器人在大空间尺度的场景中进行协同寻源,可以有效的提高寻源效率和寻源准确率,可适用于多种气体源搜索场景包括化工园区危害化学品泄漏事故寻源、住宅楼内瓦斯泄漏源搜索等需求。
附图说明
[0050]
图1为本发明实施例方法的基本流程示意图。
[0051]
图2为本发明实施例中传感器的探测模型示意图。
[0052]
图3为本发明实施例中避障行动方案示意图。
[0053]
图4为本发明实施例中步骤4)的流程示意图。
[0054]
图5为本发明实施例中理想情况下多机器人协同控制行动方案示意图。
[0055]
图6为本发明实施例中信息通讯受阻情况下多机器人协同控制行动方案示意图。
[0056]
图7为本发明实施例中步骤5)的流程示意图。
具体实施方式
[0057]
下文以大型障碍场景为例,对控制多机器人基于认知搜索策略进行气体泄漏源搜索的行动方案的生成方法进行详细说明。
[0058]
如图1所示,本实施例基于认知搜索策略的多机器人源搜索方案生成方法包括:
[0059]
1)建立气体泄漏模型和传感器的探测模型;
[0060]
2)基于气体泄漏模型和传感器的探测模型,对泄漏源搜索过程建模;
[0061]
3)运用粒子滤波的方法表示泄漏源搜索过程中源项参数估计的迭代更新,建立基于认知搜索策略的寻源行动方案;
[0062]
4)针对实际障碍场景对寻源行动方案进行避障功能的改进;
[0063]
5)针对改进后的寻源行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案。
[0064]
本实施例中,步骤1)基于大气传输扩散模型建立气体泄漏模型,并建立传感器的探测模型对观测到的数据进行处理;步骤2)对泄漏源搜索过程建模,将其转化为部分可观马尔可夫决策过程,并确定信息状态、可用行动集和奖励函数;步骤3)利用粒子滤波的方法表示源项估计的迭代更新,加入重采样步骤避免粒子退化问题,运用metropolis-hastings算法采样新粒子,然后根据粒子的分布和权重重新设计奖励函数来控制机器人的行动;步骤4)以复杂的障碍场景为背景,从算法层面考虑路网约束的影响,引入间歇性搜索策略对基于认知搜索策略的机器人行动方案做出改进。步骤5)针对复杂障碍场景空间尺度大的特点,考虑到寻源过程中存在的不确定性,利用多机器人协同算法,控制多个机器人在大空间尺度的场景中进行协同寻源。通过上述步骤,能够实现多机器人的气体泄漏源搜索,考虑到寻源过程中存在的不确定性,利用多机器人协同算法,控制多个机器人在大空间尺度的场
景中进行协同寻源,可以有效的提高寻源效率和寻源准确率,可适用于多种气体源搜索场景包括化工园区危害化学品泄漏事故寻源、住宅楼内瓦斯泄漏源搜索等需求。
[0065]
本实施例中,步骤1)中建立的气体泄漏模型的函数表达式为:
[0066][0067]
上式中,v为平均风速,为y轴方向的梯度,c(r|θ0)为位置r={x,y}上的气体浓度,θ0={r0,q}为泄漏源r0的位置r0={x0,y0}的源项参数,q为扩散强度,d为气体有效扩散系数,δc(r|θ0)为浓度的变化量,τ为气体分子寿命,δ为狄拉克函数。上述气体泄漏模型由稳态对流扩散方程(advection-diffusion equation)推导得出,v为平均风速,平均风向与y轴负方向同向,具体坐标系见图2,图中横纵坐标表示场景大小。本实施例中,步骤1)中建立的传感器的探测模型的函数表达式为:
[0068][0069]
上式中,p(d(r)|θ0)为传感器在位置r={x,y}上的单位时间内接触到d次气体分子的概率,d为传感器在位置r={x,y}上的单位时间内接触到气体分子的次数,r(r|θ0)为传感器与气体分子在单位时间内的平均接触次数,且有:
[0070]
r(r|θ0)=4πdac(r|θ0),
ꢀꢀ
(3)
[0071]
上式中,d为气体有效扩散系数,a为球形的传感器半径,c(r|θ0)为位置r={x,y}上的气体浓度,且有:
[0072][0073]
上式中,c(r|θ0)为位置r={x,y}上的气体浓度,也是式(1)的三维分析解;θ0={r0,q}为泄漏源r0的位置r0={x0,y0}的源项参数,q为扩散强度,v为平均风速,中间变量λ的函数表达式为:
[0074][0075]
在实际的寻源过程中,考虑到现有气体传感器的精度问题,检测到的浓度会与实际浓度存在较大误差。因此需要建立传感器的探测模型对观测到的数据进行处理,这里可以把传感器与气体分子的接触过程类比于电磁学现象,引入斯莫鲁霍夫斯基公式,将任意位置的浓度数据,转换为传感器与气体化学战剂分子在单位时间内的平均接触次数,最终得到式(3)的传感器与气体分子在单位时间内的平均接触次数模型。在气体浓度较高的地方,传感器能在单位时间内接触到更多次气体分子。
[0076]
同时,湍流效应会扰乱浓度场,导致传感器只能获得零星的、间断的有效读数,因此不得不考虑其影响。我们在传感器的探测模型中引入泊松过程来近似建模湍流效应对气体扩散的影响。泊松过程是随机过程的一种,是以事件的发生时间来定义的,若一个随机过程n(t)是一个时间齐次的一维泊松过程,它满足以下两个条件,一是在两个互斥的区间内所发生的事件的数目是相互独立的随机变量;二是在区间[t,t τ]内发生的事件的数目的概率分布为:
[0077][0078]
上式中,μ是一个正数,通常称为抵达率。
[0079]
本实施例中,将传感器在单位时间内与气体分子接触的平均次数作为抵达率,即μ=r(r|θ0),则传感器在r={x,y}位置上单位时间内接触到d次分子的概率为式(2),图2分别展示了考虑湍流效应前后,一个案例场景中的传感器的检测值。图2为本实施例中传感器的探测模型示意图,图2中的(a)为考虑湍流效应前传感器的检测值,图2中的(b)为考虑湍流效应后传感器的检测值。
[0080]
本实施例中,步骤2)包括:将需要被估计的源项参数为θ0={r0,q}用概率密度函数来表示对源项参数的估计,将表示任意第k步后得到的信息状态的第k步的后概率密度函数p(θk|dk)由前k步已经收集到的所有信息决定,其中θk为第k步估计的源项参数,dk={d1(r1),d2(r2),

,dk(rk)}表示第k步在位置rk={xk,yk}的上收集到的所有信息,d1(r1)~dk(rk)分别为第1~k步得到的传感器读数;且初始的后概率密度函数p(θ0)由先验知识预设得到,任意第k步的后验概率密度函数p(θk|dk)利用贝叶斯公式根据下式进行更新:
[0081][0082]
上式中,p(θk|d
k-1
)为k-1步的后验概率密度,p(dk(rk)|θk)为密度权重,p(dk(rk)|d
k-1
)为归一化因子;考虑四连通情况下的可选行动集u为u={

,

,

,

},可选行动集u中的四个元素

,

,

,

分别表示行动的上下左右四个方向,将寻源机器人在每一步中采用奖励函数来计算可选行动集u中各候选位置上能获取到的信息增益i(u),并根据下式选取信息增益i(u)最大的位置u
*
作为下一位置,从而得到对泄漏源搜索过程的模型函数表达式如下式所示:
[0083][0084]
上式中,u
*
为选取的下一位置,u为可选行动集u中的元素对应的候选位置,i(u)为候选位置上能获取到的信息增益,arg max表示选取信息增益i(u)最大的位置。在寻源开始时,由于还未收集到源项信息,可根据先验知识得到源项参数的初始概率密度函数p(θ0)。这里假设可以利用先验知识确定参数估计范围,并采用均匀分布表示初始概率密度函数。认知搜索算法指导寻源机器人在每一步采用固定步长进行移动。本实施例中只考虑四连通的情况,可选行动集为u={

,

,

,

}。寻源机器人在每一步中采用奖励函数来计算可选行动集中各候选位置上能获取到的信息增益i(u),并选取信息增益最大的位置u
*
作为下一位置。
[0085]
本实施例中,步骤3)包括:对任意第k步的后概率密度函数p(θk|dk)进行采样产生n个带权值的随机样本其中表示第k步的第i个粒子对源项参数的估计,为粒子对应的权值,n个权值总和为1,用n个带权值的随机样本作为粒子滤波方法的n个粒子近似表示第k步的后概率密度函数p(θk|dk)为:
[0086]
[0087]
上式中,δ为狄拉克函数;从而将泄漏源搜索过程中任意第k步的后概率密度函数p(θk|dk)的更新表示为粒子滤波方法的粒子更新,且在现金粒子滤波方法的粒子更新时,计算有效采样尺度n
eff
来定义粒子滤波的退化程度,若有效采样尺度n
eff
下降到小于设定阈值η时,采取残差重采样的方法从原有的粒子集总采样得到新的粒子集。
[0088]
本实施例中,采取残差重采样的方法从原有的粒子集总采样得到新的粒子集包括:根据下式计算第k步的累积概率:
[0089][0090]
上式中,为第k步的前j个累积概率,为第k步的前j-1个累积概率,表示原有的粒子集中的第j个权值,n为粒子集的粒子数;生成n个在[0,1]区间内均匀分布的随机数集合对于随机数集合中的每一个随机数寻找最小的j值使得满足若找到满足的j值则令新的粒子集中的例子且从而得到重采样后的粒子集)然后在针对重采样后的粒子集)运用metropolis-hastings算法采样出新的粒子集,且采用正态分布概率函数作为metropolis-hastings算法进行采样的转移概率。
[0091]
步骤3)包括粒子滤波和重采样。
[0092]
进行粒子滤波时,利用粒子滤波的方法表示源项估计的迭代更新,对第k步的后验概率密度函数p(θk|dk)进行采样,产生n个带权值的随机样本其中表示第k步的第i个粒子对源项参数的估计,为粒子对应的权值,有用这n个粒子近似p(θk|dk)如式(9)。重采样步骤中,当传感器第k步在位置rk上获得传感器读数dk时,按照上式更新粒子权重。可以看出,如果某一粒子对源项参数的估计能产生读数dk的概率越大,该粒子更新后的权重就越大。经过若干次迭代后,某些可能接近真实源项参数的粒子权重会越来越大,这就导致了粒子退化问题。一般用有效采样尺度n
eff
来定义粒子滤波的退化程度:
[0093][0094]
上式中,n为带权值的随机样本数量,为粒子对应的权值。当n
eff
下降到一个设定阈值η时,采取残差重采样方法来解决粒子退化问题。从已有粒子集中采样得到新的粒子集主要步骤如下:计算累计概率ck,生成n个在[0,1]区间内均匀分布的随机数对于每个寻找最小的j使得则令按照如此方法,权值比较大的粒子会被多次复制,那些权值小对计算后验概率函数贡献非常小的粒子就会被剔除。但重采样步骤会导致粒子多样性丢失,在若干次迭代后,所有粒子可能都变为了某几个粒子的复制。此外,更新粒子滤波无法减小或消除初始粒子对源项参数的点估计的误差。因此,需要增加粒子多样性来解决此问题,在重采样步骤后,运用metropolis-hastings算法从原来的粒子集中采样出新的粒子集。采用正态分布概率函数作为转移概率。
[0095]
在路网约束下,寻源机器人第k步的可选行动集为机器人只能从ujk中选取作为下一步的位置。但这可能导致寻源设备始终在一个区域徘徊,而无法向源方向移动。此时,结合间歇性搜索原理,若在前m步中有n次因路网约束而无法向同一个方向移动,此时采用长距离转向移动离开这片区域并在最近的路口转向因路网约束无法移动的方向,以达到向源方向移动的目的。该过程如图3所示,图中方位已经标定,黑色实线代表机器人轨迹、蓝色矩形代表障碍物,红色点代表机器人在该位置传感器工作。左图中蓝色圈代表机器人现在所处位置,带箭头的虚线指向没有路网约束情况下,机器人的移动方向。可以看出由于障碍物的阻挡,机器人多次无法向前运动,只能选择左右移动,因此采用长距离转向移动,绕过障碍物,在此期间传感器不工作。如图4所示,本实施例中步骤4)包括:
[0096]
4.1)初始化源项参数,确定参数估计范围;初始化粒子滤波参数以及步k的值为1;
[0097]
4.2)获得第k步位置r={x,y}上的传感器度数dk(rk);
[0098]
4.3)执行第k步更新粒子滤波;
[0099]
4.4)计算第k步的可通行行动集ujk中各候选位置的信息熵,计算第k步的行动集uk中各候选位置的信息熵,根据下式计算第k步最佳可通行行动方向uj
*k
和最佳行动方向u
*k

[0100][0101]
上式中,i(ujk)为第k步的可选行动集ujk中各候选位置的信息熵,i(uk)为第k步的可选行动集ujk中各候选位置的信息熵;
[0102]
4.5)判断第k步的uj
*k
和u
*k
两者是否相等,若第k步的uj
*k
和u
*k
两者相等,则选择uj
*k
作为下一位置并移动,跳转至步骤4.7);
[0103]
4.6)从1到近期记忆步数m遍历满足&的数量count,其中,uj
*k-m
未k-m步的最佳可通行行动方向,u
*k-m
为k-m步的最佳行动方向;若数量count于预设阈值n,则选取uj
*k
方向进行移动,到下一个路口转向u
*k
方向;否则,选择uj
*k
作为下一位置并移动,跳转至步骤4.7);
[0104]
4.7)判断是否满足预设的停止条件,若满足则寻源结束,跳转至步骤5);否则,跳转至步骤4.2)继续迭代。
[0105]
如图5和图6所示,对于基于多机器人的协同搜索算法,假设团队(由n个机器人组成)中的每个机器人i都单独执行前述的entrotaxis-turn寻源算法,并维持着各自的源项估计pi(θk|dk),该估计描述了源可能存在的位置。当每个机器人进行寻源探测时,它会将自己的位置及获得的传感器读数传给附近的其他机器人,每个机器人都可以接收附近机器人收集到的信息,并更新其对于源项的估计。每个机器人通过各自的概率估计函数pi(θk|dk)来决策下一步要移动的位置。在没有通信延迟或信息丢失的情况下,每个机器人关于源位置的概率估计是相同的,即p1(θk|dk)=p2(θk|dk)=...=pn(θk|dk)。这就意味着从算法层面来讲所有机器人共用同一个粒子滤波来对源位置进行估计,同时这一个粒子滤波可以预估所有机器人将要移动的位置。其中图5为理想情况下,p1(θk|dk)=p2(θk|dk)=p3(θk|dk);图6为非理想情况下信息通讯受阻情况,p1(θk|dk)≠p2(θk|dk)=p3(θk|dk)。
[0106]
本实施例中,步骤5)中针对改进后的寻源行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案时,多机器人中每个机器人i都在每一
步都将自己的位置以及传感器度数传给附近的其他机器人,每个机器人i接收附近机器人收集到的传感器度数,单独执行相同的寻源搜索并维持着各自第k步的后概率密度函数pi(θk|dk),且每个机器人第k步的后概率密度函数pi(θk|dk)的大小相同。
[0107]
如图7所示,本实施例中步骤5)包括:5.1)初始化源项参数,确定参数估计范围;初始化粒子滤波参数;初始化用于表示步k的值为1;5.2)获得第k步位置r={x,y}上的传感器度数dk(rk);5.3)执行第k步更新粒子滤波;5.4)计算第k步的可通行行动集ujk中各候选位置的信息熵,计算第k步的行动集uk中各候选位置的信息熵,并根据下式计算第k步的最佳可通行行动方向uj
*k
和最佳行动方向u
*k

[0108][0109]
上式中,i(ujk)为第k步的可选行动集ujk中各候选位置的信息熵,i(uk)为第k步的可选行动集ujk中各候选位置的信息熵;5.5)若第k步的uj
*k
和u
*k
两者相等,则选择uj
*k
作为下一位置并移动,跳转至步骤5.7);5.6)从1到近期记忆步数m遍历满足&的数量count,其中,uj
*k-m
未k-m步的最佳可通行行动方向,u
*k-m
为k-m步的最佳行动方向;若数量count于预设阈值n,则选取远离其他机器人的方向移动,到下一个路口转向u
*k
方向;否则,选择uj
*k
作为下一位置并移动,跳转至步骤5.7);5.7)判断是否满足预设的停止条件,若满足则寻源结束,跳转至步骤5);否则,跳转至步骤5.2)。本实施例中通过增加机器人的数量,可以减少找到原位置的时间,源位置估计的方差也会减少,这是因为增加的机器人的数量有效的提高了团队的检测率。因此一个由n个机器人组成的寻源机器人团队,可以用更少的粒子滤波迭代次数,完成寻源工作,从而减少寻源时间,提高寻源成功率。
[0110]
综上所述,本实施例方法包括根据大气传输扩散模型构建气体泄漏模型和传感器探测模型;对泄漏源搜索过程进行建模;建立基于认知搜索策略的寻源行动方案;针对实际障碍场景对行动方案进行避障功能的改进;针对大型障碍场景,将行动方案与多机器人控制技术相结合,生成基于认知搜索策略的多机器人源搜索行动方案。本发明具有适用场景广泛,搜索效率和成功率高,复杂环境中鲁棒性强的优点。实现本实施例的关键方法是基于认知搜索策略的多机器人源搜索行动方案生成方法。根据这个方法,可以为大型障碍场景下气体源搜索问题提供行动方案。该方法建立了气体泄露模型,并根据机器人传感器精度问题建立了探测模型。基于认知搜索策略对整个源搜索过程进行建模,并且设计了避障算法,同时提供了相应大型站该场景下的多机器人控制行动方案。相比于现有自主寻源行动方案,本实施例方法的适应场景更加广泛,在大型障碍场景中的搜索效率与成功率显著提高。在实际应用中,本实施例方法具有更强的实用性。
[0111]
此外,本实施例还提供一种基于认知搜索策略的多机器人源搜索方案生成系统,包括相互连接的微处理器和存储器,该微处理器被编程或配置以执行前述基于认知搜索策略的多机器人源搜索方案生成方法的步骤。
[0112]
此外,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有被编程或配置以执行前述基于认知搜索策略的多机器人源搜索方案生成方法的计算机程序。
[0113]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实
施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可读存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/的处理器执行的指令产生用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的步骤。
[0114]
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献