一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

可靠众包样本集的生成、多分辨率数据库构建、定位方法

2022-05-08 06:24:31 来源:中国专利 TAG:


1.本发明属于通信与无线网络技术领域,更具体地,涉及可靠众包样本集的生成、多分辨率数据库构建、定位方法。


背景技术:

2.定位技术一直是许多民用和军事应用感兴趣的话题,例如搜救任务、物联网和机器人导航。尽管全球定位系统(global positioning system,gps)技术发展成熟,但因为精度原因仍不能成为室内环境的最佳手段。近些年,诞生了众多用于室内定位技术,例如可见光通信、蓝牙、超宽带等。尽管这些技术各有优缺点,但基于wi-fi的指纹定位由于其强大的普适性成为了最广泛使用的技术。然而,随着室内环境的规模和复杂性的增加,wi-fi的指纹定位出现了两个主要挑战。
3.首先,随着室内环境复杂性的增加,wi-fi离线数据库建设所需要的现场勘测成本也大大增加。众包成为最有力的解决方案之一,它利用互联网中未知的大众来完成样本的采集任务,从而减轻现场勘测的巨大负担。虽然众包能够减轻现场勘测的负担,但众包样本由非专业人员采集,标注通常带有错误。再加上众包技术的采集过程是随机的,众包样本的密度可能不均匀,甚至可能在有些定位区域根本没有样本。这些都是众包函待解决的问题。
4.另一方面,随着室内环境规模的扩大,搜索精确定位需要更长的处理时间和额外的计算资源。主要的室内定位研究一直集中在精确的坐标级位置估计上,即获得亚米级精度的网格位置估计。然而,一些位置感知服务可能不需要这种明确的位置精度。例如,在医院中对医疗设备的跟踪;在机场中定位停车位;在消防中短时间定位分区等。因此,在某些情况下,识别用户所属的区域,例如建筑、房间等,比提供由坐标信息指定的精确位置更有意义,所以许多位置感知服务都需要不同级别的定位分辨率。然而在室内定位的研究工作中,关于此类的研究甚少。


技术实现要素:

5.针对现有技术的缺陷和改进需求,本发明提供了可靠众包样本集的生成、多分辨率数据库构建、定位方法,其目的在于简化大型复杂室内定位环境中的数据库架构,通过设定多个分辨率级别,满足不同的位置感知服务需求以及增加在线阶段定位速度。同时在一定程度上解决众包样本带有错误位置标注和采样不均的问题。
6.为实现上述目的,按照本发明的第一方面,提供了一种wi-fi可靠众包样本集的生成方法,所述方法包括:
7.s1.将目标区域自上而下进行多层次拆分,直至拆分为栅格,得到目标区域、分区、子分区
……
栅格不同级别的单位,所述栅格对应最高分辨率;
8.s2.基于目标区域的多层次拆分结果,对原始众包样本进行分配;
9.s3.对每个栅格内的众包样本分别进行可靠性度量,保留可靠性大于阈值的可信众包样本;
10.s4.对保留下来的所有可信众包样本进行曲面拟合;
11.s5.对拟合曲面函数进行均匀采样,得到wi-fi可靠众包样本集。
12.优选地,所述可靠性度量采取轮廓系数计算公式如下:
[0013][0014][0015][0016]
其中,表示栅格gk内坐标(xn,yn)处收集到的rss向量表示样本和与它同属一个栅格中其它众包样本之间的信号距离,表示样本与其他栅格中所有其他众包样本之间的信号距离的最小值,sk表示表示样本所在栅格内的所有样本集,表示样本和样本之间的信号距离。
[0017]
有益效果:针对现有众包样本标注错误的问题,本技术采用轮廓值系数评估众包样本与其定位区域的相容度,由于轮廓系数能够结合内聚度和分离度两种因素,从而实现合理、有效的可靠性度量;由于剔除低相容度也就是低可靠性样本以保证数据库的质量,提高后续定位的准确性。
[0018]
优选地,所述曲面拟合方式如下:
[0019]
原始众包样本的轮廓值集合sh={h1,h2,

,hn},可信众包样本的轮廓值集合sh′
={h1,h2,

,h
γ
},n表示原始众包样本数量,γ表示可信众包样本数量,其中,轮廓值
[0020]
采用轮廓值hn计算可信众包样本中样本的权重系数wn,n=1,

,γ:
[0021][0022][0023]
[0024][0025]
其中,ρ表示可靠众包样本的比率;
[0026]
采取权重系数wn对第m个ap的信号拟合函数在位置(xn,yn)处的值和样本的第m个ap接收到的信号强度值之间的偏差进行加权,最小化平方加权残差总和的目标函数为:
[0027][0028]
其中,φm(x,y)为拟合曲面函数,用于拟合给定分区中来自ap的无线信号传播表面。
[0029]
有益效果:针对现有众包样本质量不一的问题,本技术基于样本的轮廓值计算它们应赋的权重,一方面让可靠性与给曲面的贡献成正比。另一方面,控制权重wn到[1,ρ]的范围,确保不同样本差异度不过于太大;采用加权的方式构建无线曲面函数,由于在拟合曲面时赋予样本不一样的权重,能够充分样本的差异性,对曲面构建过程的影响更大的可靠的众包样本赋予更大的权重,增强拟合曲面的可靠性和有效性。
[0030]
为实现上述目的,按照本发明的第二方面,提供了一种多分辨率离线数据库的构建方法,所述构建方法包括:
[0031]
t1.采用如第一方面所述的方法生成wi-fi可靠众包样本集;
[0032]
t2.基于目标区域的多层次拆分结果,按照自下而上的方式构建多分辨率离线数据库,由当前分辨率层的多个分区指纹集合得到上一分辨率层的一个分区指纹。
[0033]
优选地,所述多分辨率离线数据库中多分辨率从高分辨率到低分辨率排序的层次名为l1,l2,

lj,其中,lj层有p个分区,每个分区由k个l
j-1
层的子分区构成,则lj层的第p个分区的数据为:
[0034][0035][0036]
其中,ap1,ap2,apm分别表示第1,2,m个信号发射源,label表示所属分区的标签,除最后一行的每一行表示子分区的信号向量,最后一行表示所有子分区向量的平均向量,除最后一列的每一列表示ap的信号强度,最后一列表示数据的分区标签,表示l
j-1
层的第k个分区收到的第m个ap的信号强度值,是这k个l
j-1
分区代表向量在第m维ap的信
号强度的平均值,j=1,2,

j,j表示分辨率层数,p=1,2,

,p,m=1,2

,m,m表示信号发射源的总数。
[0037]
有益效果:针对现有分区数据之间缺乏差异度的问题,本技术采用由下层子分区的指纹集合构成上层分区的指纹方法,由于分区指纹能保留下层子分区更多的原始信息,从而增加各个分区的数据的差异度,提高定位系统的鲁棒性。
[0038]
优选地,所述多分辨率离线数据库中多分辨率从高分辨率到低分辨率排序的层次名为l1,l2,

lj,其中,lj层有p个分区,每个分区由k个l
j-1
层的子分区构成,则lj层的第p个分区的数据为:
[0039][0040]
其中,ap1,ap2,apm分别表示第1,2,m个信号发射源,f1,f
p
分别表示第1,p个辅助特征,label表示所属分区的标签,除最后一行的每一行表示子分区的指纹,最后一行表示所有子分区指纹的平均指纹,前m列的每一列表示ap的信号强度值,随后p列的每一列表示辅助特征的具体数值,最后一列表示数据的分区标签,表示l
j-1
层第k个分区收到的第m个ap的信号强度值,是这k个l
j-1
分区代表向量在第m维ap的信号强度的平均值,d
pq
表示特征或与自己的每个区的代表向量的欧式距离,j=1,2,

j,j表示分辨率层数,p=1,2,

,p,q=1,

,q,m=1,2

,m,q表示l
j-1
的分区总数,m表示信号发射源的总数。
[0041]
有益效果:针对现有指纹特征单一的问题,本技术采用不同分区信号强度向量的欧式距离来提取全局特征作为辅助特征,由于辅助特征可以提高指纹的分辨能力,从而增强定位系统的鲁棒性。
[0042]
为实现上述目的,按照本发明的第三方面,提供了一种多分辨率定位方法,所述定位方法包括:
[0043]
(1)按照自上而下的方式,从粗分辨率层到细分辨率层依次确定目标所属分区,用分类模型进行分类;
[0044]
(2)若用户自定义分辨率级别,在目标被分类到用户定义的分辨率级别的子区域之后,采用回归模型对目标用户进行最终精确定位;否则,在目标被分类到分辨率最高的子区域之后,采用回归模型对目标用户进行最终精确定位。
[0045]
优选地,步骤(1)包括以下子步骤:
[0046]
(1.1)形成目标用户的完整测试指纹
[0047]
其中,分别表示目标用户收到第1,2,

m个ap的信号强度,d
1t
,
…dpt
,

,d
pt
分别表示原始测试指纹与第p个分区指纹的向量距离;
[0048]
(1.2)基于目标用户的完整测试指纹,采用k最近邻的方法,找到离线数据库中最相近的指纹,将其对应的分区标识符作为目标用户的估计子区。
[0049]
有益效果:针对现有定位系统中的资源浪费的问题,本技术采用增加分辨率标识符来提前中止后续不必要的定位操作,能够降低计算复杂性、满足不同分辨率的需求,节省计算资源。此外,在没有标识符的情况下会自动遍历全部分辨率层,增加系统的普适性。
[0050]
为实现上述目的,按照本发明的第四方面,提供了一种多分辨率定位系统,包括:计算机可读存储介质和处理器;
[0051]
所述计算机可读存储介质用于存储可执行指令;
[0052]
所述处理器用于读取所述计算机可读存储介质中存储的可执行指令,执行第三方面所述的多分辨率定位方法。
[0053]
为实现上述目的,按照本发明的第五方面,提供了一种计算机可读存储介质,包括存储的计算机程序;所述计算机程序被处理器执行时,控制所述计算机可读存储介质所在设备执行上述方法。
[0054]
总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
[0055]
(1)针对现有众包样本标注错误、分布不均匀,本技术采用可靠性度量和曲面拟合均匀采样重新生成每个分区的众包样本,由于剔除不可靠样本可以保证数据库的质量;曲面拟合均匀采样可以保证众包的均匀分布,从而实现数据库的可靠性和稳定性。
[0056]
(2)针对现有数据库仅具有单层分辨率结构的问题,本技术采用自下而上的方式依次构建不同分辨率级别的数据库,由于将大型数据库划分为较小的不同分辨率级别的数据库组件,层次清晰的定位数据库能够加速在线指纹与离线指纹的匹配工作,从而为提高在线用户的定位速度奠定数据基础。
[0057]
(3)针对现有定位方法的无法满足用户多分辨率的需求问题,本技术采用自上而下对用户进行定位,由于每个层次的分区指纹都具有强代表性,所以在每层的分类上都有高准确性,从而满足不同分辨率的需求。
附图说明
[0058]
图1为本发明提供的一种基于wi-fi众包样本的多分辨率指纹定位系统流程图。
[0059]
图2为本发明实施例提供的多分辨率定位的架构图。
[0060]
图3为本发明实施例提供的自上而下的在线定位阶段示意图。
[0061]
图4为本发明实施例提供的hustdataset数据集示意图。
[0062]
图5为本发明实施例提供的ujindoorloc公开数据集示意图。
[0063]
图6为本发明实施例与其它机器学习算法在ujiindoorloc数据集中命中率对比图。
[0064]
图7为本发明实施例与其它机器学习算法在hustdataset数据集中随分辨率层次变化的命中效果对比图。
[0065]
图8为本发明实施例与其它对比方法的定位效果对比图。
具体实施方式
[0066]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0067]
本发明提出一种基于wi-fi众包样本的多分辨率指纹定位系统。通过构建多分辨率定位数据库结构,从低分辨率到高分辨率依次进行在线定位,能够有效降低大型数据库的计算复杂度;通过可靠性度量算法来识别可靠的众包样本,解决众包样本定位标签不准确的问题;本发明通过可靠样本构建曲面、重新采样以生成新的拟合样本,解决众包样本标签分布不均匀的问题;通过增加分区欧式距离的辅助特征,增加指纹的分辨率和定位系统的鲁棒性;通过合理结合分类和回归模型,在降低计算复杂度的同时提升不同分辨率情况下的定位精度。
[0068]
如图1所示,本发明提供了一种基于wi-fi众包样本的多分辨率指纹定位系统,该方法包括以下步骤:
[0069]
步骤s1.首先将目标区域拆分为多个分区,然后对每个分区更细一步拆分,直至到达拥有最高分辨率层次(最底层)。最后基于最底层的分区对众包样本进行初次分配。
[0070]
首先,本实施例根据建筑物固有的障碍物和墙壁进行分区,比如报告厅、办公室、餐厅等。之后,将每个分区进一步划分为具有网络结构的四个部分,接着,本实施例对该层的每一个分区进行下一个更高分辨率的分区,同样也分为四部分。最后,以相同的方式继续划分子区域,直到本实施例到达最高分辨率。称这种按分辨率从高到低的划分空间为不同分层,令多分辨率从高分辨率到低分辨率排序的层次名为l1,l2,

。如图2所示。
[0071]
在完成每个层次的分区划分后,将底层l1的每个分区作为基本栅格,根据众包样本的位置标注对众包样本进行基本的栅格分配。令这些基本栅格设为g
1,
,g2,

,gk,其中,k是l1的栅格数。设众包样本集为s={s1,s2,

,sn},sn=(r1,r2,

,rm,xn,yn),其中,n为众包样本的总数;m为ap的总数,(r1,r2,

,rm)为样本在坐标(xn,yn)处收集到的rss向量。在分配到具体的栅格后,每个众包样本都有额外的标签来标识其分配到的栅格序号,用表示被分配到第k个栅格的样本,令sk是分配给第k个网格的众包样本集。
[0072]
步骤s2.对每个分区众包样本进行可靠性度量,只保留可靠性大于阈值的可信众包样本。
[0073]
首先,本实施例可以计算众包样本和与它同属一个栅格中其它众包样本之间的平均信号距离:
[0074][0075]
其中,d(.)是两个众包样本之间的信号欧氏距离,计算方式为:
[0076][0077]
由于求和中不包含样本与自身的欧氏信号距离,即不包含所以除以|sk|-1来显示分配到其栅格的程度。该值越小代表与该栅格契合度越高。
[0078]
同样,本实施例可以计算众包样本与不同栅格中所有其他众包样本之间的平均信号距离。设是另一个网格中的任何其他众包样本,的计算为:
[0079][0080]
是相异度度量,平均相异度最小的栅格被称为的相邻网格。
[0081]
最后,计算众包样本的轮廓值:
[0082][0083]
轮廓值可转成以下形式:
[0084][0085]
从上式可以得出:如果轮廓值为时,他们与其他栅格的距离大于本身所属栅格的距离,因此,这些样本是不可靠的,本实施例将它们剔除。相反,如果轮廓值为则表明众包样本位置标注具有一定可靠性,予与保留。
[0086]
步骤s3.根据保留的可信众包样本进行曲面构建,然后在曲面中按固定间隔进行采样以生成拟合样本。
[0087]
首先利用剔除后的众包样本来拟合信号曲面。令所有可用ap的集合为a={ap1,ap2,

,apm}。本实施例应用多项式函数φm(x,y)来拟合给定分区中来自ap的无线信号传播表面。
[0088][0089]
其中,a
ij
是拟合系数,如果本实施例假设所有可靠的众包样本的可靠性值相等,那么目标函数是最小化平方残差的总和为:
[0090][0091]
但由于所有众包样本的可靠性值并不相等,因此不是最小化平方残差而是加权平方加权残差。样本的权重设置如下:
[0092]
设所有样本的轮廓值未剔除前为sh={h1,h2,

,hn}剔除后是sh′
={h1,h2,

,h
γ
},n是该分区中原众包样本的总数,γ为按照轮廓值的剔除后的可靠众包样本数。可靠众包样本的比率表示为令可靠性值集合中的最小和最大轮廓值min(sh′
)=h
min
和max(sh′
)=h
max
。本实施例使用缩放函数来保证[ρ,1]的范围,可靠性权重wn的缩放函数f(hn)是:
[0093][0094]
然后最小化平方加权残差总和的目标函数变为:
[0095][0096]
在构建无线信号传播曲面之后,可以利用函数φm(x,y)将任意坐标位置作为输入得到拟合的rss值,本实施例可以从构建的表面上按固定间隔进行采样作为新的拟合样本。设下采样后的样本集为ω={ψ1,ψ2,

,ψf},ψf=(ψ1,ψ2,

,ψm,xf,yf),(ψ1,ψ2,

,ψm)为在采样中心坐标(xf,yf)拟合rss向量。
[0097]
步骤s4.基于拟合样本,按照自下而上的方式来构建多分辨率离线数据库,由当前分辨率层的多个分区指纹集合得到上一分辨率层的一个分区指纹。
[0098]
本实施例用最底层l1得到上层l2的过程举例,后续的更高层过程类似。首先介绍l1的结构。令底层l1的分辨率分区的总数为q,q是这些分辨率分区之一。设q对应拟合样本集为为ω为l1层第q分区对应的下采样拟合样本数。l1分层q区的数据形式为一个ω
×
m的rssi矩阵。
[0099][0100]
接着计算γ
《l1,q>
的行均值向量作为该q区的代表向量。本实施例利用此代表向量来构造l2层的数据库。
[0101]
假设l2层有p个分区,每个分区由k个l1层的分区(u
《l1,1》
,u
《l1,2》
,

,u
《l1,k》
)构成。那么l2层的第p区的数据格式为:
[0102][0103]
其中,m=1,2

,m是这k个l1分区代表向量在第m维ap的平均值。它的计算方式如下:
[0104][0105]
值得注意的是,为l2层第p区的代表向量,成为后续构建更高层如l3的数据库的组件之一。
[0106]
为了增强指纹的分辨性,本实施例还为每个分区增加辅助特征。对于l2数据库的每个行向量来说,辅助特征为原来λ
《l2,p>
的特征u
《l1,q》
或u
《l2,p>
(q=1,

,q,p=1,

,p)与自己的每个区的代表向量u
《l2,p>
(p=1,

,p)的欧式距离,计算方式如下:
[0107][0108]
所以,增加辅助特征后的l2层第p区的数据为:
[0109][0110]
之后用相同的方法,分层聚合拥有较高分辨率的下层数据以形成上层数据直到最高层,形成自下而上的数据库结构。
[0111]
步骤s5.多分辨率在线定位阶段,按照自上而下的方式,从粗分辨率层到细分辨率层依次确定目标所属分区,用knn分类模型进行分类。
[0112]
数据库自上而下的金字塔结构可能使knn分类更容易,所以本实施例采用经典的knn分类方法进行多个分辨率下的分类。因为在线定位之前,已经构建好整个数据集,所以采用的knn模型不需要训练过程。
[0113]
多分辨率在线定位根据定义的分辨率级别要求处理在线请求。在经典的室内定位中,测试指纹只有来自ap的rss测量值。但是,在多分辨率在线定位情况下,测试指纹需要一个标识符来显示所需的分辨率级别。让f
t
表示测试指纹的rss测量值。
[0114][0115]
除了这个rss指纹之外,用户还需要在测试指纹中添加一个分辨率级别的需求标识符,形成如下形式:
[0116][0117]
对于每一层结构,每个分区都有形同的数据。当目标用户上传rss向量时,系统为目标用户计算辅助特征以生成完整测试指纹。如在l2层寻找子区,目标用户的完整测试指纹为:
[0118][0119]
其中,d
pt
为f
t
到u
《l2,p>
的欧氏距离。之后在l2层的所有区的数据中,找到最相似的指纹,将最相似的指纹对应的分区标识符《l2,p》作为目标用户的估计子区。
[0120]
如果没有给出级别标识,则假设要求为精确定位并分层遍历分类链,最后给出精确定位的数值,如图3所示。
[0121]
步骤s6.在目标被分类到分辨率最高的子区域之后,选择xgboost回归模型对目标用户进行最终精确定位。
[0122]
在最底层l1,每个子区都有一个数据库,比如第k分区的拟合样本为sk。这些样本用于训练回归模型,回归模型的输入为(r1,r2,

,rm),回归目标为(xn,yn)。本实施例采用xgboost作为回归模型进行精确定位,它是梯度提升算法gbdt的改进版本,能够提升性能的同时也提高计算速度。
[0123]
以下结合一个具体场景下的应用实例,对上述方法实施例所提供的一种基于wi-fi众包样本的多分辨率指纹定位系统做进一步的解释说明。
[0124]
在本实施例中,有两个数据集,第一个为hustdataset。它的目标区域如图4所示,对于每个样本,可以至少接收到70个ap的信号。在数据集采集的过程中,使用智能手机随机采集信号样本,然后分为训练数据和测试数据。最后,本实施例对样本的位置标签添加方差为0.6的高斯噪声以模拟hustdataset中带误差的众包样本。第二个数据集来自一个名为ujindoorloc的公共数据集。ujiindoorloc数据库涵盖了三栋建筑,如图5所示。
[0125]
本实施例首先对低分辨率下的分类性能进行评估,低分辨率是指拥有大面积的或具有明显物理边界的子区域,例如:建筑物、楼层和房间等。除了进行本实施例采取的knn算法的实验之外,本实施例还比较了其它高级机器学习增强算法,如xgboost、lightgbm。基于ujiindoorloc数据集的实验结果如图6所示,本实施例采用的knn算法拥有最高的命中率,能达到98%以上。这验证了本实施例提出方法在低分辨率的有效性,为后续的高分辨率奠定了基础。
[0126]
接着,本实施例再对高分辨率下的分类性能进行评估,高分辨率是指房间级之下的更加细粒度的分区结构。基于hustdataset数据集上的实验结果如图7所示,采用knn作为分类模型的表现优于其他模型,且随着层次的升高(层次越高分辨率越低),准确率会显著提高。
[0127]
最后,本实施例对不同方法的精确定位性能进行评估。本实施例基于hustdataset数据集设置了实验场景来测量所提出系统的精确定位性能,与其它基于众包的方法进行比
较。对比方案为与最近邻定位方法、专利cn109059919a的加权曲面定位方法和专利cn111474516a的多层次定位方法。图8展示了定位误差累积分布曲线。可以看到,本实施例提出的方法能够显著提升定位精度。此结果揭示了本实施例提出的按分辨率层层渐进的结构不仅能够提高区域的命中性能,也能提升精确的定位性能。
[0128]
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献