一种POI数据融合方法、装置及处理器与流程
- 国知局
- 2024-12-06 12:15:40
本技术涉及数据处理,特别是涉及一种poi数据融合方法、装置及处理器。
背景技术:
1、兴趣点(point of interest,poi)数据是兴趣点的有价值的语义信息源,在各行业细分领域中有许多地理空间相关应用。当前提供poi检索的服务较多,针对不同国家区域,数据覆盖及准确率情况不一,对此情况需进行poi融合。在进行poi融合时,会出现数据重复的情况。重复的poi数据可能导致数据库中存在冗余信息,从而降低整体数据的准确性。重复的信息还可能会对分析和应用产生负面影响。此外,当用户使用基于poi数据的服务时,重复的数据可能导致结果不一致或混乱,降低用户体验,并使用户难以获取准确的信息。
2、相关技术中对不同poi之间的poi数据相似程度计算是利用加权的方式进行计算,这种计算方式较为单一,难以准确高效地筛选出相同的poi数据,以降低数据重复率。
技术实现思路
1、基于上述问题,本技术提供了一种poi数据融合方法、装置及处理器,目的是准确高效地筛选出相同的poi数据,以降低数据重复率。
2、本技术实施例公开了如下技术方案:
3、一种poi数据融合方法,所述方法包括:
4、响应于目标用户的poi检索请求和所述目标用户的位置信息,确定检索区域;
5、获取所述检索区域内由多个数据源提供的多个目标poi和各个目标poi对应的目标poi数据;所述多个目标poi均对应同一个所述poi检索请求;所述目标poi数据包括标准poi数据;
6、基于点间距要求、所述多个目标poi和所述多个目标poi各自对应的标准poi数据,构建多个第一融合对;第一融合对内包括两个符合所述点间距要求的目标poi;所述两个目标poi之间的距离是根据所述标准poi数据进行计算得到的;
7、基于所述第一融合对内两个目标poi的兰氏距离,结合普斯特-沙费尔ds证据理论计算所述第一融合对内两个目标poi的相似概率;
8、基于所述相似概率对所述多个目标poi对应的目标poi数据进行融合处理,得到融合poi数据。
9、在一种可能的实现方式中,所述基于所述第一融合对内两个目标poi的兰氏距离,结合ds证据理论计算所述第一融合对内两个目标poi的相似概率,包括:
10、计算所述第一融合对内两个目标poi的相同类型的标准poi数据之间的相似度,得到所述多个标准数据相似度;
11、计算任意两个标准数据相似度之间的兰氏距离,得到多个兰氏距离;
12、基于所述多个兰氏距离,结合ds证据理论计算所述第一融合对内两个目标poi的相似概率。
13、在一种可能的实现方式中,所述标准poi数据的类型包括poi名称、poi地址和poi空间位置;
14、所述计算所述第一融合对内两个目标poi的相同类型的标准poi数据之间的相似度,得到所述多个标准数据相似度,包括:
15、利用贾罗-温克勒相似度算法计算出所述第一融合对内两个目标poi的poi名称的相似度,作为第一名称相似度;利用杰卡德系数计算出所述第一融合对内两个目标poi的poi名称的相似度,作为第二名称相似度;利用最长公共子串方法所述第一融合对内两个目标poi的poi名称的相似度,作为第三名称相似度;将所述第一名称相似度、所述第二名称相似度以及所述第三名称相似度进行加权求和得到目标名称相似度;
16、利用自然语言地址处理库分别去掉所述第一融合对内两个目标poi的poi地址的目标层级得到两个保留poi地址;抽取出两个所述保留poi地址中的标准格式内容得到两个标准poi地址;将两个所述标准poi地址进行向量化得到两个poi地址向量;计算两个所述poi地址向量之间的余弦相似度得到目标地址相似度;
17、计算所述第一融合对内两个目标poi的poi位置之间的欧氏距离;将所述欧氏距离的倒数通过指数函数映射到0~1区间内得到指数距离;在所述指数距离中引入常数参数,得到目标空间位置相似度;
18、其中,所述目标名称相似度、所述目标地址相似度以及所述目标空间位置相似度作为三个标准数据相似度。
19、在一种可能的实现方式中,所述基于所述相似概率对所述多个目标poi对应的目标poi数据进行融合处理,得到融合poi数据,包括:
20、将所述相似概率大于目标概率的所述第一融合对确定为第二融合对;
21、将任意两个具有相同目标poi的所述第二融合对进行首次去重组合得到融合组;
22、查询剩余未进行去重组合的所述第二融合对中是否存在与所述融合组相同的目标poi;若存在,则将具有与所述融合组相同目标poi的所述第二融合对与所述融合组进行二次去重组合得到新的融合组;
23、不断查询剩余未进行去重组合的所述第二融合对中是否存在与所述融合组相同目标poi,并进行多次去重组合,直至查询不到可以与所述融合组进行去重组合的第二融合对则停止;
24、持续对剩余未进行去重组合的所述第二融合对中任意两个具有相同目标poi的所述第二融合对进行所述首次去重组合、查询与融合组具有相同的目标poi的第二融合对、所述二次去重组合、不断查询与融合组具有相同的目标poi的第二融合对以及所述多次去重组合的步骤,直至查询不到具有相同目标poi的所述第二融合对则停止;
25、利用获得的融合组和/或无法与其他融合对组成融合组的所述第二融合对,对所述多个目标poi对应的目标poi数据进行融合处理得到融合poi数据。
26、在一种可能的实现方式中,所述利用获得的融合组和/或无法与其他融合对组成融合组的所述第二融合对,对所述多个目标poi对应的目标poi数据进行融合处理得到融合poi数据,包括:
27、依次将所述融合组和/或无法与其它融合对组成融合组的所述第二融合对中的所述目标poi作为查询poi;
28、查询所述查询poi对应的n个高级poi;所述高级poi为在同一个所述融合组或同一个所述第二融合对中数据源优先级高于所述查询poi的其他目标poi;n为非负整数;
29、确定所述查询poi的目标poi数据中与其对应的各个高级poi的目标poi数据的重复数据;
30、删除所述查询poi对应目标poi数据中的所述重复数据,得到待拼接poi数据;
31、将同一所述融合组或所述第二融合对的各个所述查询poi对应的待拼接poi数据进行拼接,得到所述融合poi数据。
32、在一种可能的实现方式中,当所述poi检索请求包括目标地点时,所述确定检索区域,包括:
33、以所述目标地点为圆心,根据预设半径在地图上选定所述检索区域;
34、或者,
35、当所述poi检索请求包括目标地点和非距离筛选条件时,所述确定检索区域,包括:
36、以所述目标地点为圆心,根据预设半径在地图上选定目标区域;
37、绘制所述目标区域的外接矩形,将地图上与所述外接矩形对应的区域作为所述检索区域;所述检索区域内至少包括符合所述非距离筛选条件的poi。
38、在一种可能的实现方式中,所述获取所述检索区域内由多个数据源提供的多个目标poi和各个目标poi对应的目标poi数据,包括:
39、获取所述检索区域内的所述多个数据源提供的多个初步poi和初步poi对应的所述目标poi数据;
40、基于过滤规则和所述初步poi对应的标准poi数据,对所述初步poi进行过滤删除得到多个目标poi。
41、在一种可能的实现方式中,所述目标poi数据还包括附加poi数据;
42、所述基于过滤规则和所述初步poi对应的标准poi数据,对所述初步poi进行过滤删除得到多个目标poi,包括:
43、删除所述多个初步poi中不具备所述标准poi数据只具备所述附加poi数据的初步poi,得到多个第一过滤poi;
44、删除所述多个第一过滤poi中被标记过的poi,得到多个第二过滤poi;所述被标记过的poi为已知融合有问题的poi;
45、根据所述poi检索请求中的距离筛选条件和/或非距离筛选条件对所述第二过滤poi进行过滤,得到所述目标poi。
46、一种poi数据融合装置,所述装置包括:
47、第一确定单元,响应于目标用户的poi检索请求和所述目标用户的位置信息,用于确定检索区域;
48、第一获取单元,用于获取所述检索区域内由多个数据源提供的多个目标poi和各个目标poi对应的目标poi数据;所述多个目标poi均对应同一个所述poi检索请求;所述目标poi数据包括标准poi数据;
49、构建单元,用于基于点间距要求、所述多个目标poi和所述多个目标poi各自对应的标准poi数据,构建多个第一融合对;第一融合对内包括两个符合所述点间距要求的目标poi;所述两个目标poi之间的距离是根据所述标准poi数据进行计算得到的;
50、第一计算单元,用于基于所述第一融合对内两个目标poi的兰氏距离,结合普斯特-沙费尔ds证据理论计算所述第一融合对内两个目标poi的相似概率;
51、第一融合单元,用于基于所述相似概率对所述多个目标poi对应的目标poi数据进行融合处理,得到融合poi数据。
52、一种处理器,用于运行计算机程序,所述程序运行时执行如上所述的poi数据融合方法。
53、相较于现有技术,本技术具有以下有益效果:
54、本技术实施例在接收到目标用户的poi检索请求和位置信息时基于位置信息和poi检索请求确定检索区域。接着,确定检索区域内由多个数据源提供的多个目标poi和各个目标poi对应的目标poi数据。然后基于点间距要求、多个目标poi和多个目标poi各自对应的标准poi数据构建多个第一融合对,并基于第一融合对内两个目标poi的兰氏距离结合ds证据理论计算第一融合对内两个目标poi的相似概率。最后基于相似概率将目标poi对应的目标poi数据进行融合,得到融合poi数据。本技术引入兰氏距离作为判断两个目标poi之间相似概率的度量标准,相比于传统的ds理论,这种改进可以更精确地评估两个poi之间的相似概率,避免了常规ds理论中可能出现的反直觉问题。同时,引入ds证据理论能够有效地结合不同证据(即不同标准数据的相似度)来计算poi之间的相似概率。相比传统方法,这种证据的融合能够更精确地反映poi之间的实际相似性,避免了单一权重分配可能带来的偏差。
本文地址:https://www.jishuxx.com/zhuanli/20241204/340292.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表