一种道路网多用户偏好异类组合Skyline查询方法
- 国知局
- 2024-09-11 15:05:44
本发明涉及skyline查询,具体是一种道路网多用户偏好异类组合skyline查询方法。
背景技术:
1、skyline查询在多目标决策、推荐系统、互联网、大数据分析和挖掘、物联网数据查询等领域发挥着关键作用。随着大数据和云计算技术的发展,skyline查询的应用范围和效率得到了进一步显著提升。
2、在一个多维数据集中,传统skyline查询返回不被其他点支配的点,即相较于其他所有点,至少在一个维度上更优并且在每个其他维度上至少同样优的点组成。然而,随着skyline查询在多目标决策领域的不断发展,用户往往需要获得的是一组点组合而不仅仅是单个点。因此,组合skyline查询应运而生,有效解决了这一问题,组合skyline查询返回所有不被其他组合支配的组合。举一个skyline查询中的经典例子,在某公司的团建活动中,活动组织者需要为员工预定酒店,预定时需要综合考虑酒店距活动地点的距离和酒店价格。因此,可以对周围的酒店进行skyline查询,找到在距离属性和价格属性不被支配的酒店。假设现在活动组织者需要预定一组酒店,并同时考虑距离维度和价格维度,传统skyline查询便无法满足查询出组合的需求。此时,应用组合skyline查询即可找到不被支配的酒店组合,从而更好地支持决策。
3、近年来,随着基于位置服务技术的不断创新和普及,针对道路网上的查询需求急剧增长。然而,传统的组合skyline查询只能比较道路网中相同类型的数据点构成组合以确定支配关系。在实际道路网中,存在大量不同类型的数据点,这些数据点无法进行传统意义上支配关系的比较。
技术实现思路
1、(1) 获取包括m种的兴趣点数据集p,并接收包括n个查询点的查询用户组合q,其中兴趣点数据集p={p1, p2, …},对于每个兴趣点p,p=(p.type, p.eij, p.dist),p.type表示p点的兴趣点类型,p.eij表示p点在道路网中的边为eij,p.dist表示p点距道路网中顶点vi和vj较短的距离,查询用户组合q={q1, q2, …, qn},对于q中每个查询用户q,q=(q.eij, q.dist, q.vec),q.vec为该点的偏好向量;
2、(2) 将查询用户组合q中所有查询用户的偏好向量进行相加,构建整体偏好向量vecq,遍历兴趣点数据集p,通过兴趣点的类型对数据集进行分桶处理,同时排除整体偏好向量小于0所对应的兴趣点,获得一组按照兴趣点偏好次序排列的桶,其中,桶为一种存储结构,同一桶内存储相同类型的兴趣点;
3、(3) 对桶中所有点进行skyline支配关系判断,将得到的skyline集合加入到skyline桶中,将非skyline集合加入到非skyline桶中,构建非skyline桶哈希表,其中,非skyline桶哈希表为一种键值对存储结构,用于存放非skyline桶中的skyline支配关系,该哈希表的键存放被支配的对象,值存放支配对象;
4、(4) 对所有skyline桶中的点进行笛卡尔积,将形成的skyline桶组合加入到可行性解集gr中,初始化mindp数组,根据状态转移方程进行动态规划算法,找到skyline桶组合中的最小值mindist;
5、(5) 对所有非skyline桶中的点进行笛卡尔积,将形成的组合加入到中间变量gtemp集合中,遍历gtemp集合判断组合中的点是否均在公共支配区域内,若均在公共支配区域内,且距离成本小于步骤(4)中的mindist,则将该组合加入到可行性解集gr中,将不满足的组合从gr中移除;
6、(6) 遍历gtemp集合,将gtemp中组合g中点p的非skyline哈希表的值加入到临时桶tempbucket中,对tempbucket执行步骤(4)中的动态规划算法求得tempmindist,将距离成本dist(q, g)与tempmindist进行比较,若dist(q, g)<tempmindist,则将g加入到可行性解集gr中,返回最终的可行性解集gr;
7、(7) 步骤(6)中计算dist(q, g)时,通过wg索引结构进行计算,wg索引中叶子节点存储道路网中的所有兴趣点、兴趣点和边界点的距离矩阵以及弱兴趣点,非叶子节点存储边界点、边界点之间的距离矩阵、以及弱兴趣点。
8、优选地,步骤(4)所述mindp数组的状态转移方程采取以下公式:
9、
10、其中,skylinebucketi表示skyline桶,1≤j≤skylinebucketi.size,1≤k≤skylinebucketi-1size,二维数组mindp[i][j]来表示从第i个skyline有序桶中选择第j个点时此时构成的兴趣点组合的最小距离成本,dist()表示括号内两个对象的道路网距离。
11、优选地,步骤(5)所述的距离成本dist(q, g)采取以下公式:
12、
13、dist(q, g)为两个部分的和,第一个部分为所有查询用户到可行性解集第一个兴趣点的距离,第二个部分为从第一个兴趣点到最后一个兴趣点所经过的距离。
14、优选地,步骤(7)所述的弱兴趣点为,给定一个道路网子图graphi内的任意兴趣点p1,若对于graphi内的所有边界点,将该点作为查询点,均存在另一个兴趣点p2,满足p2道路网支配p1,那么称p1为子图graphi的弱兴趣点。
15、总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
16、(1) 本发明采用的多用户偏好异类组合skyline查询方法能相较于传统组合skyline查询,该查询考虑到了道路网中存在大量不同类型的兴趣点的情况,更能够满足用户的实际查询需求;
17、(2) 针对道路网中存在大量不同类型的兴趣点,在进行道路网异类组合支配关系判断时需要对组合中各兴趣点之间的道路网距离进行大量计算,产生较大开销的问题,本发明使用一种基于动态规划的距离成本计算方法。该方法无需计算所有组合的空间距离成本,结合所提skyline有序桶组合和非skyline桶组合能够提前快速剪枝掉大量无法构成可行性解集的组合。同时,本发明使用一种wg索引结构,wg索引能够在计算组合的道路网距离时结合所提定理提前对组合进行支配关系判断以过滤非可行性解,高效计算组合的空间距离成本;
18、(3) 在道路网skyline查询中,较少考虑多用户的情况,以及较少考虑所有用户的偏好问题,本发明通过用户的偏好向量,综合考虑所有用户的偏好,并以此对兴趣点集进行分桶操作。
技术特征:1.一种道路网多用户偏好异类组合skyline查询方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种道路网多用户偏好异类组合skyline查询方法,其特征在于,步骤(4)所述的状态转移方程采取公式:
3.根据权利要求1所述的一种道路网多用户偏好异类组合skyline查询方法,其特征在于,步骤(5)所述的公共支配区域为,给定一个skyline有序桶,该桶的公共支配区域是一个桶中所有skyline点共同支配的区域构成。
4. 根据权利要求1所述的一种道路网多用户偏好异类组合skyline查询方法,其特征在于,步骤(5)所述的距离成本dist(q, g)采取公式:
5.根据权利要求1所述的一种道路网多用户偏好异类组合skyline查询方法,其特征在于,步骤(7)所述的弱兴趣点为,给定一个道路网子图graphi内的任意兴趣点p1,若对于graphi内的所有边界点,将该点作为查询点,均存在另一个兴趣点p2,满足p2道路网支配p1,那么称p1为子图graphi的弱兴趣点。
技术总结本发明公开了一种道路网多用户偏好异类组合Skyline查询方法,设计用于找到道路网内不被支配的兴趣组合,这些组合由不同类型的兴趣点构成。首先,该方法利用多用户的偏好向量对兴趣点数据集进行分桶,以快速确定所有兴趣点类型;接着,依据Skyline有序桶和公共支配区域等理论,并利用所提动态规划算法,有效排除大量不能构成结果集的组合,从而得到查询结果集。此外,为了提升查询时距离运算速度,本发明设计了一种WG索引结构,该结构能够根据弱兴趣点进行剪枝同时加快距离计算效率。技术研发人员:李松,张昕源,杨晓龙受保护的技术使用者:哈尔滨理工大学技术研发日:技术公布日:2024/9/9本文地址:https://www.jishuxx.com/zhuanli/20240911/293166.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。