一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

停留位置的确定方法和装置、存储介质及电子设备与流程

2022-03-23 00:54:02 来源:中国专利 TAG:


1.本发明涉及计算机领域,具体而言,涉及一种停留位置的确定方法和装置、存储介质及电子设备。


背景技术:

2.相关技术中,居民职住地识别为城市所面临的职住分离、交通拥堵等一系列问题提供了数据支撑。目前,职住地识别主要是基于运营商的信令数据,而信令数据的定位经度往往是几百米甚至是上千米,主要是用于较大区域级别职住研究,很难支持细粒度的职住分析。另外,现有技术中对职住地识别的研究主要是基于作息时间段进行区分,忽略了居民个体的差异性,难以大规模地从个体层面对职住地进行识别。
3.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本发明实施例提供了一种停留位置的确定方法和装置、存储介质及电子设备,以至少解决职住地识别准确率低的技术问题。
5.根据本发明实施例的一个方面,提供了一种停留位置的确定方法,包括:获取目标帐号的多个停留簇,其中,每个所述停留簇中包括对所述目标帐号所在的移动终端进行定位得到的、所述目标帐号所停留的位置;对所述多个停留簇中的位置进行聚类,得到多个聚类簇,其中,每个所述聚类簇中包括至少一个所述停留簇中的部分或全部位置;根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,其中,所述目标维度特征与目标场所对应;根据所述目标聚类簇确定目标位置,其中,所述目标位置为所述目标帐号在所述目标场所中的停留位置。
6.可选地,所述获取目标帐号的多个停留簇,包括:获取目标定位信息集合,其中,所述目标定位信息集合包括对所述目标帐号所在的移动终端进行定位得到的位置,以及每个位置的定位时间点;根据所述目标定位信息集合中的每个位置的定位时间点,在所述目标定位信息集合中提取出所述多个停留簇,其中,每个停留簇包括所述定位信息集合中的至少两个位置,所述每个停留簇的中心位置与所述每个停留簇中除所述中心位置之外的其他位置之间的距离小于或等于预设距离,在所述每个停留簇中的位置所对应的定位时间点中,时间上相邻的两个定位时间点之间的时间差小于或等于预设时长。
7.可选地,所述根据所述目标定位信息集合中的所述每个位置的定位时间点,在所述目标定位信息集合中提取出所述多个停留簇,包括:根据所述目标定位信息集合中的所述每个位置的定位时间点,将所述目标定位信息集合中的位置划分为n个目标位置子集,其中,每个目标位置子集中的位置的定位时间点位于多个单位时间段中对应的一个单位时间段内,所述目标定位信息集合中的位置包括在所述多个单位时间段内对所述移动终端进行定位得到的位置,n大于或等于1;根据所述n个目标位置子集中的位置的定位时间点,分别在所述n个目标位置子集中的每个目标位置子集中提取出停留簇,共得到n组停留簇,其中,
每个目标位置子集对应于一组停留簇;在所述n组停留簇中提取出所述多个停留簇。
8.可选地,所述根据所述n个目标位置子集中的位置的定位时间点,分别在所述n个目标位置子集中的每个目标位置子集中提取停留簇,包括:对所述n个目标位置子集中的每个目标位置子集执行以下操作,在执行以下操作时,每个目标定位子集称为当前位置子集:根据所述当前位置子集中每个位置的定位时间点,在所述当前位置子集中提取出当前的一组停留簇,其中,所述当前的一组停留簇中的每个停留簇包括所述当前位置子集中的至少两个位置,所述当前的一组停留簇中的每个停留簇的中心位置与所述每个停留簇中除所述中心位置之外的其他位置之间的距离小于或等于所述预设距离,在所述当前的一组停留簇中的每个停留簇中的位置所对应的定位时间点中,时间上相邻的两个定位时间点之间的时间差小于或等于所述预设时长。
9.可选地,所述在所述n组停留簇中提取出所述多个停留簇,包括:在所述n组停留簇中提取出m个停留簇,其中,所述m个停留簇中的位置之间的距离小于预设阈值,且m大于或等于预设数量,或者,m与n的比值大于或等于预设比值,所述m个停留簇中的每个停留簇中的位置的定位时间点位于所述多个单位时间段中对应的一个单位时间段内。
10.可选地,所述对所述多个停留簇进行聚类,得到所述多个聚类簇,包括:获取所述多个停留簇中每个停留簇的中心位置,得到中心位置集合;根据所述中心位置集合中的中心位置,对所述多个停留簇中的位置进行聚合,得到所述多个聚类簇。
11.可选地所述根据所述中心位置集合中的中心位置,对所述多个停留簇中的位置进行聚合,包括:获取所述中心位置集合中第i个中心位置的第i个邻域,其中,i为大于或等于1的正整数,所述第i个邻域是以所述第i个中心位置为圆心,预设长度为半径形成的区域;在所述第i个邻域内包含的所述多个停留簇中的位置的数量大于或等于预设数量的情况下,将所述第i个邻域内包含的所述多个停留簇中的位置确定为第i个聚类簇中的位置,其中,所述多个聚类簇包括所述第i个聚类簇。
12.可选地,在所述将所述第i个邻域内的位置确定为第i个聚类簇中的位置之后,所述方法还包括:获取目标定位集合中位于所述第i个邻域内的剩余位置,其中,所述目标定位集合中包括对所述目标帐号所在的移动终端进行定位得到的位置,所述多个停留簇是在所述目标定位集合中提取出的停留簇,所述剩余位置是所述目标位置集合中未位于所述多个停留簇中的位置;将所述剩余位置中的部分或全部位置添加至所述第i个聚类簇。
13.可选地,所述根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,包括:在所述目标维度特征包括多个维度特征时,确定所述每个聚类簇的所述多个维度特征各自对应的特征值;根据所述每个聚类簇的所述多个维度特征各自对应的特征值,确定所述每个聚类簇的停留参数的取值,其中,所述每个聚类簇的停留参数的取值用于表示所述每个聚类簇中的位置位于所述目标场所中的概率;将所述多个聚类簇中停留参数的取值最高的聚类簇,确定为所述目标聚类簇。
14.可选地,所述根据所述每个聚类簇的所述多个维度特征各自对应的特征值,确定所述每个聚类簇的停留参数的取值,包括:将所述每个聚类簇的所述多个维度特征各自对应的特征值的乘积,确定为所述每个聚类簇的停留参数的取值;或者,将所述每个聚类簇的所述多个维度特征各自对应的特征值的和,确定为所述每个聚类簇的停留参数的取值;或者,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每
个聚类簇的停留参数的取值。
15.可选地,所述将所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,包括以下之一:在所述多个维度特征包括所述每个聚类簇中的位置对应的定位时间点和所述位置上所述移动终端的网络连接方式时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述网络连接方式对应的权重值;在所述多个维度特征包括所述每个聚类簇中的位置对应的定位时间点和所述位置所在的预设区域范围内的建筑物类型时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述建筑物类型对应的权重值;在所述多个维度特征包括所述每个聚类簇中的位置对应的定位时间点、所述位置上所述移动终端的网络连接方式和所述位置所在的预设区域范围内的建筑物类型时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述网络连接方式对应的权重值和所述建筑物类型对应的权重值。
16.可选地,所述确定所述每个聚类簇的所述多个维度特征各自对应的特征值,包括以下至少两个:根据所述每个聚类簇中的位置对应的定位时间点,确定所述每个聚类簇在时段覆盖上的特征值,其中,所述多个维度特征包括所述位置对应的定位时间点,所述每个聚类簇中包含的在预设时间段内定位得到的位置的数量越多,特征值越大,所述多个时间段包括所述预设时间段;根据在所述每个聚类簇中的位置上所述移动终端的网络连接方式,确定所述每个聚类簇在网络连接上的特征值,其中,所述多个维度特征包括所述位置上所述移动终端的网络连接方式,所述每个聚类簇中包含的第一类型的位置的数量越多,权重越大,在所述第一类型的位置上所述移动终端的网络连接方式为wifi连接方式;根据所述每个聚类簇中的位置所在的预设区域范围内的建筑物类型,确定所述每个聚类簇在建筑物类型上的特征值,其中,所述多个维度特征包括所述位置所在的预设区域范围内的建筑物类型,所述每个聚类簇中包含的第二类型的位置的数量越多,特征值越大,所述第二类型的位置所在的所述预设区域范围内存在办公类型建筑,且所述第二类型的位置与所述办公类型建筑之间的距离小于或等于第一预设距离,或者,所述第二类型的位置所在的所述预设区域范围内存在居住类型建筑,且所述第二类型的位置与所述居住类型建筑之间的距离小于或等于第二预设距离。
17.可选地,所述根据所述目标聚类簇确定目标位置,包括以下之一:将所述目标聚类簇中每个位置的经度的均值确定为目标经度,并将所述目标聚类簇中每个位置的纬度的均值确定为目标纬度;将所述目标经度和所述目标维度上的位置确定为所述目标位置;将所述目标聚类簇中每个位置的经度的均值确定为目标经度,并将所述目标聚类簇中每个位置的纬度的均值确定为目标纬度;将所述目标聚类簇中与预设位置距离最小的位置确定为所述目标位置,其中,所述预设位置是所述目标经度和所述目标维度上的位置;在所述目标聚类簇中确定所述目标位置,其中,所述目标位置所在的局部区域内的所述目标聚类簇中的位置的密度最高。
18.根据本发明实施例的另一方面,还提供了一种停留位置的确定装置,包括:获取模
块,用于获取目标帐号的多个停留簇,其中,每个所述停留簇中包括对所述目标帐号所在的移动终端进行定位得到的、所述目标帐号所停留的位置;聚类模块,用于对所述多个停留簇中的位置进行聚类,得到多个聚类簇,其中,每个所述聚类簇中包括至少一个所述停留簇中的部分或全部位置;第一确定模块,用于根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,其中,所述目标维度特征与目标场所对应;第二确定模块,用于根据所述目标聚类簇确定目标位置。
19.根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述停留位置的确定方法。
20.根据本技术实施例的又一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上停留位置的确定方法。
21.根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的停留位置的确定方法。
22.在本发明实施例中,通过对移动终端进行定位得到目标帐号的位置,得到目标位置集合,在目标位置集合中提取出多个停留簇。将多个停留簇中的位置进行聚合得到多个聚类簇,并通过多个聚类簇中的位置的特征,在多个聚类簇中确定出目标聚类簇,通过目标聚类簇中的位置确定目标帐号的停留位置。相比于现有技术中通过运营商的信令数据进行定位,本技术是通过移动终端进行定位,定位准确度更高。进而解决了职住地识别准确率低的技术问题。
附图说明
23.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
24.图1是根据本发明实施例的一种可选的停留位置的确定方法的应用环境的示意图;
25.图2是根据本发明实施例的一种可选的停留位置的确定方法的流程图;
26.图3是根据本发明实施例的一种可选的停留簇示意图;
27.图4是根据本发明实施例的另一种可选的停留簇示意图;
28.图5是根据本发明实施例的又一种可选的停留簇示意图;
29.图6是根据本发明实施例的一种可选的聚类簇示意图;
30.图7是根据本发明实施例的又一种可选的聚类簇示意图;
31.图8是根据本发明实施例的又一种可选的聚类簇示意图;
32.图9是根据本发明实施例的一种可选的结果展示示意图;
33.图10是根据本发明实施例的一种可选的停留位置的确定装置的结构示意图;
34.图11是根据本发明实施例的一种可选的电子设备的结构示意图;
35.图12是根据本发明实施例的一种可选的电子设备的计算机系统结构框图。
具体实施方式
36.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
37.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
38.可以理解的是,在本技术的具体实施方式中,涉及到用户信息、用户的位置等相关的数据,当本技术以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
39.根据本发明实施例的一个方面,提供了一种停留位置的确定方法,可选地,作为一种可选的实施方式,上述停留位置的确定方法可以但不限于应用于如图1所示的应用环境中。上述应用环境中包括:移动终端102、网络110和服务器112。其中,移动终端102中包括存储器104、处理器106和显示器108。存储器104用于存储数据,包括但不限于对目标帐号进行定位得到的位置。上述处理器包括但不限于定位装置,用于对移动终端进行定位,上述显示器可以用于显示对移动终端进行定位得到的位置。
40.可选地,在本实施例中,上述终端设备可以是配置有目标客户端的终端设备,可以包括但不限于以下至少之一:手机(如android手机、ios手机等)、笔记本电脑、平板电脑、掌上电脑、mid(mobile internet devices,移动互联网设备)、pad、智能语音交互设备、智能家电、车载终端等。目标客户端可以是视频客户端、即时通信客户端、浏览器客户端、导航客户端、游戏客户端等。
41.上述网络110可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、wifi及其他实现无线通信的网络。
42.上述服务器中包括数据库114和处理引擎116,其中上述数据库114用于存储数据,包括但不限于对移动终端进行定位得到的位置,上述处理引擎用于对数据进行处理,包括但不限于用于执行以下步骤:
43.步骤s101,获取目标帐号的多个停留簇,其中,每个所述停留簇中包括对所述目标帐号所在的移动终端进行定位得到的、所述目标帐号所停留的位置;
44.步骤s102,对所述多个停留簇中的位置进行聚类,得到多个聚类簇,其中,每个所述聚类簇中包括至少一个所述停留簇中的部分或全部位置;
45.步骤s103,根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,其中,所述目标维度特征与目标场所对应;
46.步骤s104,根据所述目标聚类簇确定目标位置,其中,所述目标位置为所述目标帐
号在所述目标场所中的停留位置。
47.上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
48.下面对本技术中涉及到的关键词进行说明:
49.dbscan:(density-based spatial clustering of applications with noise)是一种基于密度的聚类算法,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇。
50.停留簇:对于一组连续的定位点,满足在一定时间内在一定的空间范围之内形成的定位点集合。
51.聚类簇:由在一定空间范围之内的不同停留簇空间聚合形成的定位点集合。
52.可选地,作为一种可选的实施方式,如图2所示,上述停留位置的确定方法包括:
53.步骤s202,获取目标帐号的多个停留簇,其中,每个所述停留簇中包括对所述目标帐号所在的移动终端进行定位得到的、所述目标帐号所停留的位置;
54.其中,上述目标帐号登录于上述移动终端,可以通过目标客户端登录移动终端,也可以直接登录移动终端。通过目标客户端登录移动终端时,上述目标帐号是目标客户端的登录帐号,例如即时通讯客户端的登录帐号、游戏客户端的登录帐号等。直接登录移动终端时,可以是移动终端的登录帐号,例如手机登录帐号、电脑登录帐号等。
55.步骤s204,对所述多个停留簇中的位置进行聚类,得到多个聚类簇,其中,每个所述聚类簇中包括至少一个所述停留簇中的部分或全部位置;
56.其中,上述停留簇中包括多个位置,对多个停留簇中的位置进行聚类,得到多个聚类簇,每个聚类簇中包括多个位置
57.步骤s206,根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,其中,所述目标维度特征与目标场所对应;
58.其中,上述目标维度特征可以包括时段特征、网络连接方式,以及建筑物类型等。上述目标场所可以是办公场所,也可以是居住场所。目标维度特征与目标场所对应,例如,办公场所的时段特征通常是上午九点到下午六点,网络连接方式通常是wifi连接,建筑物类型通常是写字楼。居住场所的时段特征通常是晚上八点到上午八点,网络连接方式通常是wifi连接,建筑物类型通常是小区。
59.步骤s208,根据所述目标聚类簇确定目标位置,其中,所述目标位置为所述目标帐号在所述目标场所中的停留位置。
60.其中,上述停留位置可以是目标帐号的居住地,也可以是目标帐号的办公地。
61.可选地,所述获取目标帐号的多个停留簇,包括:获取目标定位信息集合,其中,所述目标定位信息集合包括对所述目标帐号所在的移动终端进行定位得到的位置,以及每个位置的定位时间点;根据所述目标定位信息集合中的每个位置的定位时间点,在所述目标定位信息集合中提取出所述多个停留簇,其中,每个停留簇包括所述定位信息集合中的至少两个位置,所述每个停留簇的中心位置与所述每个停留簇中除所述中心位置之外的其他位置之间的距离小于或等于预设距离,在所述每个停留簇中的位置所对应的定位时间点中,时间上相邻的两个定位时间点之间的时间差小于或等于预设时长。
62.作为一个可选的实施方式,上述目标定位信息集合中包括对移动终端进行定位得
到的位置,以及与该位置对应的定位时间点。假设在t1时间点对移动终端进行定位得到位置p1,则目标定位信息集合中记录了位置p1与定位时间t1的对应关系。如图3所示的目标定位信息集合中记录了p1与t1、p2与t2,以及pn与tn的对应关系。
63.对目标定位信息集合中的位置进行预处理,初步进行过滤,并提取出停留簇,可以过滤掉目标帐号的非停留位置,例如,户外运动的位置。也可以根据目标定位信息集合中每个位置的定位时间,对目标定位信息集合中的位置进行抽稀处理,预设时间段内定位得到的位置保留预定数量个位置。例如,5分钟时间段内仅保留一个位置点,或者10分钟内仅保留3个位置。这样可以防止在非停留位置对目标帐号定位得到的位置过密,对停留位置判别的影响。目标帐号的停留地在不同天中是保持相对稳定的,例如,通常情况下,在周一至周五的上午九点到下午六点,目标帐号通常是在办公地,周一至周日的晚上十点到第二天早晨七点目标帐号通常是在居住地。因此短时间定位点的抽稀处理不会影响正常职住地的判断。
64.作为一个可选的实施方式,如图3所示是根据本发明可选实施例的停留簇示意图,如图中所示的目标定位信息集合中记录了对移动终端定位得到的位置,以及与位置对应的定位时间的对应关系,其中,每个位置通过经度和维度来确定,例如,位置p1的经度为图中所示的lon1,维度为lat1。根据目标定位信息集合中每个位置的经纬度在图中示意出目标定位信息集合中的每个位置,如图中所示的p1、p2

pn在图中所示的位置。在图中所示的p1、p2

pn中提取出停留簇,停留簇中的位置满足以下条件:
65.(1)每个停留簇中的中心位置与其他位置之间的距离小于或等于预设距离,distance(pm,pi)≤δd,其中,pm是停留簇的中心位置,pi是停留簇中的其他位置,m《i≤n,δd为预设距离,可以根据实际情况设置,例如1米、2米、5米等。如图3中所示的中p4是停留簇1的中心位置,δd是图中所示停留簇1所示的圆形区域的半径,p3和p5与p4的距离均小于δd,停留簇1中包括p3、p4和p5。
66.(2)每个停留簇中包括的位置数量至少是两个,以此过滤掉在户外运动的零散的位置。
67.(3)时间上相邻的两个定位点之间的时间差小于或等于预设时长δt,预设时长δt可以根据实际情况而定,例如10分钟,20分钟等。以此保证每个聚类簇中的定位得到的位置在时间上的连续性。如图3中所示的停留簇1中的p3的定位时间是t3,p4的定位时间是t4,p5的定位时间是t5,t4-t3《δt,t5-t4《δt。
68.通过基于上述条件,在目标定位信息集合中提取出多个停留簇,可以过滤掉目标定位信息集合中在非停留位置定位得到的位置,进而可以提高停留地的识别准确率。
69.可选地,所述根据所述目标定位信息集合中的所述每个位置的定位时间点,在所述目标定位信息集合中提取出所述多个停留簇,包括:根据所述目标定位信息集合中的所述每个位置的定位时间点,将所述目标定位信息集合中的位置划分为n个目标位置子集,其中,每个目标位置子集中的位置的定位时间点位于多个单位时间段中对应的一个单位时间段内,所述目标定位信息集合中的位置包括在所述多个单位时间段内对所述移动终端进行定位得到的位置,n大于或等于1;根据所述n个目标位置子集中的位置的定位时间点,分别在所述n个目标位置子集中的每个目标位置子集中提取出停留簇,共得到n组停留簇,其中,每个目标位置子集对应于一组停留簇;在所述n组停留簇中提取出所述多个停留簇。
70.作为一个可选的实施方式,目标帐号的停留位置在不同天中是保持相对稳定的,单位时间段可以是一天。n个目标位置子集对应的是n天的定位得到的位置,每个目标位置子集中记录的是一天定位得到的位置。对每天定位得到的目标位置子集中提取出一组停留簇,n天对应的n个目标位置子集中提取出n组停留簇。如图4中所示的n个目标位置子集中包括第1个目标位置子集、第2个目标位置子集,以及第n个目标位置子集,n的值与单位时间段的数量对应。假设单位时间段是以天为单位,n对应的是天数为n。n的值可以根据实际情况而定,例如对一周的定位位置进行统计的情况下,n对应为7。图中所示的第1个目标位置子集中记录的是第1天对移动终端进行定位得到的位置,第n个目标位置子集中记录的是第7天对移动终端进行定位得到的位置。在n个目标位置集合中的每个位置集合中提取出一组停留簇,如图4中所示的在第1个目标位置子集中提取出的第一组停留簇中包括停留簇1和停留簇2,在第2个目标位置子集中提取出的第二组停留簇中包括停留簇3和停留簇4,在第n个目标位置集合中提取出的第n组停留簇中包括停留簇5、停留簇6和停留簇7。
71.作为一个可选的实施方式中,目标帐号某天可能在其他地方(非居住地,或非办公地)停留过,例如,目标帐号在商场或者酒店停留过,以此形成的停留簇会对居住地或办公地识别造成影响。在本实施例中可以在多天的停留簇中滤除特殊的停留簇。以图4所示为例,假设n个目标位置子集对应于n天定位得到的位置,从图中可以看出第1天定位得到的第1个目标位置子集中提取出的第1组停留簇中包括两个停留簇(停留簇1和停留簇2),第2天定位得到的第2个目标位置子集中提取出的第2组停留簇中包括两个停留簇(停留簇3和停留簇4),第n天定位得到的第n个目标位置子集中提取出的第n组停留簇中包括两个停留簇(停留簇5、停留簇6和停留7)。第n组停留簇中包括的停留簇的数量与其他组停留簇中包含的停留簇的数量,第n组停留簇中包括特殊的停留簇,在本实施例中,通过n组停留簇的比对,可以将n组停留簇中特殊的停留簇滤除,以此提高职住地的识别准确性。
72.可选地,所述根据所述n个目标位置子集中的位置的定位时间点,分别在所述n个目标位置子集中的每个目标位置子集中提取停留簇,包括:对所述n个目标位置子集中的每个目标位置子集执行以下操作,在执行以下操作时,每个目标定位子集称为当前位置子集:根据所述当前位置子集中每个位置的定位时间点,在所述当前位置子集中提取出当前的一组停留簇,其中,所述当前的一组停留簇中的每个停留簇包括所述当前位置子集中的至少两个位置,所述当前的一组停留簇中的每个停留簇的中心位置与所述每个停留簇中除所述中心位置之外的其他位置之间的距离小于或等于所述预设距离,在所述当前的一组停留簇中的每个停留簇中的位置所对应的定位时间点中,时间上相邻的两个定位时间点之间的时间差小于或等于所述预设时长。
73.作为一个可选的实施方式,上述一组停留簇中的每个停留簇满足以下条件:
74.(1)每个停留簇中的中心位置与其他位置之间的距离小于或等于预设距离,distance(pm,pi)≤δd,其中,pm是停留簇的中心位置,pi是停留簇中的其他位置,m《i≤n,δd为预设距离,可以根据实际情况设置,例如1米、2米、5米等。假设图4中的第1个目标位置子集是当前位置子集,如图4中所示第1个目标位置子集中提取出停留簇1和停留簇2,p4是停留簇1的中心位置,δd是图中所示停留簇1所示的圆形区域的半径,p3和p5与p4的距离均小于δd,停留簇1中包括p3、p4和p5。
75.(2)每个停留簇中包括的位置数量至少是两个,以此过滤掉在户外运动的零散的
位置,假设图4中的第1个目标位置子集是当前位置子集,如图4中所示第1个目标位置子集中提取出停留簇1和停留簇2中包括的位置数量大于两个。过滤掉如p1、p2、p6和p11这样零散的位置。
76.(3)时间上相邻的两个定位点之间的时间差小于或等于预设时长δt,预设时长δt可以根据实际情况而定,例如10分钟,20分钟等。以此保证每个聚类簇中的定位得到的位置在时间上的连续性。假设图4中的第1个目标位置子集是当前位置子集,如图4中所示第1个目标位置子集中提取出停留簇1中的p3的定位时间是t3,p4的定位时间是t4,p5的定位时间是t5,t4-t3《δt,t5-t4《δt。
77.可选地,所述在所述n组停留簇中提取出所述多个停留簇,包括:在所述n组停留簇中提取出m个停留簇,其中,所述m个停留簇中的位置之间的距离小于预设阈值,且m大于或等于预设数量,或者,m与n的比值大于或等于预设比值,所述m个停留簇中的每个停留簇中的位置的定位时间点位于所述多个单位时间段中对应的一个单位时间段内。
78.作为一个可选的实施方式,如图5中所示,假设停留簇1和停留簇2是在第1个目标位置子集中提取出的停留簇,第1个目标位置子集是对目标帐号的移动终端在第1天进行定位得到的位置集合。停留簇3和停留簇4是在第2个目标位置子集中提取出的停留簇,第2个目标位置子集是对目标帐号的移动终端在第2天进行定位得到的位置集合。停留簇5、停留簇6和停留簇7是在第3个目标位置子集中提取出的停留簇,第3个目标位置子集是对目标帐号的移动终端在第3天进行定位得到的位置集合。如图所示停留簇1、停留簇3和停留簇5中的距离小于预阈值,预设阈值可以根据实际情况而定,例如3米、5米等,说明停留簇1、停留簇3和停留簇5中的位置是不同天在同一区域内定位得到的位置,如图中所示停留簇1、停留簇3和停留簇5均位于区域a。或者,如图中所示停留簇2、停留簇4和停留簇7均位于区域b。目标帐号在多天均出现的区域通常是目标帐号的居住区域或者是目标帐号的办公区域,例如,目标帐号居住的小区或者目标帐号办公的写字楼。由此可以进一步确定出目标帐号的居住地和办公地在区域a和区域b中。而对于图中所示的停留簇6中的位置,与其他聚类簇中的位置大于预设阈值,目标帐号仅在某一天出现的区域通常具有一定的特殊性,可能是去了商场或者酒店。因此对于停留簇6可以筛除。这样可以防止非职住地的定位簇对职住地识别造成的影响,提升了职住地的识别准确性。另外,为了防止筛除较多的停留簇,可以限定提取出的停留簇的数量,也就是上述提取出的m个停留簇中的m值进行限制,m可以设置为大于预设数量,预设数量可以根据实际情况而定,例如5、10、15等。或者可以设置m与n的比值大于或等于预设比值,预设比值可以根据实际情况而定,例如可以是0.5、0.6等。以此可以在筛除非职住地的停留簇之外,进一步保证了防止筛除掉职住地的停留簇,保证职住地识别的准确性。
79.可选地,所述对所述多个停留簇进行聚类,得到所述多个聚类簇,包括:获取所述多个停留簇中每个停留簇的中心位置,得到中心位置集合;根据所述中心位置集合中的中心位置,对所述多个停留簇中的位置进行聚合,得到所述多个聚类簇。
80.作为一个可选的实施方式,可以使用dbscan算法聚类对多个聚类簇中的位置进行聚类,上述中心位置是每个停留簇中的中心位置,假设提取出的停留簇的数量是n个,则将n个停留簇的中心位置的集合作为上述中心位置集合。在本实施例中,通过停留簇的中心位置对多个停留簇中的位置进行聚类,可以提高聚类效率。
81.可选地所述根据所述中心位置集合中的中心位置,对所述多个停留簇中的位置进行聚合,包括:获取所述中心位置集合中第i个中心位置的第i个邻域,其中,i为大于或等于1的正整数,所述第i个邻域是以所述第i个中心位置为圆心,预设长度为半径形成的区域;在所述第i个邻域内包含的所述多个停留簇中的位置的数量大于或等于预设数量的情况下,将所述第i个邻域内包含的所述多个停留簇中的位置确定为第i个聚类簇中的位置,其中,所述多个聚类簇包括所述第i个聚类簇。
82.作为一个可选的实施方式,上述第i个中心位置是多个聚类簇中的第i个停留簇的中心位置,上述预设长度可以根据实际情况而定,例如5米、8米、10米等。如图6中所示以停留簇1的中心位置为圆心,预设长度为半径得到的邻域内包含停留簇1中的3个位置,停留簇3中的4个位置,以及停留簇5中的2个位置,共包含9个位置。上述预设数量可以根据实际情况而定(例如,5、6、8、10、15等),假设预设数量是5,则上述9个位置组成聚类簇1。同理如图6中所示,以停留簇4的中心位置为圆心,预设长度为半径得到的邻域内包含停留簇4中的3个位置,停留簇2中的3个位置,以及停留簇7中的2个位置,共包含7个位置,大于预设数量是5,则上述7个位置组成聚类簇2。通过对停留簇的聚类,可以进一步去除非职住地形成的停留簇,进一步提升了职住地的识别准确度。
83.可选地,在所述将所述第i个邻域内的位置确定为第i个聚类簇中的位置之后,所述方法还包括:获取目标定位集合中位于所述第i个邻域内的剩余位置,其中,所述目标定位集合中包括对所述目标帐号所在的移动终端进行定位得到的位置,所述多个停留簇是在所述目标定位集合中提取出的停留簇,所述剩余位置是所述目标位置集合中未位于所述多个停留簇中的位置;将所述剩余位置中的部分或全部位置添加至所述第i个聚类簇。
84.作为一个可选的实施方式,对于目标定位信息中未加入到停留簇,有职住地意义位置,可以加入到对应的聚类簇中。如图7中所示的p80和p81是目标定位信息中未加入停留簇中的位置,而p80和p81位于聚类簇1对应的邻域内,则将p80和p81加入聚类簇1中。同理如图7中所示的p90和p91是目标定位信息中未加入停留簇中的位置,而p90和p91位于聚类簇2对应的邻域内,则将p90和p91加入聚类簇2中。以此可以达到防止位置的损失,提升职住地识别的准确率。本实施例中,在聚类时可以对海量的定位数据按照全国格网建立空间索引,可以支持大规模分布式聚类,大大提高了聚类的效率。
85.可选地,所述根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,包括:在所述目标维度特征包括多个维度特征时,确定所述每个聚类簇的所述多个维度特征各自对应的特征值;根据所述每个聚类簇的所述多个维度特征各自对应的特征值,确定所述每个聚类簇的停留参数的取值,其中,所述每个聚类簇的停留参数的取值用于表示所述每个聚类簇中的位置位于所述目标场所中的概率;将所述多个聚类簇中停留参数的取值最高的聚类簇,确定为所述目标聚类簇。
86.作为一个可选的实施方式,上述目标维度特征可以包括如时段覆盖、网络连接方式、建筑物类型等多个维度的特征。对于每个聚类簇可以计算其在相应维度上的特征值,例如,在时段覆盖维度特征上的特征值,在网络连接方式维度特征上的特征值,以及在建筑物类型维度特征上的特征值。根据上述多个维度上的特征值,可以得到每个聚类簇的停留参数取值,停留参数取值越大,说明越有可能是办公地或者是居住地。在本实施例中,通过结合多个维度的特征,在多个聚类簇中确定出最符合居住地或者办公地的场所,提升职住地
识别的准确率。
87.可选地,所述根据所述每个聚类簇的所述多个维度特征各自对应的特征值,确定所述每个聚类簇的停留参数的取值,包括:将所述每个聚类簇的所述多个维度特征各自对应的特征值的乘积,确定为所述每个聚类簇的停留参数的取值;或者,将所述每个聚类簇的所述多个维度特征各自对应的特征值的和,确定为所述每个聚类簇的停留参数的取值;或者,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值。
88.作为一个可选的实施方式,可以将多个维度上的特征值的乘积确定为聚类簇的停留参数取值,也可以将多个维度上的特征值的和确定为聚类簇的停留参数取值。也可以将多个维度上的特征值进行加权求和得到聚类簇的停留参数取值。在本实施例中,假设在时段覆盖上的特征值是w
hour
,在网络连接方式上的特征值是w
wifi
,在建筑物类型的特征值是w
poi
,则聚类簇的停留参数的取值为s
home
=w
hour
*w
wifi
*w
poi
,s
work
=w
hour
*w
wifi
*w
poi
,或者,s
home
=w
hour
w
wifi
w
poi
,s
work
=w
hour
w
wifi
w
poi
。或者s
home
=aw
hour
bw
wifi
cw
poi
,s
work
=aw
hour
bw
wifi
cw
poi
,其中,a、b、c是预设的权重值,可以根据实际情况而定,例如a可以是0.4、b可以是0.3,c是0.3。又例如,a可以是0.5、b可以是0.3,c是0.2等等。
89.可选地,所述将所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,包括以下之一:在所述多个维度特征包括所述每个聚类簇中的位置对应的定位时间点和所述位置上所述移动终端的网络连接方式时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述网络连接方式对应的权重值;在所述多个维度特征包括所述每个聚类簇中的位置对应的定位时间点和所述位置所在的预设区域范围内的建筑物类型时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述建筑物类型对应的权重值;在所述多个维度特征包括所述每个聚类簇中的位置对应的定位时间点、所述位置上所述移动终端的网络连接方式和所述位置所在的预设区域范围内的建筑物类型时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述网络连接方式对应的权重值和所述建筑物类型对应的权重值。
90.作为一个可选的实施方式,假设上述多个维度特征包括聚类簇中每个位置上的定位时间点,以及移动终端在位置上的网络连接方式。由于网络连接方式的不确定性较高,因此,对于网络连接方式的权重可以分配的低一些,定位时间点的权重分配的高一些,例如可以将定位时间点对应的权重值设置为0.7,网络连接方式对应的权重值可以是0.3。或者,将定位时间点对应的权重值设置为0.8,网络连接方式对应的权重值可以是0.2。
91.作为一个可选的实施方式,假设上述多个维度特征包括聚类簇中每个位置上的定位时间点,以及位置所在预设区域内的建筑物类型,上述预设区域可以根据实际情况而定,例如距离位置的5米或者10米范围内。对于定位时间点对应的特征值可以根据定位时间点所在的时间段进行分配。由于建筑物类型的不确定性较高,因此,对于建筑物类型的权重可以分配的低一些,定位时间点的权重分配的高一些,例如可以将定位时间点对应的权重值
设置为0.7,建筑物类型对应的权重值可以是0.3。或者,将定位时间点对应的权重值设置为0.8,建筑物类型对应的权重值可以是0.2。
92.作为一个可选的实施方式,上述多个维度特征还可以包括聚类簇中每个位置上的定位时间点,移动终端在位置上的网络连接方式,以及位置所在预设区域内的建筑物类型。对于权重,由于网络连接方式和建筑物类型的不确定性较高,因此,对于网络连接方式和建筑物类型的权重可以分配的低一些,定位时间点的权重分配的高一些,而网络连接方式相对于建筑物类型的确定性高一点,因此,可以将网络连接方式的权重比建筑物类型的权重分配的高一些。例如可以将定位时间点对应的权重值设置为0.5,网络连接方式对应的权重可以是0.3,建筑物类型对应的权重值可以是0.3。或者,将定位时间点对应的权重值设置为0.6,网络连接方式对应的权重可以是0.3,建筑物类型对应的权重值可以是0.1。在上述实施例中,通过对不同维度特征分配权重,可以更好的区分目标帐号的职住地,提升职住地的识别准确度。
93.可选地,所述确定所述每个聚类簇的所述多个维度特征各自对应的特征值,包括以下至少两个:根据所述每个聚类簇中的位置对应的定位时间点,确定所述每个聚类簇在时段覆盖上的特征值,其中,所述多个维度特征包括所述位置对应的定位时间点,所述每个聚类簇中包含的在预设时间段内定位得到的位置的数量越多,特征值越大,所述多个时间段包括所述预设时间段;根据在所述每个聚类簇中的位置上所述移动终端的网络连接方式,确定所述每个聚类簇在网络连接上的特征值,其中,所述多个维度特征包括所述位置上所述移动终端的网络连接方式,所述每个聚类簇中包含的第一类型的位置的数量越多,权重越大,在所述第一类型的位置上所述移动终端的网络连接方式为wifi连接方式;根据所述每个聚类簇中的位置所在的预设区域范围内的建筑物类型,确定所述每个聚类簇在建筑物类型上的特征值,其中,所述多个维度特征包括所述位置所在的预设区域范围内的建筑物类型,所述每个聚类簇中包含的第二类型的位置的数量越多,特征值越大,所述第二类型的位置所在的所述预设区域范围内存在办公类型建筑,且所述第二类型的位置与所述办公类型建筑之间的距离小于或等于第一预设距离,或者,所述第二类型的位置所在的所述预设区域范围内存在居住类型建筑,且所述第二类型的位置与所述居住类型建筑之间的距离小于或等于第二预设距离。
94.作为一个可选的实施方式,定位时间覆盖的天数以及在一天内用户定位覆盖的时段能体现目标帐号的停留。例如,对于办公地的识别,通常情况下办公时间一般是在周一至周五的上午八点至下午六点,上述预设时间段对应于本实施例中的周一至周五的上午八点至下午六点。因此,对于每个聚类簇中包含的定位时间点在周一至周五的上午八点至下午六点之内的位置数量越多,该聚类簇的特征值越大。具体地,可以按照位置的数量比确定在时段上的特征值,例如,聚类簇中包括100个位置,其中,80个位置的定位时间是在上述周一至周五的上午八点至下午六点之内,可以确定该聚类簇的特征值为80/100=0.8。又例如,对于居住地的识别,通常情况下晚上十点到第二天的早晨八点是在居住地。因此,对于聚类簇中定位时间在晚上十点到零点,以及零点到上述八点之内的位置数量越多,该聚类簇的特征值越大。具体地,也可以按照位置的数量比确定在时段上的特征值,例如,聚类簇中包括100个位置,其中,60个位置的定位时间是在上述晚上十点到第二天的早晨八点之内,可以确定该聚类簇的特征值为80/100=0.6。
95.作为一个可选的实施方式,也可以根据每个聚类簇中的位置的定位时间分配权重。例如,对于办公地的识别,通常情况下办公时间一般是在周一至周五的上午八点至下午六点,对于聚类簇中定位时间点在上述周一至周五的上午八点至下午六点之内的位置,可以分配对应的特征值例如可以是1,而对于其他时间段定位得到的位置可以分配特征值为0。通过对聚类簇中所有位置的特征值求和可以得到该聚类簇的特征值,通过如下公式可以得到聚类簇的特征值:
[0096][0097]
其中,weightk是聚类簇中第k个位置的特征值,n是聚类簇中位置的数量。
[0098]
作为一个可选的实施方式,由于在连接wifi时,极有可能是在室内停留,此类定位点比其他定位点更能反映驻留状态。因此,对于包含移动终端的网络连接方式wifi的位置的数量越多,该聚类簇的特征值越大。具体地,可以按照位置的数量比确定在时段上的特征值,例如,聚类簇中包括100个位置,其中,80个位置上移动终端的网络连接方式为wifi,则该聚类簇的在网络连接上的特征值为80/100=0.8。
[0099]
作为一个可选的实施方式,对于居住地的识别,聚类簇中位于住宅小区的预设范围内的位置数量越多,该聚类簇的特征值越大。对于办公地的识别,聚类簇中位于务楼宇的轮廓的位置数量越多,该聚类簇的特征值越大。上述预设范围可以根据实际情况而定,例如,5米、10米等。
[0100]
可选地,所述根据所述目标聚类簇确定目标位置,包括以下之一:将所述目标聚类簇中每个位置的经度的均值确定为目标经度,并将所述目标聚类簇中每个位置的纬度的均值确定为目标纬度;将所述目标经度和所述目标维度上的位置确定为所述目标位置;将所述目标聚类簇中每个位置的经度的均值确定为目标经度,并将所述目标聚类簇中每个位置的纬度的均值确定为目标纬度;将所述目标聚类簇中与预设位置距离最小的位置确定为所述目标位置,其中,所述预设位置是所述目标经度和所述目标维度上的位置;在所述目标聚类簇中确定所述目标位置,其中,所述目标位置所在的局部区域内的所述目标聚类簇中的位置的密度最高。
[0101]
作为一个可选的实施方式,当确定了包含居住地或办公地的聚类簇后,可以进一步确定办公地或者居住地的具体空间位置。可以将聚类簇中所有位置的经纬度取平均,将得到的平均经度和平均维度确定的位置作为目标位置,上述目标位置是目标帐号的居住位置或办公位置。
[0102]
作为一个可选的实施方式,也可以将聚类簇中所有位置的经纬度取平均,将得到的平均经度和平均维度确定的目标位置作为预设位置,并将聚类簇中与预设位置距离最近的位置作为目标位置,上述目标位置是目标帐号的居住位置或办公位置。
[0103]
作为一个可选的实施方式,也可以将聚类簇中局部区域密度最高的位置作为目标位置,选择聚类簇中对应空间密度最高的位置作为目标位置,可以采用均值漂移聚类算法,可以在聚类簇中随机选择一个位置作为中心位置,计算出当前中心位置的偏移均值,然后以偏移均值为新的起点,继续移动,直到在聚类簇中找到局部区域内密度最高位置作为目标位置,如图8中所示在聚类簇中找到局部区域密度最高的点作为目标位置,上述目标位置是目标帐号的居住位置或办公位置。由于在移动过程中,样本与被偏移量点的距离不同,其
偏移量对均值偏移量的贡献也不同。因此引入高斯核函数,具体带宽参数设置为50m,具体公式为:
[0104][0105]
作为一个可选的实施方式,可以对聚类的结果进行展示和评测。用于可视化和人工评测,如图9所示主要包括地图展示和属性展示两部分。地图展示包含对原始定位点以及聚类簇进行空间显示,点击每个聚类簇可以显示其对应特征及得分。属性展示主要是对定位点的经纬度进行表格展示以及时段分布进行折线图展示。
[0106]
通过本实施例可以计算得到海量用户精确的职住点,可以用于政府交通规划、商业选址项目以及广告投放等。交通规划类:通过职住地分析,可以了解居民通勤,为缓解交通压力以及交通站点的设置提供数据支撑。商业选址类:可以了解对某商场偏好的用户的居住地分布,辅助开新店。城市规划类:通过了解居民的居住分布,可以帮助政府进行公共设施规划,比如公园等,从而提高居民的社会公平性;个性化推荐类:对通勤路线进行个性化推荐以及进行线下广告投放。
[0107]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0108]
根据本发明实施例的另一个方面,还提供了一种用于实施上述停留位置的确定方法的停留位置的确定装置。如图10示,该装置包括:获取模块1002,用于获取目标帐号的多个停留簇,其中,每个所述停留簇中包括对所述目标帐号所在的移动终端进行定位得到的、所述目标帐号所停留的位置;聚类模块1004,用于对所述多个停留簇中的位置进行聚类,得到多个聚类簇,其中,每个所述聚类簇中包括至少一个所述停留簇中的部分或全部位置;第一确定模块1006,用于根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,其中,所述目标维度特征与目标场所对应;第二确定模块1008,用于根据所述目标聚类簇确定目标位置。
[0109]
可选地,上述装置还用于获取目标定位信息集合,其中,所述目标定位信息集合包括对所述目标帐号所在的移动终端进行定位得到的位置,以及每个位置的定位时间点;根据所述目标定位信息集合中的每个位置的定位时间点,在所述目标定位信息集合中提取出所述多个停留簇,其中,每个停留簇包括所述定位信息集合中的至少两个位置,所述每个停留簇的中心位置与所述每个停留簇中除所述中心位置之外的其他位置之间的距离小于或等于预设距离,在所述每个停留簇中的位置所对应的定位时间点中,时间上相邻的两个定位时间点之间的时间差小于或等于预设时长。
[0110]
可选地,上述装置还用于根据所述目标定位信息集合中的所述每个位置的定位时间点,将所述目标定位信息集合中的位置划分为n个目标位置子集,其中,每个目标位置子集中的位置的定位时间点位于多个单位时间段中对应的一个单位时间段内,所述目标定位信息集合中的位置包括在所述多个单位时间段内对所述移动终端进行定位得到的位置,n
大于或等于1;根据所述n个目标位置子集中的位置的定位时间点,分别在所述n个目标位置子集中的每个目标位置子集中提取出停留簇,共得到n组停留簇,其中,每个目标位置子集对应于一组停留簇;在所述n组停留簇中提取出所述多个停留簇。
[0111]
可选地,上述装置还用于对所述n个目标位置子集中的每个目标位置子集执行以下操作,在执行以下操作时,每个目标定位子集称为当前位置子集:根据所述当前位置子集中每个位置的定位时间点,在所述当前位置子集中提取出当前的一组停留簇,其中,所述当前的一组停留簇中的每个停留簇包括所述当前位置子集中的至少两个位置,所述当前的一组停留簇中的每个停留簇的中心位置与所述每个停留簇中除所述中心位置之外的其他位置之间的距离小于或等于所述预设距离,在所述当前的一组停留簇中的每个停留簇中的位置所对应的定位时间点中,时间上相邻的两个定位时间点之间的时间差小于或等于所述预设时长。
[0112]
可选地,上述装置还用于在所述n组停留簇中提取出m个停留簇,其中,所述m个停留簇中的位置之间的距离小于预设阈值,且m大于或等于预设数量,或者,m与n的比值大于或等于预设比值,所述m个停留簇中的每个停留簇中的位置的定位时间点位于所述多个单位时间段中对应的一个单位时间段内。
[0113]
可选地,上述装置还用于获取所述多个停留簇中每个停留簇的中心位置,得到中心位置集合;根据所述中心位置集合中的中心位置,对所述多个停留簇中的位置进行聚合,得到所述多个聚类簇。
[0114]
可选地,上述装置还用于获取所述中心位置集合中第i个中心位置的第i个邻域,其中,i为大于或等于1的正整数,所述第i个邻域是以所述第i个中心位置为圆心,预设长度为半径形成的区域;在所述第i个邻域内包含的所述多个停留簇中的位置的数量大于或等于预设数量的情况下,将所述第i个邻域内包含的所述多个停留簇中的位置确定为第i个聚类簇中的位置,其中,所述多个聚类簇包括所述第i个聚类簇。
[0115]
可选地,上述装置还用于在所述将所述第i个邻域内的位置确定为第i个聚类簇中的位置之后,获取目标定位集合中位于所述第i个邻域内的剩余位置,其中,所述目标定位集合中包括对所述目标帐号所在的移动终端进行定位得到的位置,所述多个停留簇是在所述目标定位集合中提取出的停留簇,所述剩余位置是所述目标位置集合中未位于所述多个停留簇中的位置;将所述剩余位置中的部分或全部位置添加至所述第i个聚类簇。
[0116]
可选地,上述装置还用于在所述目标维度特征包括多个维度特征时,确定所述每个聚类簇的所述多个维度特征各自对应的特征值;根据所述每个聚类簇的所述多个维度特征各自对应的特征值,确定所述每个聚类簇的停留参数的取值,其中,所述每个聚类簇的停留参数的取值用于表示所述每个聚类簇中的位置位于所述目标场所中的概率;将所述多个聚类簇中停留参数的取值最高的聚类簇,确定为所述目标聚类簇。
[0117]
可选地,上述装置还用于将所述每个聚类簇的所述多个维度特征各自对应的特征值的乘积,确定为所述每个聚类簇的停留参数的取值;将所述每个聚类簇的所述多个维度特征各自对应的特征值的和,确定为所述每个聚类簇的停留参数的取值;对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值。
[0118]
可选地,上述装置还用于在所述多个维度特征包括所述每个聚类簇中的位置对应
的定位时间点和所述位置上所述移动终端的网络连接方式时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述网络连接方式对应的权重值;在所述多个维度特征包括所述每个聚类簇中的位置对应的定位时间点和所述位置所在的预设区域范围内的建筑物类型时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述建筑物类型对应的权重值;在所述多个维度特征包括所述每个聚类簇中的位置对应的定位时间点、所述位置上所述移动终端的网络连接方式和所述位置所在的预设区域范围内的建筑物类型时,对所述每个聚类簇的所述多个维度特征各自对应的特征值进行加权求和,得到所述每个聚类簇的停留参数的取值,其中,在进行所述加权求和时,所述定位时间点对应的权重值大于所述网络连接方式对应的权重值和所述建筑物类型对应的权重值。
[0119]
可选地,上述装置还用于根据所述每个聚类簇中的位置对应的定位时间点,确定所述每个聚类簇在时段覆盖上的特征值,其中,所述多个维度特征包括所述位置对应的定位时间点,所述每个聚类簇中包含的在预设时间段内定位得到的位置的数量越多,特征值越大,所述多个时间段包括所述预设时间段;根据在所述每个聚类簇中的位置上所述移动终端的网络连接方式,确定所述每个聚类簇在网络连接上的特征值,其中,所述多个维度特征包括所述位置上所述移动终端的网络连接方式,所述每个聚类簇中包含的第一类型的位置的数量越多,权重越大,在所述第一类型的位置上所述移动终端的网络连接方式为wifi连接方式;根据所述每个聚类簇中的位置所在的预设区域范围内的建筑物类型,确定所述每个聚类簇在建筑物类型上的特征值,其中,所述多个维度特征包括所述位置所在的预设区域范围内的建筑物类型,所述每个聚类簇中包含的第二类型的位置的数量越多,特征值越大,所述第二类型的位置所在的所述预设区域范围内存在办公类型建筑,且所述第二类型的位置与所述办公类型建筑之间的距离小于或等于第一预设距离,或者,所述第二类型的位置所在的所述预设区域范围内存在居住类型建筑,且所述第二类型的位置与所述居住类型建筑之间的距离小于或等于第二预设距离。
[0120]
可选地,上述装置还用于将所述目标聚类簇中每个位置的经度的均值确定为目标经度,并将所述目标聚类簇中每个位置的纬度的均值确定为目标纬度;将所述目标经度和所述目标维度上的位置确定为所述目标位置;将所述目标聚类簇中每个位置的经度的均值确定为目标经度,并将所述目标聚类簇中每个位置的纬度的均值确定为目标纬度;将所述目标聚类簇中与预设位置距离最小的位置确定为所述目标位置,其中,所述预设位置是所述目标经度和所述目标维度上的位置;在所述目标聚类簇中确定所述目标位置,其中,所述目标位置所在的局部区域内的所述目标聚类簇中的位置的密度最高。
[0121]
根据本发明实施例的又一个方面,还提供了一种用于实施上述停留位置的确定方法的电子设备,该电子设备可以是图1所示的终端设备或服务器。本实施例以该电子设备为服务器为例来说明。如图11所示,该电子设备包括存储器1102和处理器1104,该存储器1102中存储有计算机程序,该处理器1104被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
[0122]
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的
至少一个网络设备。
[0123]
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
[0124]
s1,获取目标帐号的多个停留簇,其中,每个所述停留簇中包括对所述目标帐号所在的移动终端进行定位得到的、所述目标帐号所停留的位置;
[0125]
s2,对所述多个停留簇中的位置进行聚类,得到多个聚类簇,其中,每个所述聚类簇中包括至少一个所述停留簇中的部分或全部位置;
[0126]
s3,根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,其中,所述目标维度特征与目标场所对应;
[0127]
s4,根据所述目标聚类簇确定目标位置,其中,所述目标位置为所述目标帐号在所述目标场所中的停留位置。
[0128]
可选地,本领域普通技术人员可以理解,图11所示的结构仅为示意,电子装置电子设备也可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图11其并不对上述电子装置电子设备的结构造成限定。例如,电子装置电子设备还可包括比图11中所示更多或者更少的组件(如网络接口等),或者具有与图11所示不同的配置。
[0129]
其中,存储器1102可用于存储软件程序以及模块,如本发明实施例中的停留位置的确定方法和装置对应的程序指令/模块,处理器1104通过运行存储在存储器1102内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的停留位置的确定方法。存储器1102可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1102可进一步包括相对于处理器1104远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1102具体可以但不限于用于存储物品的样本特征与目标虚拟资源账号等信息。作为一种示例,如图11所示,上述存储器1102中可以但不限于包括上述停留位置的确定装置中的获取模块1002、聚类模块1004、第一确定模块1006及第二确定模块1008。此外,还可以包括但不限于上述停留位置的确定装置中的其他模块单元,本示例中不再赘述。
[0130]
可选地,上述的传输装置1106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1106包括一个网络适配器(network interface controller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1106为射频(radio frequency,rf)模块,其用于通过无线方式与互联网进行通讯。
[0131]
此外,上述电子设备还包括:显示器1108,用于显示上述目标位置;和连接总线1110,用于连接上述电子设备中的各个模块部件。
[0132]
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(p2p,peer to peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
[0133]
根据本技术的一个方面,提供了一种计算机程序产品,该计算机程序产品包括计
算机程序/指令,该计算机程序/指令包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理器1201执行时,执行本技术实施例提供的各种功能。
[0134]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0135]
图12示意性地示出了用于实现本技术实施例的电子设备的计算机系统结构框图。
[0136]
需要说明的是,图12示出的电子设备的计算机系统1200仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0137]
如图12所示,计算机系统1200包括中央处理器1201(central processing unit,cpu),其可以根据存储在只读存储器1202(read-only memory,rom)中的程序或者从存储部分1208加载到随机访问存储器1203(random access memory,ram)中的程序而执行各种适当的动作和处理。在随机访问存储器1203中,还存储有系统操作所需的各种程序和数据。中央处理器1201、在只读存储器1202以及随机访问存储器1203通过总线1204彼此相连。输入/输出接口1205(input/output接口,即i/o接口)也连接至总线1204。
[0138]
以下部件连接至输入/输出接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至输入/输出接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
[0139]
特别地,根据本技术的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理器1201执行时,执行本技术的系统中限定的各种功能。
[0140]
根据本技术的一个方面,提供了一种计算机可读存储介质,计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
[0141]
可选地,在本实施例中,上述计算机可读存储介质可以被设置为存储用于执行以下步骤的计算机程序:
[0142]
s1,获取目标帐号的多个停留簇,其中,每个所述停留簇中包括对所述目标帐号所在的移动终端进行定位得到的、所述目标帐号所停留的位置;
[0143]
s2,对所述多个停留簇中的位置进行聚类,得到多个聚类簇,其中,每个所述聚类簇中包括至少一个所述停留簇中的部分或全部位置;
[0144]
s3,根据所述多个聚类簇中每个聚类簇的目标维度特征,在所述多个聚类簇中确定出目标聚类簇,其中,所述目标维度特征与目标场所对应;
[0145]
s4,根据所述目标聚类簇确定目标位置,其中,所述目标位置为所述目标帐号在所
述目标场所中的停留位置。
[0146]
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-only memory,rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
[0147]
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
[0148]
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0149]
在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0150]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0151]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0152]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献