技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于地点的语义相似度平台的制作方法  >  正文

基于地点的语义相似度平台的制作方法

  • 国知局
  • 2024-11-06 15:07:28

所公开的实现方式整体涉及数据可视化,并且更具体地涉及提供基于地点的语义相似度的系统、方法和用户界面。

背景技术:

1、对象之间的相似度是直观定义的。树木与灌木相似,因为它们都是植物。然而,树木与公寓楼并不相似,尽管通常使用高度来描述这两者。从本质上讲,理解事物相似的原因相当复杂且微妙。例如,研究人员已经研究了相似度的概念,目的是将其分解为特征以及人们各自理解和评估相似度的方式。

2、虽然在像树木、灌木和公寓楼等对象之间的比较可能似乎是明显且直观的评估,但是当处理像种族、年龄和收入等各种社会人口统计特性时,标识相似度并不容易。这还取决于上下文以及对于个体解释相似度而言重要的东西。就这些特性而言,美国的哪个区域与旧金山(san francisco)最相似以及如何相似?就种族构成而言,芝加哥(chicago)的哪些街区与纽约州布朗克斯区(bronx,ny)最相似?

3、其他哪些位置像一个街区?如何像一个街区?为什么像一个街区?许多空间分析的核心是寻找位置之间的相似度或相异度。发现模式和解释相似度是基于空间特性以及分配给地点的语义或含义两者的一个复杂过程。人类对位置相似度的概念化是多方面的,并且无法通过对人口密度或中位收入等单个数字属性的简单评估来捕捉。然而,这些可量化属性是对意义构建进行初步理解的基础。

4、使用社会经济和人口统计变量来测量相似度的一个困难在于可用数据数量巨大且种类繁多。在传统的人口统计工作中,研究人员可以精选几个简单的变量诸如中位收入或年龄,并将它们用作其统计中的自变量来标识相关性。有时,研究人员通过比较所有可能的地理位置来一次查看一个属性,看这些位置之间的值是较高还是较低(例如,人口普查区a比人口普查区b的人口多10%)。然而,这些方法都不跨潜在大型的人口统计变量分组使用数据的关系。

技术实现思路

1、因此,需要促进结合相似度测量和空间分析来提供信息简化和/或语义概括的系统、方法和界面。本文描述的技术有助于使用户更接近可采取行动的洞察。可以在地理空间查询中使用这些技术以确定区域之间的相似度,其中参与者可以操纵描述这些位置的各种属性的各个权重。一些实现方式使用上下文和附加的地点特定参数来计算相似度。一些实现方式提供利用语义的细微差别的地理空间分析工具来获取地点相似度。

2、一些实现方式使用统计方法来确定地理区域(例如,美国境内的区域)之间的相似度。一些实现方式提供了数据中枢,这使得用户易于在其分析中结合这种类型的相似度测量。根据本文描述的技术的框架使得人们易于处理来自美国人口普查的各种属性以使用用户感兴趣的属性来标识或多或少相似的位置。一些实现方式使用基于jensen-shannon散度(jsd)的计算来确定相似度和/或在易读地图中呈现结果。一些实现方式在工具提示中按需示出细节。根据一些实现方式,下面详细描述了使用jsd来评估相似度以进行数据分析。

3、根据一些实现方式,本文提供了一种用于对数据集的视觉分析的方法。方法在计算机系统处执行。用户选择数据源。作为响应,系统呈现用于分析数据源中的数据的图形用户界面。数据包括地理空间数据点。系统还在图形用户界面内呈现地图数据可视化。地图数据可视化包括多个地理区域。每个地理区域对应于相应的一个或多个地理空间数据点。响应于接收到选择多个地理区域中的第一组的一个或多个地理区域的第一用户输入,系统使用一种或多种统计技术基于一组属性(例如,来自数据源的数据字段)来计算多个地理区域中的第一组的一个或多个地理区域与第二组的一个或多个地理区域之间的相似度。然后,系统根据所计算的相似度来更新和显示地图数据可视化。

4、在一些实现方式中,一组属性包括一个或多个社会经济变量、人口统计变量和地理变量。

5、在一些实现方式中,更新地图数据可视化包括突出或弱化第二组的一个或多个地理区域中的至少一个地理区域。

6、在一些实现方式中,方法还包括:响应于接收到在地图数据可视化上选择搜索多边形的坐标的第二用户输入,基于坐标来定义第二一个或多个区域。

7、在一些实现方式中,方法还包括将搜索多边形的坐标与多个地理区域中的地理区域中的每个的对应一个或多个地理空间数据点进行比较,以标识第二组的一个或多个地理区域。

8、在一些实现方式中,一组属性中的每个属性与多个权重中的对应权重相关联,并且方法还包括基于多个权重来计算相似度。

9、在一些实现方式中,方法还包括提供一个或多个示能表示(affordance),每个示能表示对应于一组属性中的相应属性。

10、在一些实现方式中,方法还包括响应于接收到选择一个或多个示能表示中的第一示能表示的第二用户输入:(i)调整对应于第一示能表示的第一属性的第一权重以获得经更新的权重集;(ii)使用一种或多种统计技术基于经更新的权重集来计算第一组的一个或多个地理区域与第二组的一个或多个地理区域之间的经更新的相似度;以及(iii)根据经更新的相似度来更新和显示地图数据可视化。

11、在一些实现方式中,方法还包括提供用于存储经更新的权重集的存储示能表示。响应于用户选择存储示能表示,方法将经更新的权重集存储在预设文件中用于下一会话。

12、在一些实现方式中,方法还包括:针对下一会话,获取预设文件,并且使用经更新的权重集来计算第一组的一个或多个地理区域与第二组的一个或多个地理区域之间的相似度。

13、在一些实现方式中,地图数据可视化是分级统计地图,并且根据所计算的相似度来更新和显示地图数据可视化包括显示从最大到最小相似度的梯度。

14、在一些实现方式中,方法还包括:(i)提供用于选择分级统计地图的第一示能表示和用于选择最大-最小地图(most-least map)的第二示能表示;(ii)响应于对第一示能表示的用户选择,显示从最大到最小相似度的梯度;以及(iii)响应于对第二示能表示的用户选择,显示最大相似区域和最小相似区域。

15、在一些实现方式中,方法还包括:(i)提供多个示能表示,每个示能表示对应于相应的最大区域数量;以及(ii)响应于对多个示能表示中的示能表示的用户选择,基于对应于示能表示的最大区域数量来显示第二组一个或多个区域内的最大相似区域和最小相似区域。

16、在一些实现方式中,方法还包括:(i)提供多个示能表示,每个示能表示对应于多个子区域中的相应子区域子集;以及(ii)响应于对多个示能表示中的示能表示的用户选择,(a)停止呈现地图数据可视化以及(b)在图形用户界面内呈现替代地图数据可视化。替代地图数据可视化包括对应于示能表示的子区域子集。

17、在一些实现方式中,图形用户界面包括第一部分和第二部分,并且方法还包括:(i)在第一部分中显示地图数据可视化;以及(ii)在第二部分中显示第一一个或多个地理区域与第二一个或多个地理区域之间的相似度的概述。

18、在一些实现方式中,每个地理区域对应于相应的人口普查区。

19、在一些实现方式中,计算相似度包括计算多个地理区域中的第一组的一个或多个地理区域和第二组的一个或多个地理区域针对一组属性的语义相似度矩阵。

20、在一些实现方式中,计算相似度包括计算第一组的一个或多个地理区域和第二组的一个或多个地理区域中的地理区域对之间的jensen-shannon散度(jsd)。

21、在另一方面中,一种电子设备包括一个或多个处理器、存储器、显示器和存储在存储器中的一个或多个程序。这些程序被配置用于由一个或多个处理器执行,并且被配置为执行本文描述的方法中的任何方法。

22、在另一方面中,一种非暂态计算机可读存储介质存储被配置用于由具有一个或多个处理器、存储器和显示器的计算设备执行的一个或多个程序。一个或多个程序被配置为执行本文描述的方法中的任何方法。

23、因此,本文公开了允许用户高效地探索在数据可视化应用内显示的数据的方法、系统和图形用户界面。

24、前面的一般描述和下面的详细描述都是示例性和说明性的,并且旨在提供对所要求保护的本发明的进一步解释。

本文地址:https://www.jishuxx.com/zhuanli/20241106/325445.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。