技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种空间地理数据处理方法和装置与流程  >  正文

一种空间地理数据处理方法和装置与流程

  • 国知局
  • 2024-08-05 11:47:55

本发明涉及数据处理,尤其涉及一种空间地理数据处理方法和装置。

背景技术:

1、空间地理数据是企业管理和生产过程中的重要维度之一。对于企业已经积累的海量的与空间地理相关的数据资产,由于历史原因,其空间地理基准存在不统一、缺乏标准等问题。随着民用gis(geographic information system,地理信息系统)的日益成熟,人们对于日常习惯使用的空间地理数据已经形成了巨大的惯性,导致企业的空间地理数据不被人们接受,严重影响了使用效果。并且随着企业数据的继续积累,由地理空间数据不规范、不标准、不统一导致的问题,又进一步带来更多的问题。

2、为解决以上问题,需要将企业的空间地理数据对齐到人们日常习惯使用的空间地理数据上例如百度地图、高德地图等。因此,如何能够将企业的空间地理数据高效、准确地对齐融合到人们日常习惯使用的空间地理数据上,是本领域技术人员亟待解决的技术问题。

技术实现思路

1、本发明实施例的目的是提供一种空间地理数据处理方法和装置、电子设备,能够解决现有技术中无法将企业的空间地理数据与人们日常习惯使用的空间地理数据对齐融合的问题。

2、为解决上述技术问题,本发明提供如下技术方案:

3、本发明实施例提供了一种空间地理数据处理方法,其中,所述方法包括:

4、针对企业空间地理数据中的每个企业地址,确定所述企业地址在基准空间地理数据中对应的基准地址;

5、依据所述企业地址的第一标识、所述基准地址的第二标识以及所述企业地址与所述基准地址之间的空间距离,判断所述企业地址与所述基准地址是否精准匹配;其中,所述第一标识包括:名称和/或别名;

6、若二者未精准匹配,则依据所述企业地址的精简标识和所述基准地址的第二标识的相似度,判断所述企业地址与所述基准地址是否模糊匹配;其中,所述精简标识包括:精简名称和/或别名;

7、在所述企业地址与所述基准地址精准匹配或模糊匹配的情况下,将所述企业地址插入到所述基准空间地理数据中。

8、可选地,依据所述企业地址的第一标识、所述基准地址的第二标识以及所述企业地址与所述基准地址之间的空间距离,判断所述企业地址与所述基准地址是否精准匹配的步骤,包括:

9、逐层级判断所述企业地址的第一标识与所述基准地址的第二标识是否匹配,且判断所述企业地址与基准地址之间的空间距离是否小于预设阈值;

10、若第一标识与所述第二标识匹配,且所述企业地址与所述基准地址之间的空间距离小于或等于所述预设阈值,则确定所述企业地址与所述基准地址精准匹配;

11、若第一标识与所述第二标识不匹配或所述企业地址与所述基准地址之间的空间距离大于所述预设阈值,则确定所述企业地址与所述基准地址未精准匹配。

12、可选地,逐层级判断所述企业地址的第一标识与所述基准地址的第二标识是否匹配,且判断所述企业地址与基准地址之间的空间距离是否小于预设阈值的步骤,包括:

13、判断所述企业地址的名称及别名中是否包含所述基准地址的社区名称或别名;若包含,则判断所述企业地址与基准地址之间的空间距离是否小于或等于第一预设阈值;若所述企业地址与基准地址之间的空间距离小于或等于第一预设阈值,则确定所述企业地址与所述基准地址精准匹配;

14、若所述企业地址的名称及别名中不包含所述基准地址的社区名称或别名,或所述企业地址与基准地址之间的空间距离大于所述第一预设阈值,则判断所述企业地址的名称及别名中是否包含所述基准地址的楼宇名称或别名;若包含,则判断所述企业地址与基准地址之间的空间距离是否小于或等于所述第一预设阈值;若所述企业地址与基准地址之间的空间距离小于或等于第一预设阈值,则确定所述企业地址与所述基准地址精准匹配;

15、若所述企业地址的名称及别名中不包含所述基准地址的楼宇名称或别名,或所述企业地址与基准地址之间的空间距离大于所述第一预设阈值,则判断所述企业地址的名称及别名中是否包含所述基准地址的行政村名称或别名;若包含,则判断所述企业地址与基准地址之间的空间距离是否小于或等于所述第二预设阈值;若所述企业地址与基准地址之间的空间距离小于或等于第二预设阈值,则确定所述企业地址与所述基准地址精准匹配;

16、若所述企业地址的名称及别名中不包含所述基准地址的行政村名称或别名,或所述企业地址与基准地址之间的空间距离大于所述第二预设阈值,则判断所述企业地址的名称及别名中是否包含所述基准地址的自然村名称或别名;若包含,则判断所述企业地址与基准地址之间的空间距离是否小于或等于所述第三预设阈值;若所述企业地址与基准地址之间的空间距离小于或等于第三预设阈值,则确定所述企业地址与所述基准地址精准匹配;

17、若所述企业地址的名称及别名中不包含所述基准地址的自然村名称或别名,或所述企业地址与基准地址之间的空间距离大于所述第三预设阈值,则确定所述企业地址与所述基准地址未精准匹配。

18、可选地,依据所述企业地址的精简标识和所述基准地址的精简标识的相似度,判断所述企业地址与所述基准地址是否模糊匹配的步骤,包括:

19、计算所述企业地址的精简名称及别名与所述基准地址的社区名称或别名的第一综合相似度;

20、在所述第一综合相似度大于等于第一预设相似度阈值的情况下,确定所述企业地址与所述基准地址模糊匹配;

21、在所述第一综合相似度小于所述第一预设相似度阈值的情况下,计算所述企业地址的精简名称及别名与所述基准地址的楼宇名称或别名的第二综合相似度;

22、在所述第二综合相似度大于等于第二预设相似度阈值的情况下,确定所述企业地址与所述基准地址模糊匹配;在所述第二综合相似度小于所述第二预设相似度阈值的情况下,确定所述企业地址与所述基准地址未模糊匹配。

23、可选地,计算所述企业地址的精简名称及别名与所述基准地址的社区名称或别名的第一综合相似度的步骤,包括:

24、计算所述企业地址的精简名称与所述基准地址的社区名称的权重相似度以及字符个数相似度的均值,将所述均值确定为所述第一综合相似度。

25、可选地,所述字符个数相似度通过如下方式计算得到:

26、确定所述企业地址精简名称包含的第一字符数量;

27、确定所述基准地址的社区名称包含的第二字符数量;

28、确定所述企业地址的精简名称与所述基准地址的社区名称中的相同字符的第三字符数量;

29、依据所述第一字符数量、所述第三字符数量,计算所述企业地址名称的个数相似度;依据所述第二字符数量、所述第三子符数量,计算所述基准地址的个数相似度;

30、将所述企业地址名称的个数相似度与所述企业地址名称的个数相似度的均值,确定为所述企业地址的精简名称与所述基准地址的社区名称的所述字符个数相似度。

31、本发明实施例还提供了一种空间地理数据处理装置,其中,所述装置包括:

32、第一确定模块,用于针对企业空间地理数据中的每个企业地址,确定所述企业地址在基准空间地理数据中对应的基准地址;

33、第一判断模块,用于依据所述企业地址的第一标识、所述基准地址的第二标识以及所述企业地址与所述基准地址之间的空间距离,判断所述企业地址与所述基准地址是否精准匹配;其中,所述第一标识包括:名称和/或别名;

34、第二判断模块,用于若二者未精准匹配,则依据所述企业地址的精简标识和所述基准地址的第二标识的相似度,判断所述企业地址与所述基准地址是否模糊匹配;其中,所述精简标识包括:精简名称和/或别名;

35、插入模块,用于在所述企业地址与所述基准地址精准匹配或模糊匹配的情况下,将所述企业地址插入到所述基准空间地理数据中。

36、可选地,所述第一判断模块包括:

37、第一子模块,用于逐层级判断所述企业地址的第一标识与所述基准地址的第二标识是否匹配,且判断所述企业地址与基准地址之间的空间距离是否小于预设阈值;

38、第二子模块,用于若第一标识与所述第二标识匹配,且所述企业地址与所述基准地址之间的空间距离小于或等于所述预设阈值,则确定所述企业地址与所述基准地址精准匹配;

39、第三子模块,用于若第一标识与所述第二标识不匹配或所述企业地址与所述基准地址之间的空间距离大于所述预设阈值,则确定所述企业地址与所述基准地址未精准匹配。

40、可选地,所述第一子模块具体用于:

41、判断所述企业地址的名称及别名中是否包含所述基准地址的社区名称或别名;若包含,则判断所述企业地址与基准地址之间的空间距离是否小于或等于第一预设阈值;若所述企业地址与基准地址之间的空间距离小于或等于第一预设阈值,则确定所述企业地址与所述基准地址精准匹配;

42、若所述企业地址的名称及别名中不包含所述基准地址的社区名称或别名,或所述企业地址与基准地址之间的空间距离大于所述第一预设阈值,则判断所述企业地址的名称及别名中是否包含所述基准地址的楼宇名称或别名;若包含,则判断所述企业地址与基准地址之间的空间距离是否小于或等于所述第一预设阈值;若所述企业地址与基准地址之间的空间距离小于或等于第一预设阈值,则确定所述企业地址与所述基准地址精准匹配;

43、若所述企业地址的名称及别名中不包含所述基准地址的楼宇名称或别名,或所述企业地址与基准地址之间的空间距离大于所述第一预设阈值,则判断所述企业地址的名称及别名中是否包含所述基准地址的行政村名称或别名;若包含,则判断所述企业地址与基准地址之间的空间距离是否小于或等于所述第二预设阈值;若所述企业地址与基准地址之间的空间距离小于或等于第二预设阈值,则确定所述企业地址与所述基准地址精准匹配;

44、若所述企业地址的名称及别名中不包含所述基准地址的行政村名称或别名,或所述企业地址与基准地址之间的空间距离大于所述第二预设阈值,则判断所述企业地址的名称及别名中是否包含所述基准地址的自然村名称或别名;若包含,则判断所述企业地址与基准地址之间的空间距离是否小于或等于所述第三预设阈值;若所述企业地址与基准地址之间的空间距离小于或等于第三预设阈值,则确定所述企业地址与所述基准地址精准匹配;

45、若所述企业地址的名称及别名中不包含所述基准地址的自然村名称或别名,或所述企业地址与基准地址之间的空间距离大于所述第三预设阈值,则确定所述企业地址与所述基准地址未精准匹配。

46、可选地,所述第二判断模块包括:

47、第四子模块,用于计算所述企业地址的精简名称及别名与所述基准地址的社区名称或别名的第一综合相似度;

48、第五子模块,用于在所述第一综合相似度大于等于第一预设相似度阈值的情况下,确定所述企业地址与所述基准地址模糊匹配;

49、第六子模块,用于在所述第一综合相似度小于所述第一预设相似度阈值的情况下,计算所述企业地址的精简名称及别名与所述基准地址的楼宇名称或别名的第二综合相似度;

50、第七子模块,用于在所述第二综合相似度大于等于第二预设相似度阈值的情况下,确定所述企业地址与所述基准地址模糊匹配;在所述第二综合相似度小于所述第二预设相似度阈值的情况下,确定所述企业地址与所述基准地址未模糊匹配。

51、可选地,所述第四子模块具体用于:

52、计算所述企业地址的精简名称与所述基准地址的社区名称的权重相似度以及字符个数相似度的均值,将所述均值确定为所述第一综合相似度。

53、可选地,所述字符个数相似度通过如下方式计算得到:

54、确定所述企业地址精简名称包含的第一字符数量;

55、确定所述基准地址的社区名称包含的第二字符数量;

56、确定所述企业地址的精简名称与所述基准地址的社区名称中的相同字符的第三字符数量;

57、依据所述第一字符数量、所述第三字符数量,计算所述企业地址名称的个数相似度;依据所述第二字符数量、所述第三子符数量,计算所述基准地址的个数相似度;

58、将所述企业地址名称的个数相似度与所述企业地址名称的个数相似度的均值,确定为所述企业地址的精简名称与所述基准地址的社区名称的所述字符个数相似度。

59、本发明实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现上述任意一种空间地理数据处理方法的步骤。

60、本发明实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现上述任意一种空间地理数据处理方法的步骤。

61、本发明实施例提供的空间地理数据处理方案,针对企业空间地理数据中的每个企业地址,确定企业地址在基准空间地理数据中对应的基准地址;依据企业地址的第一标识、基准地址的第二标识以及企业地址与基准地址之间的空间距离,判断企业地址与基准地址是否精准匹配;若二者未精准匹配,则依据企业地址的精简标识和基准地址的第二标识的相似度,判断企业地址与基准地址是否模糊匹配;在企业地址与基准地址精准匹配或模糊匹配的情况下,将企业地址插入到基准空间地理数据中。本发明实施例提供的空间地理数据处理方案,对企业地址与基准地址进行双重匹配,能够高效、准确地将企业的空间地理数据(即企业地址)与人们日常习惯使用的空间地理数据(基准地址)对齐融合,从而使企业维护的空间地理数据的价值得以提升。

本文地址:https://www.jishuxx.com/zhuanli/20240802/259463.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。