数据处理方法、计算机设备及存储介质与流程
- 国知局
- 2024-09-14 14:32:53
本公开实施例涉及但不限于数据处理,尤其涉及一种数据处理方法、计算机设备及存储介质。
背景技术:
1、在数据分析处理领域中,随着计算机处理能力的提升,分析的数据量越来越庞大。而待展示的散点数据量较大,会导致散点图在进行可视化时需要耗费大量的计算机资源,并且导致输出的散点图展示效果较差。
技术实现思路
1、以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
2、第一方面,本公开实施例提供了一种数据处理方法,所述方法包括:
3、获得包括多个散点数据的初始桶和画布的尺寸;
4、基于所述画布的尺寸和所述初始桶的最大值,确定出桶分裂方向及其对应的预设阈值;
5、按照所述桶分裂方向及其对应的预设阈值,对所述初始桶进行分裂处理,获得符合所述预设阈值的多个分裂桶,每个分裂桶包括所述多个散点数据中部分数据,所述部分数据在所述桶分裂方向的最大值与最小值之间的差值不大于所述预设阈值;
6、对所述多个分裂桶分别进行采样处理,得到多个采样桶;
7、在所述画布上,基于所述多个采样桶中的处理后的散点数据,绘制对应的散点图。
8、在一些示例性实施例中,所述画布的尺寸包括:所述画布的第一方向尺寸值和第二方向尺寸值,每个散点数据包括:第一方向值和第二方向值,所述初始桶的最大值包括:所述初始桶中所述多个散点数据的第一方向最大值和第二方向最大值;
9、所述基于所述画布的尺寸和所述初始桶的最大值,确定出桶分裂方向及其对应的预设阈值,包括:基于所述第一方向最大值和所述第一方向尺寸值,确定第一方向对应的第一阈值;基于所述第二方向最大值和所述第二方向尺寸值,确定第二方向对应的第二阈值;将所述第一方向最大值与所述第二方向最大值之间的比值,确定为缩放比例;将所述第一方向对应的第一阈值与所述缩放比例之间的第一比值和所述第二方向对应的第二阈值与所述缩放比例之间的第二比值进行比较;根据比较结果,将所述第一方向及其对应的第一阈值或者所述第二方向及其对应的第二阈值,确定为所述桶分裂方向及其对应的预设阈值。
10、在一些示例性实施例中,所述基于所述第一方向最大值和所述第一方向尺寸值,确定第一方向对应的第一阈值,包括:给所述第一方向最大值与所述第一方向尺寸值之间的第一比值乘以预设调整系数,获得所述第一方向对应的第一阈值;所述基于所述第二方向最大值和所述第二方向尺寸值,确定第二方向对应的第二阈值,包括:给所述第二方向最大值与所述第二方向尺寸值之间的第二比值乘以所述预设调整系数,获得所述第二方向对应的第二阈值。
11、在一些示例性实施例中,所述根据比较结果,将所述第一方向及其对应的第一阈值或者所述第二方向及其对应的第二阈值,确定为所述桶分裂方向及其对应的预设阈值,包括:当所述第一比值大于所述第二比值时,将所述第一方向及其对应的第一阈值确定为所述桶分裂方向及其对应的预设阈值;或者,当所述第一比值小于所述第二比值时,将所述第二方向及其对应的第二阈值确定为所述桶分裂方向及其对应的预设阈值;或者,当所述第一比值等于所述第二比值时,将所述第一方向及其对应的第一阈值以及所述第二方向及其对应的第二阈值中任意一种,确定为所述桶分裂方向及其对应的预设阈值。
12、在一些示例性实施例中,所述按照桶分裂方向及其对应的预设阈值,对所述初始桶进行分裂,获得符合所述预设阈值的多个分裂桶,包括:将所述初始桶加入待处理桶队列,其中,所述待处理桶队列设置为存储未确定是否符合所述预设阈值的桶或者不符合所述预设阈值的桶;当确定所述待处理桶队列不为空时,针对所述待处理桶队列中的每个桶,分别执行如下桶分裂操作:确定所述待处理桶队列中的每个桶是否满足预设桶分裂条件;对于所述待处理桶队列中的满足预设桶分裂条件的第一桶,以所述桶分裂方向,按照从小到大的顺序,对所述第一桶的散点数据进行排序,获得对应的排序后的桶;通过将所述桶分裂方向对应的预设阈值依次与所述排序后的桶中排序后的散点数据进行比较,从所述排序后的散点数据中确定出分裂点;根据所述分裂点,对所述排序后的桶进行分裂,获得两个分裂桶;将所述两个分裂桶加入所述待处理桶队列中;对于所述待处理桶队列中的不满足所述预设桶分裂条件的第二桶,将所述第二桶加入完成队列中;直至所述待处理桶队列为空时,从所述完成队列中获得符合所述预设阈值的多个分裂桶。
13、在一些示例性实施例中,所述确定所述待处理桶队列中的每个桶是否满足预设桶分裂条件,包括:将每个桶在所述桶分裂方向上的最大值与最小值之间的差值与所述桶分裂方向对应的预设阈值进行比较;根据比较结果,将所述待处理桶队列中所述差值大于所述桶分裂方向对应的预设阈值的桶,确定为所述满足预设桶分裂条件的第一桶;或者,将所述待处理桶队列中所述差值不大于所述桶分裂方向对应的预设阈值的桶,确定为所述不满足所述预设桶分裂条件的第二桶。
14、在一些示例性实施例中,所述通过将所述桶分裂方向对应的预设阈值依次与所述排序后的桶中排序后的散点数据进行比较,从所述排序后的散点数据中确定出分裂点,包括:将所述桶分裂方向对应的预设阈值依次与所述排序后的桶中排序后的散点数据的桶分裂方向值进行比较;根据比较结果,从所述排序后的桶中排序后的散点数据的桶分裂方向值中,确定出目标桶分裂方向值,所述目标桶分裂方向值为第一个大于所述桶分裂方向对应的预设阈值的桶分裂方向值;将所述目标桶分裂方向值的前一个桶分裂方向值,确定为所述分裂点。
15、在一些示例性实施例中,所述对所述多个分裂桶分别进行采样处理,得到多个采样桶,包括:按照预设采样方法,对所述多个分裂桶分别进行采样处理,得到多个采样桶,其中,所述预设采样方法包括:对数采样法、蓄水池采样法和随机采样法中任意一种。
16、第二方面,本公开实施例提供了一种计算机设备,包括:处理器、以及存储有可在所述处理器上运行的计算机程序的存储器,其中,所述处理器,设置为执行所述程序时实现上述任一项实施例中所述的数据处理方法的步骤。
17、第三方面,本公开实施例提供了一种非瞬态计算机可读存储介质,存储有计算机可执行指令,其中,所述计算机可执行指令,设置为执行上述任一项实施例中所述的数据处理方法的步骤。
18、本公开示例性实施例提供的数据处理方法、计算机设备及存储介质,在获得包括多个散点数据的初始桶和画布的尺寸之后,根据画布的尺寸和初始桶的最大值确定出桶分裂方向及其对应的预设阈值,接下来,按照桶分裂方向及其对应的预设阈值,对初始桶进行分裂处理,获得符合预设阈值的多个分裂桶;然后,对符合预设阈值的多个分裂桶分别进行采样处理,得到多个采样桶,最后在画布上,基于多个采样桶中的处理后的散点数据,绘制对应的散点图。这样,可以保证对于中稀疏部分的细节保留和高密度部分的数据抽稀。从而,在面对大数据量时,可以提升大数据量散点图的绘制速度,并保持散点图可视化效果较好,达到提升传输速度和渲染速度的效果,可以提升交互操作响应速度。
19、本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
20、在阅读并理解了附图和详细描述后,可以明白其他方面。
本文地址:https://www.jishuxx.com/zhuanli/20240914/294684.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表