技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种自动识别指标、维度并生成图表的方法、系统及电子设备与流程  >  正文

一种自动识别指标、维度并生成图表的方法、系统及电子设备与流程

  • 国知局
  • 2024-08-05 12:03:01

本发明涉及数据分析的,特别涉及一种自动识别指标、维度并生成图表的方法、系统及电子设备。

背景技术:

1、随着智能化办公技术的发展,传统的办公形式逐渐被替代,电子化的办公方式在大众的生活中趋向于占据不可忽视地位。其中,针对电子表格的制作,现有技术在利用如office等办公软件制作表格的过程中,普遍依赖人的主观意识,根据人的主观意识去选择指标、维度以及对应的图表类型,进而形成柱状图、折线图、饼图等等;同时,针对表格的优化调整均由人的主观意识决定。

2、因此,现有技术生成图表的数据处理过程,存在一下缺陷:

3、缺陷一、过度依赖人的主观意识,使得数据在解读处理过程中存在误差;

4、缺陷二、制作表格的过程中,依赖人的历史经验,对于小白来说,耗时的同时,效果还不佳;

5、缺陷三、主观意识存在较大的个性化和时间差,使得每次的数据处理结果都具有唯一性,导致后期的复刻操作以及实现扩展需求的难度加深;

6、缺陷四、现有的处理过程在微调优化时,需要不断的尝试、循环迭代,流程过于冗余、繁杂。

技术实现思路

1、发明目的:提出一种自动识别指标、维度并生成图表的方法、系统及电子设备,以解决现有技术存在的上述问题,克服数据分析过程中手动判断指标和维度以及手动绘制图表所带来的效率低下、易出错以及缺乏灵活性等缺陷。

2、技术方案:第一方面,提出了一种自动识别指标、维度并生成图表的方法,其中终端设备执行数据图表生成过程包括以下步骤:

3、s1、根据用户选择,读取用于生成图表所需的数据集;

4、s2、提取所述数据集中的字段类型;针对读取到的数据集,通过结构拆分获得s2中的字段类型,按照列举方式将数据集中的结构逐一拆分成列;

5、s3、构建字段提取模型,对捕获到的字段属性进行逻辑分析,并进行调整;

6、s4、对调整后的分析结果进行人工辅助抉择,获得指标、维度,并记录对应的人工操作;

7、s5、根据指标、维度自动生成推荐图表类型,并呈现至用户可视界面;

8、s6、根据用户选中的图表类型生成展示图表;

9、s7、在用户最终调整后输出最终形成的图表。

10、其中,在第一方面的一些实现过程中,所述字段提取模型用于对步骤s2中获得的字段类型进行识别划分,获得字段属性对应的判断结果,即当前字段对应指标还是对应维度的初步结果;针对初步结果,结合用户历史操作数据对当前属性初步结果执行优化分析,采用相似度计算以及阈值比对的方式,确认字段提取模型最终的输出结果。

11、在执行字段所属类型判断的过程中,构建计数器并针对遍历读取到的字段,采用正则表达式判断当前字段是否属于数值类型,采用日期解析函数判断当前字段是否属于日期类型;若当前字段既不属于数值类型也不属于日期类型,则将当前字段定义为文本类型。

12、判断当前字段是否是数值类型时,采用的正则表达式为:

13、

14、其中,对应的字符释义依次为:^表示匹配字符串的开始;表示匹配一个可选的负号或正号,后面的?表示这个字符集是可选的;

15、\d是数字字符的简写;*表示前面的元素(即\d)可以出现零次或多次;(\.\d+)?表示匹配一个小数点后面跟着一个或多个数字的可选部分;括号()用于表示分组;\.表示匹配小数点;\d+表示匹配一个或多个数字;?表示整个分组是可选的;$表示匹配字符串的结束。

16、利用余弦相似度计算初步结果与历史操作之间相似度的表达式为:

17、相似度=(向量a·向量b)/(向量a的模长*向量b的模长)

18、式中,向量a表示当前初步结果中的字段属性;向量b表示历史操作中的字段属性;·表示两个向量数据的点乘,即对应元素相乘后的和;向量a的模长和向量b的模长分别表示向量a和向量b的长度,即每个向量所有元素平方和的平方根。

19、第二方面,本发明实施例提出一种自动识别指标、维度并生成图表的系统,用于实现自动识别指标、维度并生成图表的方法,该系统包括:数据读取模块、字段类型提取模块、字段属性获取模块、模型构建模块、字段属性获取模块、优化模块、图表推荐模块、微调模块。

20、其中,数据读取模块用于根据用户选择,读取用于生成图表所需的数据集;字段类型提取模块,被设置为提取所述数据集中的字段类型;模型构建模块用于构建字段提取模型;字段属性获取模块用于利用字段提取模型对捕获到的字段属性进行逻辑分析,并进行调整;优化模块用于对调整后的分析结果采用人工辅助进行抉择,获得指标、维度,并记录对应的人工操作;图表推荐模块用于根据指标、维度自动生成推荐图表类型,并呈现至用户可视界面;图表生成模块用于根据用户选中的图表类型生成展示图表;微调模块用于对图表生成模块的生成展示图标进行微调,并在用户最终调整后输出最终形成的图表。

21、第三方面,本发明实施例提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述实施例提供的自动识别指标、维度并生成图表的方法步骤。

22、第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的用于执行自动识别指标、维度并生成图表的方法步骤。

23、第五方面,本发明实施例提供一种计算机程序产品,该产品包括计算机程序,该计算机程序被处理器执行时实现自动识别指标、维度并生成图表的方法步骤。

24、有益效果:本发明提出了一种自动识别指标、维度并生成图表的方法、系统及电子设备,不局限于某一针对性的场景,适配性更强,适用于商业分析、市场调研和科学研究等领域,为各行各业提供高效、准确、直观的数据处理和分析工具,推动其发展。在数据分析的过程中,通过自动分析功能,快速准确地判断字段属性,减少了手动分析的繁琐和时间成本;同时,优化了数据展示方式,根据指标和维度的组合选择最直观和有效的展示形式,有助于用户更好地理解和分析数据。另外,提供了直观的用户界面,允许用户轻松选择数据集和调整指标、维度,同时实时展示图表生成效果,并记录用户手动调整情况以满足个性化需求,提升用户体验。

技术特征:

1.一种自动识别指标、维度并生成图表的方法,其特征在于,终端设备执行数据图表生成过程包括以下步骤:

2.根据权利要求1所述的一种自动识别指标、维度并生成图表的方法,其特征在于,针对读取到的数据集,通过结构拆分获得s2中的字段类型,按照列举方式将数据集中的结构逐一拆分成列。

3.根据权利要求1所述的一种自动识别指标、维度并生成图表的方法,其特征在于,所述字段提取模型用于对步骤s2中获得的字段类型进行识别划分,获得字段属性对应的判断结果,即当前字段对应指标还是对应维度的初步结果;

4.根据权利要求3所述的一种自动识别指标、维度并生成图表的方法,其特征在于,在执行字段所属类型判断的过程中,构建计数器并针对遍历读取到的字段,采用正则表达式判断当前字段是否属于数值类型,采用日期解析函数判断当前字段是否属于日期类型;若当前字段既不属于数值类型也不属于日期类型,则将当前字段定义为文本类型。

5.根据权利要求4所述的一种自动识别指标、维度并生成图表的方法,其特征在于,判断当前字段是否是数值类型时,采用的正则表达式为:

6.根据权利要求4所述的一种自动识别指标、维度并生成图表的方法,其特征在于,利用余弦相似度计算初步结果与历史操作之间相似度的表达式为:

7.一种自动识别指标、维度并生成图表的系统,用于实现如权利要求1-6任意一项所述的自动识别指标、维度并生成图表的方法,其特征在于,包括以下模块:

8.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的自动识别指标、维度并生成图表的方法步骤。

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的自动识别指标、维度并生成图表的方法步骤。

10.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的自动识别指标、维度并生成图表的方法步骤。

技术总结本发明提出了一种自动识别指标、维度并生成图表的方法、系统及电子设备,属于数据分析的技术领域,其中执行图表生成的过程包括:S1、根据用户选择,读取用于生成图表所需的数据集;S2、提取所述数据集中的字段类型;S3、构建字段提取模型,对捕获到的字段属性进行逻辑分析,并进行调整;S4、对调整后的分析结果进行人工辅助抉择,获得指标、维度,并记录对应的人工操作;S5、根据指标、维度自动生成推荐图表类型,并呈现至用户可视界面;S6、根据用户选中的图表类型生成展示图表;S7、在用户最终调整后输出最终形成的图表。本发明通过将数据分析从人工转换成系统自动分析的方式,利用自动化统一分析的方式,克服过度依赖人工存在的一系列问题。技术研发人员:柴亚团,李云受保护的技术使用者:无锡容智技术有限公司技术研发日:技术公布日:2024/8/1

本文地址:https://www.jishuxx.com/zhuanli/20240802/260809.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。