数据查询方法、装置、计算机设备和存储介质与流程
- 国知局
- 2024-07-31 22:48:23
本技术涉及大数据,特别是涉及一种数据查询方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、随着金融领域数字化发展,数据资产不断累积,企业数据资产的类型和量级得到了较大提升,但同时也对业务人员、管理人员分析、挖掘、利用海量的数据资产带来了更高难度。
2、面对海量的报表和指标数据,传统的数据查询方式需要用户在掌握输入条件的前提下才能呈现相应的数据结果。由于指标管理体系下,数据覆盖领域广、不同领域专业性强、指标业务规则较为复杂、口径繁多,业务人员查询相应的数据需要熟知业务指标含义并选择相应功能模块,通过规范性选择、输入等操作方式进行交互以获取处理结果。传统方法对用户的用数门槛要求高,导致海量数据无法得到有效利用,难以为用户提供高效的决策信息。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提升用数效率的数据查询方法、装置、计算机设备、存储介质和计算机程序产品。
2、第一方面,本技术提供了一种数据查询方法,包括:
3、获取对业务应用中的对话交互页面输入的用户提问文本;所述用户提问文本为目标用户对业务数据的数据查询需求的自然语言表达;
4、对所述用户提问文本进行检索要素提取处理,得到待检索文本;所述待检索文本包含与所述业务数据关联的意图关键词;
5、在预设业务数据库中,根据所述待检索文本中的意图关键词进行数据检索,得到多个检索结果,并基于所述目标用户的操作行为数据调整所述多个检索结果的排序,得到与所述业务数据相匹配的检索结果集合;
6、根据所述目标用户的数据权限信息和所述检索结果集合,生成所述用户提问文本对应的数据查询结果;所述数据查询结果用于在所述对话交互页面中渲染展示出所述业务数据的链接信息,所述链接信息用于在所述预设业务数据库中访问所述业务数据。
7、在其中一个实施例中,所述对所述用户提问文本进行检索要素提取处理,得到待检索文本,包括:
8、对所述用户提问文本进行检索要素提取处理,提取出与所述业务数据关联的意图关键词;所述检索要素提取处理包括分词处理、噪声去除、缺失值处理、特征提取中的至少一项;
9、基于与所述业务数据关联的意图关键词,得到所述待检索文本。
10、在其中一个实施例中,所述在预设业务数据库中,根据所述待检索文本中的意图关键词进行数据检索,得到多个检索结果,包括:
11、将所述待检索文本中的意图关键词与所述预设业务数据库中的索引进行相似度计算,得到满足相似度条件的多个检索结果。
12、在其中一个实施例中,所述将所述待检索文本中的意图关键词与所述预设业务数据库中的索引进行相似度计算,得到满足相似度条件的多个检索结果,包括:
13、按照预设词袋模型,对所述意图关键词与所述预设业务数据库中的索引逐一计算相似度;所述预设词袋模型为基于所述预设业务数据库中指标数据和报表数据所构建的字典生成的词袋模型;
14、获取相似度排序符合预设排序范围的检索结果,作为所述多个检索结果。
15、在其中一个实施例中,所述方法还包括:
16、根据所述预设业务数据库中指标数据和报表数据,构建数据语料;
17、基于所述数据语料进行分词与停用词补充处理的结果,构建所述字典;
18、根据所述字典生成的词袋模型,以及所述词袋模型的词频与逆文本频率指数值,得到所述预设词袋模型;所述词频与逆文本频率指数值用于计算所述意图关键词与所述预设业务数据库中索引的相似度。
19、在其中一个实施例中,所述基于所述目标用户的操作行为数据调整所述多个检索结果的排序,得到与所述业务数据相匹配的检索结果集合,包括:
20、根据所述目标用户的操作行为数据,确定行为特征参数;所述操作行为数据为基于所述目标用户在所述业务应用中对历史数据查询结果的操作行为得到的;
21、采用搜索与数据分析引擎,按照所述行为特征参数调整所述多个检索结果的排序,得到所述检索结果集合。
22、在其中一个实施例中,所述根据所述目标用户的数据权限信息和所述检索结果集合,生成所述用户提问文本对应的数据查询结果,包括:
23、根据所述检索结果集合中携带的所述目标用户的标识信息,获取所述目标用户的数据权限信息;
24、按照所述数据权限信息对所述检索结果集合进行数据权限过滤,得到过滤后检索结果;
25、将所述过滤后检索结果与所述预设业务数据库中的数据链接进行关联,得到所述数据查询结果。
26、第二方面,本技术还提供了一种数据查询装置,包括:
27、用户提问文本获取模块,用于获取对业务应用中的对话交互页面输入的用户提问文本;所述用户提问文本为目标用户对业务数据的数据查询需求的自然语言表达;
28、检索要素提取模块,用于对所述用户提问文本进行检索要素提取处理,得到待检索文本;所述待检索文本包含与所述业务数据关联的意图关键词;
29、数据检索模块,用于在预设业务数据库中,根据所述待检索文本中的意图关键词进行数据检索,得到多个检索结果,并基于所述目标用户的操作行为数据调整所述多个检索结果的排序,得到与所述业务数据相匹配的检索结果集合;
30、数据查询结果生成模块,用于根据所述目标用户的数据权限信息和所述检索结果集合,生成所述用户提问文本对应的数据查询结果;所述数据查询结果用于在所述对话交互页面中渲染展示出所述业务数据的链接信息,所述链接信息用于在所述预设业务数据库中访问所述业务数据。
31、在其中一个实施例中,所述检索要素提取模块包括:
32、意图关键词提取子模块,用于对所述用户提问文本进行检索要素提取处理,提取出与所述业务数据关联的意图关键词;所述检索要素提取处理包括分词处理、噪声去除、缺失值处理、特征提取中的至少一项;
33、待检索文本得到子模块,用于基于与所述业务数据关联的意图关键词,得到所述待检索文本。
34、在其中一个实施例中,所述数据检索模块包括:
35、索引检索子模块,用于将所述待检索文本中的意图关键词与所述预设业务数据库中的索引进行相似度计算,得到满足相似度条件的多个检索结果。
36、在其中一个实施例中,所述索引检索子模块包括:
37、相似度计算单元,用于按照预设词袋模型,对所述意图关键词与所述预设业务数据库中的索引逐一计算相似度;所述预设词袋模型为基于所述预设业务数据库中指标数据和报表数据所构建的字典生成的词袋模型;
38、多个检索结果得到单元,用于获取相似度排序符合预设排序范围的检索结果,作为所述多个检索结果。
39、在其中一个实施例中,所述装置还包括:
40、数据语料构建模块,用于根据所述预设业务数据库中指标数据和报表数据,构建数据语料;
41、字典构建模块,用于基于所述数据语料进行分词与停用词补充处理的结果,构建所述字典;
42、预设词袋模型得到模块,用于根据所述字典生成的词袋模型,以及所述词袋模型的词频与逆文本频率指数值,得到所述预设词袋模型;所述词频与逆文本频率指数值用于计算所述意图关键词与所述预设业务数据库中索引的相似度。
43、在其中一个实施例中,所述数据检索模块包括:
44、行为特征参数确定子模块,用于根据所述目标用户的操作行为数据,确定行为特征参数;所述操作行为数据为基于所述目标用户在所述业务应用中对历史数据查询结果的操作行为得到的;
45、排序调整子模块,用于采用搜索与数据分析引擎,按照所述行为特征参数调整所述多个检索结果的排序,得到所述检索结果集合。
46、在其中一个实施例中,所述数据查询结果生成模块包括:
47、数据权限信息获取子模块,用于根据所述检索结果集合中携带的所述目标用户的标识信息,获取所述目标用户的数据权限信息;
48、检索结果过滤子模块,用于按照所述数据权限信息对所述检索结果集合进行数据权限过滤,得到过滤后检索结果;
49、数据查询结果得到子模块,用于将所述过滤后检索结果与所述预设业务数据库中的数据链接进行关联,得到所述数据查询结果。
50、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本技术实施例中任一项所述的方法的步骤。
51、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本技术实施例中任一项所述的方法的步骤。
52、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本技术实施例中任一项所述的方法的步骤。
53、上述一种数据查询方法、装置、计算机设备、存储介质和计算机程序产品,通过获取对业务应用中的对话交互页面输入的用户提问文本,该用户提问文本为目标用户对业务数据的数据查询需求的自然语言表达,然后对用户提问文本进行检索要素提取处理,得到待检索文本,该待检索文本包含与业务数据关联的意图关键词,在预设业务数据库中,根据待检索文本中的意图关键词进行数据检索,得到多个检索结果,并基于目标用户的操作行为数据调整多个检索结果的排序,得到与业务数据相匹配的检索结果集合,进而根据目标用户的数据权限信息和检索结果集合,生成用户提问文本对应的数据查询结果,该数据查询结果用于在对话交互页面中渲染展示出业务数据的链接信息,该链接信息用于在预设业务数据库中访问业务数据,实现了对数据查询处理的优化,可以基于自然语言表达方式,为用户在海量业务数据中快速查找到所需数据,能够降低用数门槛,使海量数据得以有效利用,从而获得了提升用数效率的有益效果。
本文地址:https://www.jishuxx.com/zhuanli/20240730/194711.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表