技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于人工智能的数据仓库优化方法及系统与流程  >  正文

基于人工智能的数据仓库优化方法及系统与流程

  • 国知局
  • 2024-07-31 23:13:22

本技术涉及数据处理,具体而言,涉及一种基于人工智能的数据仓库优化方法及系统。

背景技术:

1、在当前的数据库管理系统中,随着数据量的不断增长和业务需求的日益复杂,如何高效地进行数据查询成为了一个亟待解决的问题。传统的查询优化方法往往只关注数据库索引的结构优化,而忽视了与业务会话数据之间的关联分析。这导致了查询优化策略往往不够精准,无法满足复杂多变的业务需求。

技术实现思路

1、为了改善上述问题,本技术提供了一种基于人工智能的数据仓库优化方法及系统。

2、本技术实施例的第一方面,提供了一种基于人工智能的数据仓库优化方法,应用于数据仓库优化系统,所述方法包括:

3、从云业务信息池中获取至少一组目标业务会话数据,所述目标业务会话数据包括至少一个数据库索引信息集;

4、分别对各数据库索引信息集中索引信息进行索引知识挖掘,获得各所述数据库索引信息集分别对应的索引知识描述数组,并分别对各所述数据库索引信息集相应的目标业务会话数据进行会话属性知识挖掘,获得各所述数据库索引信息集分别对应的第一会话属性知识描述数组;

5、依据各所述数据库索引信息集的分布特征,分别从相应的第一会话属性知识描述数组中识别得到各所述数据库索引信息集分别对应的第二会话属性知识描述数组;

6、分别集成各所述数据库索引信息集分别对应的索引知识描述数组、第一会话属性知识描述数组以及第二会话属性知识描述数组,获得各所述数据库索引信息集分别对应的查询优化决策特征;

7、依据各所述数据库索引信息集分别对应的查询优化决策特征,分别对各所述数据库索引信息集进行查询优化处理,获得结构查询优化标签。

8、可选的,所述分别集成各所述数据库索引信息集分别对应的索引知识描述数组、第一会话属性知识描述数组以及第二会话属性知识描述数组,获得各所述数据库索引信息集分别对应的查询优化决策特征包括:

9、基于特征焦点化策略分别集成各所述数据库索引信息集分别对应的第一会话属性知识描述数组和第二会话属性知识描述数组,获得各所述数据库索引信息集分别对应的目标会话属性知识描述数组;

10、分别集成各所述数据库索引信息集分别对应的目标会话属性知识描述数组和索引知识描述数组,获得各所述数据库索引信息集分别对应的查询优化决策特征。

11、可选的,所述从云业务信息池中获取至少一组目标业务会话数据包括:

12、获取云业务信息池,对所述云业务信息池进行信息采样,获得所述云业务信息池相应的用户活动会话集合;

13、确定所述用户活动会话集合中关联用户活动会话的行为跳变会话,获得行为跳变会话集合,依据所述行为跳变会话集合,从所述用户活动会话集合中确定出业务会话数据集合;

14、对所述业务会话数据集合中各业务会话数据分别进行查询语句检测,获得各所述业务会话数据分别对应的索引窗口信息;

15、依据各所述业务会话数据分别对应的索引窗口信息,对各所述业务会话数据进行索引窗口标注,获得至少一组目标业务会话数据。

16、可选的,所述依据各所述业务会话数据分别对应的索引窗口信息,对各所述业务会话数据进行索引窗口标注,获得至少一组目标业务会话数据包括:

17、依据各所述业务会话数据分别对应的索引窗口信息,获得各所述业务会话数据的各索引窗口的分布特征和权重系数;

18、如果依据各所述业务会话数据的各索引窗口的分布特征和权重系数,确定存在噪声索引窗口,则从各所述业务会话数据的各索引窗口中移除掉所述噪声索引窗口;

19、如果通过关键会话向量匹配确定存在索引信息更新标签,则从各所述业务会话数据的各索引窗口中移除掉所述索引信息更新标签;

20、将标注后的索引窗口作为数据库索引信息集,将包括数据库索引信息集的业务会话数据作为目标业务会话数据。

21、可选的,所述如果通过关键会话向量匹配确定存在索引信息更新标签,则从各所述业务会话数据的各索引窗口中移除掉所述索引信息更新标签之前,还包括:

22、分别对各所述业务会话数据进行语义嵌入,获得各所述业务会话数据分别对应的会话语义单元集合以及所述会话语义单元集合中各会话语义单元的会话稠密语义;

23、依据各所述业务会话数据分别对应的各会话语义单元的会话稠密语义,分别对各所述业务会话数据与关联会话进行语义配对,获得各所述业务会话数据与关联会话之间的语义配对单元;

24、依据各所述业务会话数据与关联会话之间的语义配对单元,分别确定各所述业务会话数据的各所述索引窗口内的配对单元个数;

25、如果各所述索引窗口中存在配对单元个数大于个数门限的目标索引窗口,且所述目标索引窗口内的至少一个配对单元在相应业务会话数据和相应关联会话的分布不同,则将所述目标索引窗口作为索引信息更新标签。

26、可选的,所述依据各所述数据库索引信息集分别对应的查询优化决策特征,分别对各所述数据库索引信息集进行查询优化处理,获得结构查询优化标签包括:

27、依据各所述数据库索引信息集分别对应的查询优化决策特征,分别对各所述数据库索引信息集进行查询优化处理,获得各所述数据库索引信息集分别对应的查询优化输出;

28、当所述数据库索引信息集的个数为至少两个,对各所述数据库索引信息集中索引信息进行共性索引信息组合,获得共性索引信息组合结果;

29、依据所述共性索引信息组合结果,对各所述数据库索引信息集进行组合,获得组合后索引信息簇;

30、依据所述组合后索引信息簇相应的查询优化输出,获得结构查询优化标签。

31、可选的,所述依据各所述数据库索引信息集分别对应的查询优化决策特征,分别对各所述数据库索引信息集进行查询优化处理,获得结构查询优化标签包括:

32、依据各所述数据库索引信息集分别对应的查询优化决策特征,分别对各所述数据库索引信息集进行查询优化处理,获得各所述数据库索引信息集分别对应的查询优化输出;

33、当依据各所述数据库索引信息集分别对应的查询优化输出确定存在对应于查询树输出标签的目标索引信息簇,获取所述云业务信息池相应的键值对向量;

34、依据所述键值对向量对对应于查询树输出标签的目标索引信息簇中索引信息进行改进,获得结构查询优化标签。

35、可选的,所述依据各所述数据库索引信息集分别对应的查询优化决策特征,分别对各所述数据库索引信息集进行查询优化处理,获得结构查询优化标签包括:

36、依据各所述数据库索引信息集分别对应的查询优化决策特征,分别对各所述数据库索引信息集进行查询优化处理,获得各所述数据库索引信息集分别对应的查询优化输出;

37、分别对各所述数据库索引信息集中索引信息进行映射逻辑特征检测,获得各所述数据库索引信息集分别对应的映射逻辑特征检测结果;

38、依据所述映射逻辑特征检测结果,对各所述数据库索引信息集分别对应的查询优化输出进行改进,获得结构查询优化标签。

39、本技术实施例的第二方面,提供了一种数据仓库优化系统,包括:处理器以及与所述处理器连接的存储器和总线;所述处理器和所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的计算机程序,以执行上述的基于人工智能的数据仓库优化方法。

40、本技术实施例的第三方面,提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的基于人工智能的数据仓库优化方法。

41、本技术实施例所提供的基于人工智能的数据仓库优化方法及系统,涉及基于云业务信息池的数据库索引知识挖掘与查询优化思路,通过深入挖掘数据库索引信息集与业务会话数据之间的内在联系,实现了更精准的查询优化决策,从而大大提高了数据库查询的效率和准确性。如此,不仅解决了传统查询优化方法的局限性,还为数据库性能的优化提供了新的思路和方法。

本文地址:https://www.jishuxx.com/zhuanli/20240730/196519.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。