技术新讯 > 计算推算,计数设备的制造及其应用技术 > SQL血缘解析方法、装置、处理器及存储介质与流程  >  正文

SQL血缘解析方法、装置、处理器及存储介质与流程

  • 国知局
  • 2024-08-22 14:23:03

本申请涉及计算机,具体涉及一种sql血缘解析方法、装置、处理器及存储介质。

背景技术:

1、在大数据场景下,数据的来源极其广泛,各种类型的数据在快速产生,也在爆发性增长,这导致了数据之间的关系也变得越发复杂。因此需要通过获取表与字段之间的复杂关系来更好地认识和理解业务系统与底层表之间的关系。

2、数据血缘描述了数据的来源和去向,以及数据在多个etl处理过程中的转换,因此现有技术通常通过元数据管理中的数据血缘来获取表与字段间的关系,但在处理比较复杂的sql语句时,因为这些语句往往涉及多个表和字段,容易出现误判的情况,从而无法准确确定表与字段之间的关联关系。

3、可见,现有的sql血缘解析方法存在表与字段间的关系无法准确确定的技术问题。

技术实现思路

1、本申请实施例的目的是提供一种sql血缘解析方法、装置、处理器及存储介质。

2、为了实现上述目的,本申请第一方面提供一种sql血缘解析方法,包括:

3、获取sql查询语句;

4、根据sql查询语句构建第一抽象语法树;

5、将第一抽象语法树输入至训练好的深度学习模型中进行标注,得到第二抽象语法树,其中,第二抽象语法树包括第一中间表表名、源表表名、目标表表名、第一中间字段名、源字段名与目标字段名;

6、对第一中间表表名与第一中间字段名进行修正,得到第二中间表表名与第二中间字段名;

7、根据第二抽象语法树、第二中间表表名与第二中间字段名确定第三抽象语法树;

8、根据第三抽象语法树确定第二中间表、源表、目标表、第二中间字段、源字段与目标字段之间的第一关系。

9、在本申请实施例中,对第一中间表表名与第一中间字段名进行修正,得到第二中间表表名与第二中间字段名,包括:

10、将第一中间表表名与第一中间字段名输入至训练好的命名体识别模型中进行修正,得到第二中间表表名与第二中间字段名。

11、在本申请实施例中,sql血缘解析方法还包括:

12、将第一抽象语法树转换为图结构;

13、根据图结构确定第二中间表表名、源表表名、目标表表名、第二中间字段名、源字段名与目标字段名之间的第二关系。

14、在本申请实施例中,将第一抽象语法树转换为图结构,包括:

15、利用训练好的图神经网络模型将第一抽象语法树转换为图结构。

16、在本申请实施例中,根据sql查询语句构建第一抽象语法树,包括:

17、根据sql查询语句,通过词法分析与语法分析构建第一抽象语法树。

18、在本申请实施例中,在根据sql查询语句构建第一抽象语法树之后,还包括:

19、对第一抽象语法树进行语义分析增强。

20、本申请第二方面提供一种sql血缘解析装置,包括:

21、sql语句获取模块,用于获取sql查询语句;

22、第一抽象语法树构建模块,用于根据sql查询语句构建第一抽象语法树;

23、第二抽象语法树确定模块,用于将第一抽象语法树输入至训练好的深度学习模型中进行标注,得到第二抽象语法树,其中,第二抽象语法树包括第一中间表表名、源表表名、目标表表名、第一中间字段名、源字段名与目标字段名;

24、中间表表名与中间字段名修正模块,用于对第一中间表表名与第一中间字段名进行修正,得到第二中间表表名与第二中间字段名;

25、第三抽象语法树确定模块,用于根据第二抽象语法树、第二中间表表名与第二中间字段名确定第三抽象语法树;

26、表与字段关系确定模块,用于根据第三抽象语法树确定第二中间表、源表、目标表、第二中间字段、源字段与目标字段之间的第一关系。

27、本申请第三方面提供一种处理器,被配置成执行上述的sql血缘解析方法。

28、本申请第四方面提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得处理器被配置成执行上述的sql血缘解析方法。

29、本申请第五方面提供一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现上述的sql血缘解析方法。

30、通过上述技术方案,根据sql查询语句构建第一抽象语法树,并将第一抽象语法树输入至训练好的深度学习模型中进行标注,提高了抽象语法树中节点标注的准确性,并对较复杂的中间表表名与中间字段名进行修正,降低了中间表表名与中间字段名的误判率,从而提高了在进行sql血缘解析时确定表与字段间关系的准确性。

31、本申请实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。

技术特征:

1.一种sql血缘解析方法,其特征在于,所述sql血缘解析方法包括:

2.根据权利要求1所述的sql血缘解析方法,其特征在于,所述对所述第一中间表表名与所述第一中间字段名进行修正,得到第二中间表表名与第二中间字段名,包括:

3.根据权利要求1所述的sql血缘解析方法,其特征在于,所述sql血缘解析方法还包括:

4.根据权利要求3所述的sql血缘解析方法,其特征在于,所述将所述第一抽象语法树转换为图结构,包括:

5.根据权利要求1所述的sql血缘解析方法,其特征在于,所述根据所述sql查询语句构建第一抽象语法树,包括:

6.根据权利要求1所述的sql血缘解析方法,其特征在于,在根据所述sql查询语句构建第一抽象语法树之后,还包括:

7.一种sql血缘解析装置,其特征在于,所述sql血缘解析装置包括:

8.一种处理器,其特征在于,被配置成执行根据权利要求1至6中任意一项所述的sql血缘解析方法。

9.一种机器可读存储介质,该机器可读存储介质上存储有指令,其特征在于,该指令在被处理器执行时使得所述处理器被配置成执行根据权利要求1至6中任一项所述的sql血缘解析方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现根据权利要求1至6中任一项所述的sql血缘解析方法。

技术总结本申请实施例提供一种SQL血缘解析方法、装置、处理器及存储介质,SQL血缘解析方法包括:获取SQL查询语句;根据SQL查询语句构建第一抽象语法树;将第一抽象语法树输入至训练好的深度学习模型中进行标注,得到第二抽象语法树;对第一中间表表名与第一中间字段名进行修正,得到第二中间表表名与第二中间字段名;根据第二抽象语法树、第二中间表表名与第二中间字段名确定第三抽象语法树;根据第三抽象语法树确定第二中间表、源表、目标表、第二中间字段、源字段与目标字段之间的第一关系。由此,提高了在进行SQL血缘解析时确定表与字段间关系的准确性。技术研发人员:佘振,李光宇,肖志荣受保护的技术使用者:中国建设银行股份有限公司技术研发日:技术公布日:2024/8/20

本文地址:https://www.jishuxx.com/zhuanli/20240822/278471.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。