基于大型预训练模型的文本到SQL转换方法及系统与流程
- 国知局
- 2024-08-22 15:08:18
本申请涉及人工智能,具体涉及自然语言处理,尤其涉及基于大型预训练模型的文本到sql转换方法及系统。
背景技术:
1、在当今日益复杂的信息化环境中,数据库管理系统(dbms)已成为各类应用中不可或缺的一部分。其中,结构化查询语言(sql)作为与数据库交互的标准语言,被广泛应用于数据的查询、插入、更新和删除等操作。然而,对于许多用户来说,编写和理解sql语句可能是一项繁琐且容易出错的任务。传统的sql生成方法通常依赖于逐句输入查询需求,再逐一将其转换为相应的sql语句。这种方式在处理简单查询时或许尚可接受,但在处理涉及多个连续、相似操作或流程的复杂查询时,往往需要重复输入大量相似的查询条件,这不仅增加了工作负担,还可能导致查询错误率的上升。
技术实现思路
1、本申请通过提供了基于大型预训练模型的文本到sql转换方法及系统,旨在解决sql语句一句一句识别导致出现查询重复作业的技术问题。
2、鉴于上述问题,本申请提供了基于大型预训练模型的文本到sql转换方法及系统。
3、本申请公开的第一个方面,提供了基于大型预训练模型的文本到sql转换方法,所述方法包括:获取查询文本语料库和sql语句编码库,其中,所述sql语句编码库与所述查询文本语料库编码映射;根据所述查询文本语料库和所述sql语句编码库进行训练,获取双向预训练模型,其中,所述双向预训练模型包括文本-sql转换预训练模型和sql-文本转换预训练模型,所述文本-sql转换预训练模型和sql-文本转换预训练模型的模型参数共享;识别所述查询文本语料库中各个文本的交互时间样本,根据所述交互时间样本进行交互连续性分析,获取连续查询文本语料库;接入所述连续查询文本语料库对所述双向预训练模型进行训练优化,输出双向优化转换模型;获取用户实时查询文本,将所述用户实时查询文本输入所述双向优化转换模型中进行连续性sql转换,获取连续sql转换语句。
4、本申请公开的另一个方面,提供了基于大型预训练模型的文本到sql转换系统,所述系统包括:语料库和编码库获取单元,所述语料库和编码库获取单元用于获取查询文本语料库和sql语句编码库,其中,所述sql语句编码库与所述查询文本语料库编码映射;模型训练单元,所述模型训练单元用于根据所述查询文本语料库和所述sql语句编码库进行训练,获取双向预训练模型,其中,所述双向预训练模型包括文本-sql转换预训练模型和sql-文本转换预训练模型,所述文本-sql转换预训练模型和sql-文本转换预训练模型的模型参数共享;交互连续性分析单元,所述交互连续性分析单元用于识别所述查询文本语料库中各个文本的交互时间样本,根据所述交互时间样本进行交互连续性分析,获取连续查询文本语料库;训练优化单元,所述训练优化单元用于接入所述连续查询文本语料库对所述双向预训练模型进行训练优化,输出双向优化转换模型;连续性sql转换单元,所述连续性sql转换单元用于获取用户实时查询文本,将所述用户实时查询文本输入所述双向优化转换模型中进行连续性sql转换,获取连续sql转换语句。
5、本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
6、上述基于大型预训练模型的文本到sql转换方法,该方法首先获取准备两个数据集,分别是查询文本语料库和sql语句编码库。这两个数据集之间具有编码映射关系,即每一个查询文本都对应一个或多个sql语句的编码。随后,使用这两个数据集来训练一个双向预训练模型。这个模型包括两个部分,一部分是文本-sql转换预训练模型,它可以将输入的查询文本转换为sql语句;另一部分是sql-文本转换预训练模型,它可以将sql语句转换回可读的查询文本。这两个模型在训练过程中会共享模型参数,这样可以使它们互相学习,提高转换的准确性。之后,分析查询文本语料库中各个文本的交互时间样本,即用户查询之间的时间间隔。通过这个时间间隔的分析,识别出哪些查询是连续发生的,从而构建出一个连续查询文本语料库。然后,将这个连续查询文本语料库接入到训练好的双向预训练模型中,对模型进行进一步的训练和优化。这个过程可以帮助模型更好地学习连续查询之间的关联性,提高在连续查询场景下的转换性能。最后,当输入实时查询文本时,将这个文本输入到训练好的双向优化转换模型中,模型会根据文本的连续性和上下文信息,生成连续的sql转换语句。这样,可以通过输入自然语言查询,直接得到一系列相关的sql语句,提高查询的效率和准确性。
7、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
技术特征:1.基于大型预训练模型的文本到sql转换方法,其特征在于,所述方法包括:
2.如权利要求1所述的基于大型预训练模型的文本到sql转换方法,其特征在于,所述方法还包括:
3.如权利要求1所述的基于大型预训练模型的文本到sql转换方法,其特征在于,根据所述查询文本语料库和所述sql语句编码库进行训练,获取双向预训练模型,方法包括:
4.如权利要求1所述的基于大型预训练模型的文本到sql转换方法,其特征在于,根据所述交互时间样本进行交互连续性分析,包括:
5.如权利要求4所述的基于大型预训练模型的文本到sql转换方法,其特征在于,若相邻文本之间的时间间隔长大于所述预设间隔长,获取相邻文本对应的sql相邻语句;
6.如权利要求1所述的基于大型预训练模型的文本到sql转换方法,其特征在于,将所述用户实时查询文本输入所述双向优化转换模型中进行连续性sql转换,方法包括:
7.如权利要求1所述的基于大型预训练模型的文本到sql转换方法,其特征在于,所述方法还包括:
8.基于大型预训练模型的文本到sql转换系统,其特征在于,用于实施权利要求1至7中任意一项所述基于大型预训练模型的文本到sql转换方法的步骤,包括:
技术总结本申请涉及自然语言处理技术领域,提供基于大型预训练模型的文本到SQL转换方法及系统。所述方法包括:获取查询文本语料库和SQL语句编码库;根据这两个语料库训练双向预训练模型;识别查询文本语料库中的交互时间样本,进行交互连续性分析,获取连续查询文本语料库;用该语料库优化训练双向预训练模型,输出双向优化转换模型;将用户实时查询文本输入该模型进行连续性SQL转换,获取连续SQL转换语句。本申请解决了SQL语句一句一句识别导致出现查询重复作业的技术问题,实现了通过连续输出,使得SQL可以连续的自动转换,提高文本到SQL转换的准确率和连续性,更好地支持连续查询的效果。技术研发人员:黄钰群,黄伟群,傅志华受保护的技术使用者:深圳博瑞天下科技有限公司技术研发日:技术公布日:2024/8/20本文地址:https://www.jishuxx.com/zhuanli/20240822/281327.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表