数据库查询语句生成方法、装置、计算机设备和存储介质与流程
- 国知局
- 2024-12-06 12:17:44
本技术涉及自然语言处理,特别是涉及一种数据库查询语句生成方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、nl2sql(natural language to sql)是一种将自然语言查询(natural languageprocessing,nlp)语句转换为结构化查询语言(structured query language,sql)语句的技术。在电力场景中,这种技术使非技术电力工作人员能够使用日常语言与数据库进行交互,从而降低了非技术电力工作人员访问和操作数据库的门槛。
2、传统技术中,nl2sql技术常通过机器学习或者深度学习模型来将自然语言查询语句,然而机器学习或者深度学习模型需要预先学习数据库所有的表结构,或者将数据库所有的表结构输入到模型中,以供模型基于表结构生成结构化查询语言语句,导致模型需要处理超长的上下文信息,造成模型的推理速度较慢。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提升模型推理速度的数据库查询语句生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种数据库查询语句生成方法。所述方法包括:
3、对待查询文本进行文本向量化处理,得到所述待查询文本对应的文本向量;
4、根据向量数据库,对所述文本向量进行检索处理,得到与所述文本向量关联的数据库表名和数据库查询例句;所述向量数据库根据数据库语料对应的语料文本向量构建得到;
5、根据所述数据库表名和所述数据库查询例句,得到所述待查询文本的提示词;
6、将所述提示词输入至经训练的大模型中,得到所述待查询文本的结构化查询语句;所述结构化查询语句用于进行数据库查询处理。
7、在其中一个实施例中,对待查询文本进行文本向量化处理,得到所述待查询文本对应的文本向量,包括:
8、根据预设的词表,将所述待查询文本转换为词编号;所述词编号用于表征所述待查询文本中的待查询词语对应的词编号;
9、将所述词编号,输入至经训练的文本向量化模型中,得到所述待查询文本的初始文本向量;
10、根据所述数据库语料的加权矩阵,对所述初始文本向量进行加权平均处理,得到所述待查询文本对应的文本向量。
11、在其中一个实施例中,词表中存储有多个预设词语,以及存储有所述预设词语与所述词编号之间的映射关系;
12、所述根据预设的词表,将所述待查询文本转换为词编号,包括:
13、根据所述预设词语,对所述待查询文本进行分词处理,得到所述待查询文本对应的待查询词语;
14、根据所述映射关系,确定所述待查询词语对应的词编号。
15、在其中一个实施例中,根据向量数据库,对所述文本向量进行检索处理,得到与所述文本向量关联的数据库表名和数据库查询例句,包括:
16、确定所述向量数据库对应的多层图结构;所述多层图结构包括层间依次连接最高层子图、中间层子图和最底层子图;所述最高层子图中的节点表示所述语料文本向量;所述最底层子图中的节点表示所述数据库表名或者所述数据库查询语句;
17、根据所述多层图结构,对所述文本向量进行分层导航小世界图检索处理,得到与所述文本向量关联的数据库表名和数据库查询例句。
18、在其中一个实施例中,根据所述多层图结构,对所述文本向量进行分层导航小世界图检索处理,得到与所述文本向量关联的数据库表名和数据库查询例句,包括:
19、基于所述文本向量,确定所述最高层子图中的检索根节点;
20、从所述检索根节点开始,依次对所述最高层子图、所述中间层子图和所述最底层子图进行最近邻检索处理,得到所述最底层子图的最近邻检索结果;
21、根据所述最近邻检索结果,得到所述数据库表名和所述数据库查询例句。
22、在其中一个实施例中,在将所述提示词输入至经训练的大模型中,得到所述待查询文本的结构化查询语句之后,还包括:
23、在数据库中执行所述结构化查询语句,得到数据库执行结果;
24、将所述数据库执行结果返回至提供所述待查询文本的客户端。
25、第二方面,本技术还提供了一种数据库查询语句生成装置。所述装置包括:
26、文本向量化模块,用于对待查询文本进行文本向量化处理,得到所述待查询文本对应的文本向量;
27、向量检索模块,用于根据向量数据库,对所述文本向量进行检索处理,得到与所述文本向量关联的数据库表名和数据库查询例句;所述向量数据库根据数据库语料对应的语料文本向量构建得到;
28、提示词生成模块,用于根据所述数据库表名和所述数据库查询例句,得到所述待查询文本的提示词;
29、语句生成模块,用于将所述提示词输入至经训练的大模型中,得到所述待查询文本的结构化查询语句;所述结构化查询语句用于进行数据库查询处理。
30、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
31、对待查询文本进行文本向量化处理,得到所述待查询文本对应的文本向量;
32、根据向量数据库,对所述文本向量进行检索处理,得到与所述文本向量关联的数据库表名和数据库查询例句;所述向量数据库根据数据库语料对应的语料文本向量构建得到;
33、根据所述数据库表名和所述数据库查询例句,得到所述待查询文本的提示词;
34、将所述提示词输入至经训练的大模型中,得到所述待查询文本的结构化查询语句;所述结构化查询语句用于进行数据库查询处理。
35、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
36、对待查询文本进行文本向量化处理,得到所述待查询文本对应的文本向量;
37、根据向量数据库,对所述文本向量进行检索处理,得到与所述文本向量关联的数据库表名和数据库查询例句;所述向量数据库根据数据库语料对应的语料文本向量构建得到;
38、根据所述数据库表名和所述数据库查询例句,得到所述待查询文本的提示词;
39、将所述提示词输入至经训练的大模型中,得到所述待查询文本的结构化查询语句;所述结构化查询语句用于进行数据库查询处理。
40、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
41、对待查询文本进行文本向量化处理,得到所述待查询文本对应的文本向量;
42、根据向量数据库,对所述文本向量进行检索处理,得到与所述文本向量关联的数据库表名和数据库查询例句;所述向量数据库根据数据库语料对应的语料文本向量构建得到;
43、根据所述数据库表名和所述数据库查询例句,得到所述待查询文本的提示词;
44、将所述提示词输入至经训练的大模型中,得到所述待查询文本的结构化查询语句;所述结构化查询语句用于进行数据库查询处理。
45、上述数据库查询语句生成方法、装置、计算机设备、存储介质和计算机程序产品,对待查询文本进行文本向量化处理,得到待查询文本对应的文本向量;根据向量数据库,对文本向量进行检索处理,得到与文本向量关联的数据库表名和数据库查询例句;向量数据库根据数据库语料对应的语料文本向量构建得到;根据数据库表名和数据库查询例句,得到待查询文本的提示词;将提示词输入至经训练的大模型中,得到待查询文本的结构化查询语句;结构化查询语句用于进行数据库查询处理。采用本方法,通过由待查询文本转换得到的文本向量,从向量数据库中检索出与文本向量相近的数据库表名和数据库查询例句,进而基于数据库表名和数据库查询例句来生成提示词,有效地减少了需输入大模型中的提示词的数量,从而提升了大模型的推理速度;而且能够确保待查询文本与基于提示词生成的结构化查询语句是强相关的,还提升了大模型生成结构化查询语句的准确性。
本文地址:https://www.jishuxx.com/zhuanli/20241204/340499.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。