技术新讯 > 计算推算,计数设备的制造及其应用技术 > 自然语言到SQL查询语句的转换方法、系统、装置和介质与流程  >  正文

自然语言到SQL查询语句的转换方法、系统、装置和介质与流程

  • 国知局
  • 2024-10-21 14:35:32

本发明涉及人工智能,尤其涉及一种自然语言到sql查询语句的转换方法、系统、装置和介质。

背景技术:

1、随着人工智能技术的快速发展,自然语言处理(nlp)已成为研究的热点,其目标是使计算机能够理解、解释和生成人类语言。在数据库查询领域,传统的查询方法通常需要用户具备一定的技术背景,能够编写结构化的查询语言(sql)来从数据库中检索信息。然而,这限制了非技术用户的使用,他们更倾向于使用自然语言来表达查询需求。

2、现有的技术多采用规则匹配、模板化或统计学习方法来实现自然语言到sql的转换,但这些方法在处理复杂查询,特别是涉及多表关联的查询时,存在效率低下和结果不准确的问题。例如,一些系统可能无法准确理解用户意图,导致生成的sql查询语句逻辑错误或无法执行;或者在多表关联查询中,难以准确匹配表和字段,造成查询结果不准确或遗漏重要信息。此外,现有技术在处理大量数据和复杂逻辑关系时,往往需要大量的人工干预,这不仅增加了成本,也影响了查询效率。

技术实现思路

1、本申请提供了一种自然语言到sql查询语句的转换方法、系统、装置和介质,能够将用户通过自然语言描述的查询需求,自动转换为精确的sql查询语句,提高查询效率并减少误差。

2、一种自然语言到sql查询语句的转换方法包括:获取用户输入的自然语言表达的查询指令;基于通用大语言模型进行查询指令解析,识别元数据信息,元数据信息包括:目标表名、查询字段、查询条件;利用知识图谱和神经网络模型,根据元数据信息形成sql查询语义;基于sql行业大模型使用思维链模式,将sql查询语义转换为sql查询语句;执行sql查询语句,并将查询结果返回。

3、可选的,基于通用大语言模型进行查询指令解析,识别元数据信息还包括:后端服务通过接口接收前端传过来的查询指令;结合用户历史提问信息和当前输入的文本通过多轮对话总结理解上下文信息;根据上下文信息,创建prompt提示工程并输入到通用大语言模型中识别用户意图和实体信息。

4、可选的,根据上下文信息,创建prompt提示工程并输入到通用大语言模型中识别用户意图和实体信息包括:确定模型角色、任务及执行方法,结合上下文信息及few-shot样例指导通用大语言模型进行结果生成。

5、可选的,基于通用大语言模型进行查询指令解析,识别元数据信息还包括:使用余弦相似度算法进行相似性分析,并结合多轮澄清环节,将识别出的实体信息转化可直接使用的标准实体;结合标准实体,判断是否符合sql查询的逻辑。

6、可选的,利用知识图谱和神经网络模型,根据元数据信息形成sql查询语义还包括:接收解析出的实体信息;利用知识图谱构建目标表关系序列;结合sql语义模版、目标表关系序列、查询字段和查询条件生成sql查询语义。

7、可选的,利用知识图谱构建目标表关系序列包括:对数据库中的全量表构建表关系图;从表关系图中获取与目标表有关系的表名序列;通过神经网络模型将表名序列进行向量化;利用余弦相似性算法与从表名序列中匹配获取最优匹配表序列;根据最优匹配表序列获取目标表关系序列。

8、可选的,基于sql行业大模型使用思维链模式,将sql查询语义转换为sql查询语句包括:准备训练语料并结合思维链模式创建prompt提示工程;通过prompt提示工程对sql-coder行业大模型进行微调;将sql查询语义输入微调后的sql-coder行业大模型,生成sql查询语句;对sql查询语句进行逻辑校验。

9、另一方面,一种自然语言到sql查询语句的转换系统包括:指令接收模块,用于获取用户输入的自然语言表达的查询指令;指令解析模块,用于基于通用大语言模型进行查询指令解析,识别元数据信息,元数据信息包括:目标表名、查询字段、查询条件;语义生成模块,用于利用知识图谱和神经网络模型,根据元数据信息形成sql查询语义;语句转换模块,用于基于sql行业大模型使用思维链模式,将sql查询语义转换为sql查询语句;执行模块,用于执行sql查询语句,并将查询结果返回。

10、此外,一种计算机装置包括至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的转换方法。

11、进一步地,一种计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行上述的自然语言到sql查询语句的转换方法。

12、此外,一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现以上任一项所述的自然语言到sql查询语句的转换方法的步骤。

13、通过本申请的技术方案,用户通过自然语言与数据库进行交互时,能够准确理解用户的查询意图,并生成正确的sql查询语句,无需具备专业的sql知识即可完成复杂的数据查询任务,极大地提升了查询的准确性和效率。同时,利用知识图谱和神经网络技术,能够处理多表关联等复杂查询,满足用户对大数据量、多维度分析的需求。此外,本申请的实施不局限于特定类型的数据库或应用场景,具有很好的通用性和扩展性。

14、上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。

技术特征:

1.一种自然语言到sql查询语句的转换方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,基于通用大语言模型进行查询指令解析,识别元数据信息包括:

3.根据权利要求2所述的方法,其特征在于,根据上下文信息,创建prompt提示工程并输入到通用大语言模型中识别用户意图和实体信息包括:

4.根据权利要求2所述的方法,其特征在于,基于通用大语言模型进行查询指令解析,识别元数据信息还包括:

5.根据权利要求1所述的方法,其特征在于,利用知识图谱和神经网络模型,根据元数据信息形成sql查询语义包括:

6.根据权利要求5所述的方法,其特征在于,利用知识图谱构建目标表关系序列包括:

7.根据权利要求1所述的方法,其特征在于,基于sql行业大模型使用思维链模式,将sql查询语义转换为sql查询语句包括:

8.一种自然语言到sql查询语句的转换系统,其特征在于,包括:

9.一种计算机装置,其特征在于,所述计算机装置包括:

10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行权利要求1~8任一所述的转换方法。

技术总结本发明提供了一种自然语言到SQL查询语句的转换方法、系统、装置和介质,涉及人工智能技术领域,尤其适用于提高非技术用户与数据库交互的效率和准确性。该方法通过通用大语言模型解析用户的自然语言查询指令,利用知识图谱和神经网络技术精确匹配目标表并形成SQL查询语义,再通过SQL行业大模型和思维链模式智能转换为SQL查询语句,最终执行并返回查询结果。本发明能够解决现有技术在处理复杂查询时存在的效率低和结果不准确的问题,使用户能够便捷地通过自然语言描述查询需求,实现快速、准确的数据检索。技术研发人员:姚博文,丁光宇,洪钟,武高雨,郎冠峰,刘勇钊,刘建龙,洪超受保护的技术使用者:联通(河南)产业互联网有限公司技术研发日:技术公布日:2024/10/17

本文地址:https://www.jishuxx.com/zhuanli/20241021/318675.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。