技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于大语言模型和数据库的智能问答方法、系统及设备与流程  >  正文

基于大语言模型和数据库的智能问答方法、系统及设备与流程

  • 国知局
  • 2024-09-11 14:32:55

本申请涉及自然语言处理领域,特别是涉及一种基于大语言模型和数据库的智能问答方法、系统及设备。

背景技术:

1、随着信息技术的快速发展,自然语言处理(natural language processing,nlp)和大语言模型(large language model,llm)技术已经深入到日常生活的方方面面。当然,这其中包括数据分析领域。传统的数据分析依托传统数据库或大数据技术实现,数据分析通常需要人工编写相应的统计报表语句,可能还需要对结果进一步处理,应对场景单一,效率不高,且对操作人员技术要求较高,这限制了其处理复杂、多变用户查询的能力。为了克服这些局限性,研究人员开始探索通过llm直接将自然语言(natural language,nl)转换为结构化查询语言(structured query language,sql),将其称为文本转结构化查询语言(text to structured query language,text2sql)。通过text2sql技术构建的数据分析系统或智能问答系统能够灵活、快速响应用户对于数据分析场景的需求,降低用户的使用门槛,增强了用户交互。

2、llm在text2sql技术上的应用虽然为自然语言与数据库之间的交互带来了显著便利,但在现有技术背景下,仍然存在一些不容忽视的缺点。

3、1、数据理解和推理能力不足:尽管大语言模型在理解和生成自然语言方面取得了显著进步,但它们对复杂数据库查询和推理的理解能力仍然有限,在数据分析时生成的数据库查询语句不够准确,导致结果不正确,在处理某些复杂的、需要深层逻辑推理的问题时表现不佳。

4、2、依赖特定的数据库结构:虽然目前的大模型智能问答系统旨在降低用户的使用门槛,但它仍然需要适应特定的数据库结构和模式。对于具有不同数据库架构或数据格式的组织来说,需要定制化的解决方案或额外的开发工作。

5、3、可解释性不足:虽然目前的大模型智能问答系统能够生成自然语言答案和图表结果,但它无法提供足够的信息来解释为什么选择了特定的数据或答案,导致用户对结果的信任度降低,尤其是在涉及重要决策的情况下。

6、4、用户体验较差:目前的大模型智能问答系统提供了自然语言交互和图文并茂的输出结果,但无法根据用户的个人偏好或习惯进行个性化调整,限制了大模型智能问答系统在某些特定用户群体中的吸引力。

技术实现思路

1、本申请的目的是提供一种基于大语言模型和数据库的智能问答方法、系统及设备,可提高智能问答过程中生成回答的精度。

2、为实现上述目的,本申请提供了如下方案。

3、第一方面,本申请提供了一种基于大语言模型和数据库的智能问答方法,包括:

4、将数据库中各数据表存储的信息转换为文本字符串,得到文本字符串集合;所述数据库为预先构建的知识数据库;

5、将所述文本字符串集合中的每个文本字符串均转换为向量表示,得到多个知识向量;

6、获取用户问题,并将所述用户问题转换为向量表示,得到问题向量;

7、分别计算所述问题向量与每个知识向量的相似度,并根据所述问题向量与每个知识向量的相似度确定多个相关知识向量;

8、根据各相关知识向量对应的文本字符串及所述用户问题,构建第一提示词,并基于预先训练好的第一大语言模型,根据所述第一提示词确定第一回答;

9、根据所述用户问题及所述文本字符串集合,构建第二提示词,并基于预先训练好的第二大语言模型,根据所述第二提示词,将所述用户问题转换为结构化查询语言语句;

10、在所述数据库中执行所述结构化查询语言语句,得到第二回答;

11、根据所述第一回答及所述第二回答,确定最终回答。

12、第二方面,本申请提供了一种基于大语言模型和数据库的智能问答系统,包括:

13、数据库数据处理模块,用于将数据库中各数据表存储的信息转换为文本字符串,得到文本字符串集合;所述数据库为预先构建的知识数据库;

14、向量化处理模块,与所述数据库数据处理模块连接,用于将所述文本字符串集合中的每个文本字符串均转换为向量表示,得到多个知识向量,获取用户问题,并将所述用户问题转换为向量表示,得到问题向量;

15、大模型检索生成模块,与所述向量化处理模块连接,用于分别计算所述问题向量与每个知识向量的相似度,并根据所述问题向量与每个知识向量的相似度确定多个相关知识向量,根据各相关知识向量对应的文本字符串及所述用户问题,构建第一提示词,并基于预先训练好的第一大语言模型,根据所述第一提示词确定第一回答;

16、大模型文本转语句模块,与所述向量化处理模块连接,用于根据所述用户问题及所述文本字符串集合,构建第二提示词,并基于预先训练好的第二大语言模型,根据所述第二提示词,将所述用户问题转换为结构化查询语言语句;

17、结构化查询语言执行模块,与所述大模型文本转语句模块连接,用于在所述数据库中执行所述结构化查询语言语句,得到第二回答;

18、回答输出模块,分别与所述大模型检索生成模块及所述结构化查询语言执行模块连接,用于根据所述第一回答及所述第二回答,确定最终回答。

19、第三方面,本申请提供了一种计算机设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述的基于大语言模型和数据库的智能问答方法。

20、根据本申请提供的具体实施例,本申请公开了以下技术效果:本申请提供了一种基于大语言模型和数据库的智能问答方法、系统及设备,通过将数据库中各数据表存储的信息转换为文本字符串,并将文本字符串和用户问题均转换为向量表示,采用检索增强生成技术确定多个相关知识向量,并结合大语言模型生成第一回答,再根据用户问题及文本字符串集合,采用大语言模型将用户问题转换为结构化查询语言语句,并在数据库中执行结构化查询语言语句,生成第二回答,最后根据第一回答和第二回答确定最终回答。将检索增强生成技术、大语言模型以及text2sql技术相结合,提高了智能问答过程中生成回答的精度,同时增强了用户对智能问答过程的信任度和满意度。

技术特征:

1.一种基于大语言模型和数据库的智能问答方法,其特征在于,所述基于大语言模型和数据库的智能问答方法包括:

2.根据权利要求1所述的基于大语言模型和数据库的智能问答方法,其特征在于,所述文本字符串的格式为markdown格式、字符分隔值格式或json格式。

3.根据权利要求1所述的基于大语言模型和数据库的智能问答方法,其特征在于,所述文本字符串集合中的每个文本字符串均包括表结构信息及内容信息;所述文本字符串集合中的每个文本字符串对应所述数据库中的一张数据表,或者所述文本字符串集合中的每个文本字符串对应所述数据库中数据表的一条记录。

4.根据权利要求1所述的基于大语言模型和数据库的智能问答方法,其特征在于,采用嵌入式大语言模型将所述文本字符串集合中的每个文本字符串均转换为向量表示;采用嵌入式大语言模型将所述用户问题转换为向量表示。

5.根据权利要求1所述的基于大语言模型和数据库的智能问答方法,其特征在于,根据所述问题向量与每个知识向量的相似度确定多个相关知识向量,具体包括:

6.根据权利要求1所述的基于大语言模型和数据库的智能问答方法,其特征在于,所述第一大语言模型为对话大语言模型;所述第二大语言模型为对话大语言模型或文本转结构化查询语言的大语言模型。

7.根据权利要求1所述的基于大语言模型和数据库的智能问答方法,其特征在于,在所述数据库中执行所述结构化查询语言语句,得到第二回答,具体包括:

8.根据权利要求1所述的基于大语言模型和数据库的智能问答方法,其特征在于,所述第一回答为文本形式;所述第二回答为表格形式。

9.一种基于大语言模型和数据库的智能问答系统,应用于权利要求1-8中任一项所述的基于大语言模型和数据库的智能问答方法,其特征在于,所述基于大语言模型和数据库的智能问答系统包括:

10.一种计算机设备,包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-8中任一项所述的基于大语言模型和数据库的智能问答方法。

技术总结本申请公开了一种基于大语言模型和数据库的智能问答方法、系统及设备,涉及自然语言处理领域,该方法包括:将数据库中存储的信息转换为文本字符串,并转换为向量表示,得到多个知识向量;将用户问题转换为向量表示,得到问题向量;计算问题向量与每个知识向量的相似度,确定多个相关知识向量;根据各相关知识向量对应的文本字符串及用户问题构建第一提示词,并基于第一大语言模型确定第一回答;根据用户问题及文本字符串集合构建第二提示词,并基于第二大语言模型将用户问题转换为结构化查询语言语句;在数据库中执行结构化查询语言语句,得到第二回答;根据第一回答及第二回答确定最终回答,本申请提高了智能问答过程中生成回答的精度。技术研发人员:谷跃飞,李世奇,夏博,李国东受保护的技术使用者:语仓科技(北京)有限公司技术研发日:技术公布日:2024/9/9

本文地址:https://www.jishuxx.com/zhuanli/20240911/291346.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。