一种智能问答方法及装置与流程
- 国知局
- 2024-07-31 23:11:43
本发明涉及自然语言处理,特别是涉及一种智能问答方法及装置。
背景技术:
1、目前,通过撰写sql等结构化查询语句查询数据是关系型数据库的主要使用方法。但是,由于其专业性强,对于非技术专业人员不易掌握,基于此,需要允许用户以自然语言与数据库进行交互,以降低数据库的使用门槛。
2、现在技术中,通过构造用于sql语句生成的prompt模板作为大模型的输入,从而得到对应的sql语句。但是,大模型技术存在幻觉问题,即生成结果中含有与输入事实上冲突的内容,例如生成的sql语句中存在数据库中不存在的表名或列名,从而导致语句无法正常执行,降低了模型的可靠性;并且实际应用中数据库表名和列名通常为无意义或难以理解的英文缩写,若将该英文缩写未经处理直接输入大模型,大模型可能难以捕捉到其真实的语义信息,从而使得通过大模型生成的sql语句准确率低。
技术实现思路
1、本发明提供了一种智能问答方法及装置,以解决上述现有技术中模型的可靠性低,生成的sql语句准确率低的技术问题。
2、为此,本发明提出了一种智能问答方法,可以通过第一问题数据对应的第一数据表关键数据和第一限定范围,生成第一问题数据对应的目标问题数据,从而确保目标问题数据中的数据完整且语义明确,进而使得目标领域大模型避免存在幻觉问题,可以捕捉到真实的语义信息,提高了模型的可靠性和生成的sql语句准确率。
3、本发明的另一个目的在于提出一种智能问答装置。
4、为达上述目的,本发明一方面提出一种智能问答方法,所述方法包括:
5、获取用户输入目标领域的第一问题数据,并将所述第一问题数据输入训练完成的语义映射模型中,得到所述第一问题数据对应的第一数据表关键数据;
6、对所述第一数据表关键数据进行约束限制,得到所述第一问题数据对应的第一限定范围;
7、基于所述第一问题数据、所述第一数据表关键数据和所述第一限定范围生成目标问题数据;
8、将所述目标问题数据输入目标领域大模型中,得到回答所述第一问题数据的sql语句。
9、本发明实施例的智能问答方法还可以具有以下附加技术特征:
10、在本发明的一个实施例中,所述对所述第一数据表关键数据进行约束限制,得到所述第一问题数据对应的第一限定范围,包括:
11、根据所述第一数据表关键数据生成对应的关键值范围和多表联合范围;
12、将所述关键值范围和多表联合范围,确定为所述第一问题数据对应的第一限定范围。
13、在本发明的一个实施例中,所述将所述目标问题数据输入目标领域大模型中之前,所述方法还包括:
14、构建训练数据集;
15、将预设适配器注入预训练领域大模型基座,并基于所述训练数据集对注入所述预设适配器进行训练,得到目标领域大模型。
16、在本发明的一个实施例中,所述构建训练数据集,包括:
17、获取用于训练目标领域的问题数据集,将所述问题数据集中的第二问题数据输入训练完成的语义映射模型中,得到所述第二问题数据对应的第二数据表关键数据;
18、对所述第二数据表关键数据进行约束限制,得到所述第二问题数据对应的第二限定范围;
19、基于所述第二问题数据、所述第二数据表关键数据和所述第二限定范围得到训练数据集。
20、在本发明的一个实施例中,所述将所述目标问题数据输入目标领域大模型中,得到回答所述第一问题数据的sql语句,包括:
21、将所述目标问题数据输入目标领域大模型中,得到回答所述第一问题数据的初始sql语句;
22、将所述初始sql语句中的中文表示的数据表字段还原为对应数据库中的原始字段,得到回答所述第一问题数据的sql语句。
23、在本发明的一个实施例中,所述将所述目标问题数据输入目标领域大模型中,得到回答所述第一问题数据的sql语句之后,所述方法还包括:
24、获取所述用户输入目标领域的第三问题数据,其中,所述第三问题数据为回答所述用户上一轮问题数据后得到的;
25、重复上述步骤,得到所述第三问题数据对应的第三数据表关键数据和第三限定范围;
26、将所述第三问题数据上一轮问题数据的目标问题数据和sql语句,与所述第三问题数据、所述第三数据表关键数据和所述第三限定范围形成上下文文本数据;
27、将所述上下文文本数据输入所述目标领域大模型中,得到回答所述第三问题数据的sql语句。
28、为达上述目的,本发明另一方面提出一种智能问答装置,所述装置包括:
29、获取模块,用于获取用户输入目标领域的第一问题数据,并将所述第一问题数据输入训练完成的语义映射模型中,得到所述第一问题数据对应的第一数据表关键数据;
30、第一处理模块,用于对所述第一数据表关键数据进行约束限制,得到所述第一问题数据对应的第一限定范围;
31、生成模块,用于基于所述第一问题数据、所述第一数据表关键数据和所述第一限定范围生成目标问题数据;
32、第二处理模块,用于将所述目标问题数据输入目标领域大模型中,得到回答所述第一问题数据的sql语句。
33、本发明的另一个目的在于提出一种电子设备,包括:
34、至少一个处理器;以及
35、与所述至少一个处理器通信连接的存储器;其中,
36、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述一方面中任一项所述的方法。
37、本发明的另一个目的在于提出一种计算机存储介质,其中,计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后使计算机执行前述一方面中任一项所述的方法。
38、本发明实施例的智能问答方法和装置,可以通过第一问题数据对应的第一数据表关键数据和第一限定范围,生成第一问题数据对应的目标问题数据,从而确保目标问题数据中的数据完整且语义明确,进而使得目标领域大模型避免存在幻觉问题,可以捕捉到真实的语义信息,提高了模型的可靠性和生成的sql语句准确率。
39、本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
技术特征:1.一种智能问答方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述第一数据表关键数据进行约束限制,得到所述第一问题数据对应的第一限定范围,包括:
3.根据权利要求1所述的方法,其特征在于,所述将所述目标问题数据输入目标领域大模型中之前,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述构建训练数据集,包括:
5.根据权利要求1所述的方法,其特征在于,所述将所述目标问题数据输入目标领域大模型中,得到回答所述第一问题数据的sql语句,包括:
6.根据权利要求1所述的方法,其特征在于,所述将所述目标问题数据输入目标领域大模型中,得到回答所述第一问题数据的sql语句之后,所述方法还包括:
7.一种智能问答装置,其特征在于,所述装置包括:
8.根据权利要求7所述的装置,其特征在于,所述第一处理模块,具体用于:
9.一种电子设备,包括:
10.一种计算机存储介质,其中,所述计算机存储介质存储有计算机可执行指令;所述计算机可执行指令被处理器执行后,能够实现如权利要求1-6中任一所述的方法。
技术总结本发明公开了智能问答方法及装置,该方法包括,获取用户输入目标领域的第一问题数据,并将第一问题数据输入训练完成的语义映射模型中,得到第一问题数据对应的第一数据表关键数据;对第一数据表关键数据进行约束限制,得到第一问题数据对应的第一限定范围;基于第一问题数据、第一数据表关键数据和第一限定范围生成目标问题数据;将目标问题数据输入目标领域大模型中,得到回答第一问题数据的SQL语句。由此,本发明确保目标问题数据中的数据完整且语义明确,进而使得目标领域大模型避免存在幻觉问题,捕捉到真实的语义信息,提高了模型的可靠性和生成的SQL语句准确率。技术研发人员:张雨,戴桢锦,刘梅琛,李昊受保护的技术使用者:人保信息科技有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/196329.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表