基于大语言模型和知识图谱的多轮问答方法和问答系统与流程
- 国知局
- 2024-07-31 23:19:26
本发明涉及人工智能,尤其涉及基于大语言模型和知识图谱的多轮问答方法和问答系统。
背景技术:
1、传统的政务问答系统通常基于预先构建的政务知识图谱,能够在预训练的政务知识体系内实现精准问答,但是政务知识体系外的问题无法回答,更无法实现多轮问答。
2、大语言模型(large language model,llm)是自然语言处理(nlp)领域的一种模型,它利用深度学习技术,通过训练大量文本数据来学习语言的结构和规律。这种模型具有强大的文本生成和理解能力,可以完成多种nlp任务,如问答系统、文本分类、情感分析和摘要生成等。但是,在政务问答系统中若直接使用大语言模型进行智能回答,需要利用政务知识体系内、外的大量数据训练大语言模型,造成模型训练成本和人工成本不可控,并且大语言模型无法精准回答问题。
3、因此,对于政务问答系统如何在成本可控的前提下实现多轮准确回答是当前要解决的技术问题。
技术实现思路
1、本发明旨在解决现有技术中政务问答系统无法兼容成本和回答精准性,以及无法实现多轮问答的技术问题,提供基于大语言模型和知识图谱的多轮问答方法和问答系统。
2、为了实现本发明的上述目的,根据本发明的第一个方面,本发明提供了基于大语言模型和知识图谱的多轮问答方法,重复执行步骤s1到步骤s3直到对话结束:步骤s1,读取当前用户输入的问题;步骤s2,将所述问题中的实体和关系与预先构建的政务知识图谱的实体和关系映射,若所述政务知识图谱命中答案,则输出所述答案,若所述政务知识图谱未命中答案,则执行步骤s3;步骤s3,提取存储的多轮历史问答记录,将所述多轮历史问答记录和所述问题输入预先训练好的大语言模型,所述大语言模型生成自然语言回答,输出所述自然语言回答。
3、为了实现本发明的上述目的,根据本发明的第二个方面,本发明提供了基于大语言模型和知识图谱的多轮问答系统,包括:用户接口模块,用于输入用户的问题并存储多轮历史问答记录;知识图谱回答模块,用于读取当前用户输入的问题,将所述问题中的实体和关系与预先构建的政务知识图谱的实体和关系映射,若所述政务知识图谱命中答案,输出所述答案,若所述政务知识图谱未命中答案,则将所述问题转发至大语言模型模块;大语言模型模块,从用户接口模块提取存储的多轮历史问答记录,将多轮历史问答记录和所述问题输入预先训练好的大语言模型,所述大语言模型生成自然语言回答,输出所述自然语言回答至用户接口模块输出。
4、为了实现本发明的上述目的,根据本发明的第三个方面,本发明提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本发明第一方面所述的基于大语言模型和知识图谱的多轮问答方法的步骤。
5、为了实现本发明的上述目的,根据本发明的第四个方面,本发明提供了一种电子设备,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明第一方面所述的基于大语言模型和知识图谱的多轮问答方法。
6、本发明结合了大语言模型和政务知识图谱来回答用户问题,在本发明提供的技术方案中,首先将用户问题在预先构建的政务知识图谱中进行映射,根据映射结果判断政务知识图谱是否命中答案,若命中则直接输出答案给用户,若未命中答案,将用户问题和存储的历史多轮问答一起输入预先训练好的大语言模型中,借助大语言模型的强大推断能力,通过联系历史多轮问答能够理解用户问题的多个方面和细节,给出更为全面的自然语言回答;同时,通过大语言模型还可以在多轮问答中保持连贯性和一致性,提供更加流畅的用户体验,相比直接使用大语言模型本发明技术方案在计算资源、存储空间、维护和更新等方面的成本更低,政务知识图谱负责精准问答,大语言模型负责多轮问答和自然语言回复,还能够在持续的使用中优化多轮问答的效率。
技术特征:1.基于大语言模型和知识图谱的多轮问答方法,其特征在于,重复执行步骤s1到步骤s3直到对话结束:
2.如权利要求1所述的基于大语言模型和知识图谱的多轮问答方法,其特征在于,存储的多轮历史问答记录的轮数设置方法为:
3.如权利要求2所述的基于大语言模型和知识图谱的多轮问答方法,其特征在于,多轮轮数阈值取值范围为5到10。
4.如权利要求2所述的基于大语言模型和知识图谱的多轮问答方法,其特征在于,若所述政务知识图谱未命中答案,计算本轮多轮轮数阈值,清除本轮多轮轮数阈值之前的历史问答,使存储的问答轮数小于或等于本轮多轮轮数阈值;
5.如权利要求4所述的基于大语言模型和知识图谱的多轮问答方法,其特征在于,本轮多轮轮数阈值计算公式为:
6.基于大语言模型和知识图谱的多轮问答系统,用于实现权利要求1-5之一所述的基于大语言模型和知识图谱的多轮问答方法,其特征在于,包括:
7.如权利要求6所述的基于大语言模型和知识图谱的多轮问答系统,其特征在于,用户接口模块存储的多轮历史问答记录的轮数设置方法为:
8.如权利要求6所述的基于大语言模型和知识图谱的多轮问答系统,其特征在于,若所述政务知识图谱未命中答案,计算本轮多轮轮数阈值,清除本轮多轮轮数阈值之前的历史问答,使存储的问答轮数小于或等于本轮多轮轮数阈值,其中,本轮多轮轮数阈值根据上轮存储的问答轮数、本轮政务知识图谱未命中时返回的数据条数和全局配置因子计算获得。
9.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-5之一所述方法的步骤。
10.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1到5中任意一项所述的基于大语言模型和知识图谱的多轮问答方法。
技术总结本发明提供了基于大语言模型和知识图谱的多轮问答方法和问答系统。多轮问答方法包括:S1,读取当前用户输入的问题;S2,将所述问题中的实体和关系与预先构建的政务知识图谱的实体和关系映射,若所述政务知识图谱命中答案,则输出所述答案,若所述政务知识图谱未命中答案,则执行S3;S3,提取存储的多轮历史问答记录,将所述多轮历史问答记录和所述问题输入预先训练好的大语言模型,所述大语言模型生成自然语言回答,输出所述自然语言回答。本发明相比直接使用大语言模型在计算资源、存储空间、维护和更新等方面的成本更低,政务知识图谱负责精准问答,大模型负责多轮问答和自然语言回复,能够在持续的使用中优化多轮问答的效率。技术研发人员:郭林元,吴敏,田雪,杨志,温智宇,侯丹受保护的技术使用者:数字重庆大数据应用发展有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/197010.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表