技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于大模型的对话处理方法、对话方法、装置及电子设备与流程  >  正文

基于大模型的对话处理方法、对话方法、装置及电子设备与流程

  • 国知局
  • 2024-10-09 14:43:45

本公开涉及人工智能,具体为自然语言处理、大模型、深度学习等领域,可应用于智能客服、车载交互、智能体等场景,尤其涉及一种基于大模型的对话处理方法、对话方法、装置及电子设备。

背景技术:

1、理解、生成、逻辑、记忆是大模型能力的四个重要拼图,记忆能力是体现大模型智能化必不可少的功能。当前大模型本身不具备记忆能力,相关技术中,大模型在与用户对话时,通常是将用户和大模型的历史对话,按照时间顺序进行拼接,作为当前对话的历史信息,输入给大模型作为记忆参考,进而结合记忆参考生成回复。这种方式会引入过多的上下文,计算量大。

技术实现思路

1、本公开提供了一种基于大模型的对话处理方法、对话方法、装置及电子设备。

2、根据本公开的第一方面,提供了一种基于大模型的对话处理方法,包括:

3、获取目标对话场景下的至少一轮对话记录;

4、基于至少一轮所述对话记录,确定任一对话主体对应的记忆内容以及所述记忆内容的内容类别;

5、将所述目标对话场景、各个对话主体对应的所述记忆内容以及所述记忆内容的内容类别,进行关联存储得到记忆数据,其中,所述记忆数据用于所述目标对话场景下的对话生成。

6、根据本公开的第二方面,提供了一种基于大模型的对话方法,包括:

7、获取目标对话场景下的问题;

8、基于所述目标对话场景和所述问题,从记忆数据中确定与所述问题相关联的各个对话主体对应的记忆内容及其内容类别;

9、根据所述内容类别和对应的记忆内容生成所述问题的回复。

10、根据本公开的第三方面,提供了一种基于大模型的对话处理装置,包括:

11、记录获取模块,用于获取目标对话场景下的至少一轮对话记录;

12、第一确定模块,用于基于至少一轮所述对话记录,确定任一对话主体对应的记忆内容以及所述记忆内容的内容类别;

13、第一存储模块,用于将所述目标对话场景、各个对话主体对应的所述记忆内容以及所述记忆内容的内容类别,进行关联存储得到记忆数据,其中,所述记忆数据用于所述目标对话场景下的对话生成。

14、根据本公开的第四方面,提供了一种基于大模型的对话装置,包括:

15、问题获取模块,用于获取目标对话场景下的问题;

16、第一确定模块,用于基于所述目标对话场景和所述问题,从记忆数据中确定与所述问题相关联的各个对话主体对应的记忆内容及其内容类别;

17、第一回复模块,用于根据所述内容类别和对应的记忆内容生成所述问题的回复。

18、根据本公开的第五方面,提供了一种电子设备,包括:

19、至少一个处理器;以及

20、与所述至少一个处理器通信连接的存储器;其中,

21、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的基于大模型的对话处理方法或第二方面所述的基于大模型的对话方法。

22、根据本公开第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面所述的基于大模型的对话处理方法或第二方面所述的基于大模型的对话方法。

23、根据本公开的第七方面,提供了一种计算机程序产品,包括计算机指令,所述计算机指令在被处理器执行时实现如第一方面所述的基于大模型的对话处理方法或第二方面所述的基于大模型的对话方法的步骤。

24、本公开提供的一种基于大模型的对话处理方法、对话方法、装置及电子设备,存在如下有益效果:

25、获取目标对话场景下的至少一轮对话记录;基于至少一轮对话记录,确定任一对话主体对应的记忆内容以及记忆内容的内容类别;将目标对话场景、各个对话主体对应的记忆内容以及记忆内容的内容类别,进行关联存储得到记忆数据,其中,记忆数据用于目标对话场景下的对话生成。本公开基于对话记录确定记忆内容和其内容类别,提取了对话记录中的有效信息,避免对话生成时引入过多的上下文,减少计算量。

26、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种基于大模型的对话处理方法,包括:

2.根据权利要求1所述的方法,其中,所述基于至少一轮所述对话记录,确定各个对话主体对应的记忆内容以及所述记忆内容的内容类别,包括:

3.根据权利要求1所述的方法,其中,所述基于至少一轮所述对话记录,确定各个对话主体对应的记忆内容以及所述记忆内容的内容类别,包括:

4.根据权利要求1-3任一项所述的方法,其中,所述方法还包括:

5.根据权利要求4所述的方法,其中,所述方法还包括:

6.根据权利要求1所述的方法,其中,所述对话主体包括答复主体,所述答复主体设定为目标角色,所述方法还包括:

7.一种基于大模型的对话方法,包括:

8.根据权利要求7所述的方法,其中,所述基于所述目标对话场景和所述问题,从记忆数据中确定与所述问题相关联的各个对话主体对应的记忆内容及其内容类别,包括:

9.根据权利要求7所述的方法,其中,所述根据所述内容类别和对应的记忆内容生成所述问题的回复,包括:

10.根据权利要求9所述的方法,其中,所述根据所述内容类别对应的记忆内容和与所述问题相匹配的记忆内容,生成所述问题的回复,包括:

11.根据权利要求7-10任一项所述的方法,其中,所述问题是向设定为目标角色的答复主体提出,所述方法还包括:

12.一种基于大模型的对话处理装置,包括:

13.根据权利要求12所述的装置,其中,所述第一确定模块,用于:

14.根据权利要求12所述的装置,其中,所述第一确定模块,用于:

15.根据权利要求12-14任一项所述的装置,其中,所述装置还包括:

16.根据权利要求15所述的装置,其中,所述装置还包括:

17.根据权利要求12所述的装置,其中,所述对话主体包括答复主体,所述答复主体设定为目标角色,所述装置还包括:

18.一种基于大模型的对话装置,包括:

19.根据权利要求18所述的装置,其中,所述第一确定模块,用于:

20.根据权利要求18所述的装置,其中,所述第一回复模块,用于:

21.根据权利要求20所述的装置,其中,所述第一回复模块,用于:

22.根据权利要求18-21任一项所述的装置,其中,所述问题是向设定为目标角色的答复主体提出,所述装置还包括:

23.一种电子设备,包括:

24.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6或7-11中任一项所述的方法。

25.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6或7-11中任一项所述的方法。

技术总结本公开提供了一种基于大模型的对话处理方法、对话方法、装置及电子设备,涉及人工智能技术领域,尤其涉及自然语言处理、大模型、深度学习等领域,可应用于智能客服、车载交互、智能体等场景。具体实现方案为:获取目标对话场景下的至少一轮对话记录;基于至少一轮对话记录,确定任一对话主体对应的记忆内容以及记忆内容的内容类别;将目标对话场景、各个对话主体对应的记忆内容以及记忆内容的内容类别,进行关联存储得到记忆数据,其中,记忆数据用于目标对话场景下的对话生成。本公开基于对话记录确定记忆内容和其内容类别,提取了对话记录中的有效信息,避免对话生成时引入过多的上下文,减少计算量。技术研发人员:闻一鸣,雷泽阳,林辉,雍高鹏,杨帅,王洋,鲍思琪,丁鑫哲,龙思怡受保护的技术使用者:北京百度网讯科技有限公司技术研发日:技术公布日:2024/9/29

本文地址:https://www.jishuxx.com/zhuanli/20241009/306270.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。