一种基于大模型组合的任务多轮对话交互方法
- 国知局
- 2024-08-08 16:53:00
本发明涉及自然语言处理(nlp)领域,具体涉及一种基于大模型组合的任务多轮对话交互方法。
背景技术:
1、随着人工智能技术的不断发展,多轮对话系统在各种应用场景中变得越来越重要。这些系统可以与用户进行自然而流畅的对话,以解决各种任务。传统的多轮对话系统通常需要大量的手工规则和领域专家的参与,使其难以扩展到不同领域和任务。近年来,大型语言模型的出现推动了多轮对话系统的发展。这些模型通过预训练和微调的方式,可以自动学习并理解自然语言,从而在多轮对话中表现出色。然而,实际中的多轮对话通常涉及超出模型本身能力之外的知识和任务,如实时信息查询、关键信息追问等,这为模型的应用提出了挑战。例如在银行智能客服中,当用户请求查询当前实时汇率或银行利率时,模型本身便不可能回答出最新的正确知识。此外,由于用户缺乏专业性,对话过程中很多问题可能缺少必要的相关信息,这个时候智能客服理应引导用户做出正确的提问,例如当用户询问当前汇率是多少时,智能客服应该引导用户说出源币种和目标币种。多轮对话系统中直接使用大型语言模型无法获得实时性知识,也无法针对缺失的槽位信息给出反问。因此,探究一种能在多轮对话中有效引导用户逐步补全槽位信息的方法,对于提升对话系统的性能与用户体验具有显著的研究意义和应用价值。
2、本发明在自然语言处理领域探究基于大模型的垂类领域多轮对话优化方法,提出一种基于大模型组合的任务多轮对话交互方法,该方法优化多轮对话系统,能针对不同的任务引导用户对槽位信息进行补充,具有较好的效果。
技术实现思路
1、本发明的目的在于针对现有技术的不足,提供了一种基于大模型组合的任务多轮对话交互方法;通过构建一个多轮对话系统,能够精准识别用户问题中的缺失槽位信息,并通过有针对性的交互逐步引导用户补全这些槽位信息,从而为用户提供更加准确、流畅的对话体验。
2、为实现上述目的,本发明提供了一种基于大模型组合的任务多轮对话交互方法,包括以下步骤:
3、s1:明确当前业务场景下的任务类型;所述任务类型包括带槽位意图、填槽意图、不带槽位意图;
4、s2:分别为意图识别大模型和槽位大模型准备相应的训练数据,包括用户意图标注数据、槽位类型标注数据、大模型的提示模板;
5、s3:通过所述步骤s2准备的用户意图标注数据,结合所述提示模板,训练意图识别大模型,所述意图识别大模型用于识别意图类型;
6、s4:通过所述步骤s2标注槽位信息的数据,训练槽位大模型,所述槽位大模型用于判断用户的输入是否包含完整的槽位信息,并提取出相应的槽位值;
7、s5:将意图识别大模型、槽位大模型及垂类大模型结合,协同工作以处理用户输入;首先,通过意图识别大模型对用户输入进行意图识别,然后根据识别出的意图,决定由哪个模型来处理对话的不同部分。
8、进一步地,所述步骤s1包括以下子步骤:
9、(1.1)任务明确:明确当前业务场景的对话中,可能出现的任务,包括专业回答任务、闲聊任务、查询任务;
10、(1.2)领域边界划分:需要槽位信息的问答任务属于带槽位的意图,用户输入槽位值以补全上一个问题的槽位属于填槽意图,直接交由垂类大模型解决的任务属于不带槽位的意图。
11、进一步地,所述步骤s2包括以下子步骤:
12、(2.1)训练样本收集:收集或生成当前业务场景下产生的对话样本,作为训练的数据;
13、(2.2)意图标签生成:为意图识别大模型的训练样本生成清晰的意图标签,即用户意图标注数据,以确保意图识别大模型能准确的识别意图;
14、(2.3)标注槽位信息:在槽位大模型的训练样本中,根据不同的意图标注这些数据可能包含用户输入的关键信息字段,包括“币种”、“金额”、“日期”以及这些字段的值,即槽位类型标注数据;
15、(2.4)提示模版设计:分别为意图识别大模型和槽位大模型设计提示模板,以引导意图识别大模型能准确识别任务意图,引导槽位大模型识别出用户对话中的槽位。
16、进一步地,训练意图识别大模型和槽位大模型包括:
17、有监督微调:使用训练样本和提示模板,对大模型进行有监督微调,训练出一个准确识别用户输入意图的意图识别大模型、以及一个准确识别槽位的槽位大模型。
18、进一步地,所述步骤s5包括以下子步骤:
19、(5.1)上下文管理:维护对话历史和上下文信息,确保不同模型之间的无缝交互和信息传递;
20、(5.2)意图路由策略:对用户输入的意图进行识别,若该意图为带槽位意图则交由槽位大模型,若为填充槽位意图则交由槽位大模型判断槽位是否补全,若为不带槽位意图则交由垂类大模型;
21、(5.3)反问策略:当槽位大模型识别出槽位有缺失时,针对不同的意图对用户进行反问,以完善所需信息。
22、为实现上述目的,本发明还提供了一种基于大模型组合的任务多轮对话交互装置,包括一个或多个处理器,用于实现上述的基于大模型组合的任务多轮对话交互方法。
23、为实现上述目的,本发明还提供了一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的基于大模型组合的任务多轮对话交互方法。
24、为实现上述目的,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的基于大模型组合的任务多轮对话交互方法。
25、本发明的有益效果是:在多轮对话中,针对某种任务可以识别用户输入中的槽位信息是否完整,引导用户对槽位信息进行补全,提供了更全面的对话交互能力。相较于传统的对话系统,本发明可以更好地应对垂直领域内的某些专业任务场景,提供更智能的对话体验,提高了对话系统的精确性和实用性。
技术特征:1.一种基于大模型组合的任务多轮对话交互方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大模型组合的任务多轮对话交互方法,其特征在于,所述步骤s1包括以下子步骤:
3.根据权利要求1所述的基于大模型组合的任务多轮对话交互方法,其特征在于,所述步骤s2包括以下子步骤:
4.根据权利要求1所述的基于大模型组合的任务多轮对话交互方法,其特征在于,训练意图识别大模型和槽位大模型包括:
5.根据权利要求1所述的基于大模型组合的任务多轮对话交互方法,其特征在于,所述步骤s5包括以下子步骤:
6.一种基于大模型组合的任务多轮对话交互装置,其特征在于,包括一个或多个处理器,用于实现权利要求1-5中任一项所述的基于大模型组合的任务多轮对话交互方法。
7.一种电子设备,包括存储器和处理器,其特征在于,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述权利要求1-5任一项所述的基于大模型组合的任务多轮对话交互方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5任一项所述的基于大模型组合的任务多轮对话交互方法。
技术总结本发明公开一种基于大模型组合的任务多轮对话交互方法,本发明通过一个意图识别大模型、一个槽位大模型以及一个通用大模型协同完成任务型多轮对话交互;首先,单独训练一个意图识别大模型,以此识别用户输入的意图类型,若识别为带槽位意图,交由槽位大模型识别槽位是否完整,并设计一套控制流程对缺少的槽位进行反问,用户再通过填充槽位将所需的信息补全;若识别为不带槽位意图,则直接交由通用大模型给出响应。本发明可为真实场景中的任务导向型多轮对话任务提供有价值的参考。技术研发人员:曹斌,赵铭健,鲍淞琳,周顺,范菁受保护的技术使用者:浙江工业大学技术研发日:技术公布日:2024/8/5本文地址:https://www.jishuxx.com/zhuanli/20240808/270966.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。