技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于大模型的意图识别方法、装置、电子设备及存储介质与流程 > 正文

基于大模型的意图识别方法、装置、电子设备及存储介质与流程

国知局
2024-11-18 18:20:48

本公开涉及计算机，尤其涉及涉及自然语言处理、大模型等人工智能，具体涉及一种基于大模型的意图识别方法、装置、电子设备及存储介质。

背景技术：

1、随着人工智能(artificial intelligence，ai)技术的不断发展，人机交互的方式由命令式向对话式不断演变。其中，针对对话式人机交互场景(如意图识别系统、推荐系统、舆情系统、检索系统、文本分类系统等)，首先需要理解用户意图，而后才能基于用户意图，给出用户想要的答案。因此，如何识别用户意图，对于对话式人机交互场景是非常重要的。

技术实现思路

1、本公开提供了一种基于大模型的意图识别方法、装置、电子设备及存储介质。

2、根据本公开的第一方面，提供了一种基于大模型的意图识别方法，包括：

3、获取查询语句、预设意图及所述预设意图的描述信息；

4、将所述查询语句与所述预设意图及所述预设意图的描述信息进行匹配，以获取所述查询语句对应的第一候选意图；

5、根据所述查询语句、所述第一候选意图及所述第一候选意图的描述信息，生成第一提示信息；

6、将所述第一提示信息，输入大模型中，以从所述第一候选意图中确定所述查询语句对应的第一目标意图。

7、根据本公开的第二方面，提供了一种大模型微调方法，包括：

8、获取样本数据集，其中，所述样本数据集中包括样本语句、样本语句对应的第三候选意图、所述第三候选意图对应的描述信息、所述样本语句对应的意图标签；

9、根据所述样本语句、所述第三候选意图及所述第三候选意图对应的描述信息，生成第四提示信息；

10、将所述第四提示信息，输入初始大模型中，以获取所述样本语句对应的目标预测意图；

11、根据所述目标预测意图与所述意图标签之间的差异，对所述初始大模型进行微调，以获取微调后的大模型。

12、根据本公开的第三方面，提供了一种基于大模型的意图识别装置，包括：

13、获取模块，用于获取查询语句、预设意图及所述预设意图的描述信息；

14、匹配模块，用于将所述查询语句与所述预设意图及所述预设意图的描述信息进行匹配，以获取所述查询语句对应的第一候选意图；

15、生成模块，用于根据所述查询语句、所述第一候选意图及所述第一候选意图的描述信息，生成第一提示信息；

16、识别模块，用于将所述第一提示信息，输入大模型中，以从所述第一候选意图中确定所述查询语句对应的第一目标意图。

17、根据本公开的第四方面，提供了一种大模型微调装置，包括：

18、获取模块，用于获取样本数据集，其中，所述样本数据集中包括样本语句、样本语句对应的第三候选意图、所述第三候选意图对应的描述信息、所述样本语句对应的意图标签；

19、生成模块，用于根据所述样本语句、所述第三候选意图及所述第三候选意图对应的描述信息，生成第四提示信息；

20、预测模块，用于将所述第四提示信息，输入初始大模型中，以获取所述样本语句对应的目标预测意图；

21、微调模块，用于根据所述目标预测意图与所述意图标签之间的差异，对所述初始大模型进行微调，以获取微调后的大模型。

22、根据本公开的第五方面，提供了一种电子设备，包括：

23、至少一个处理器；以及

24、与所述至少一个处理器通信连接的存储器；其中，

25、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如第一方面所述的基于大模型的意图识别方法，或者执行如第二方面所述的基于大模型微调方法。

26、根据本公开第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如第一方面所述的基于大模型的意图识别方法，或者执行如第二方面所述的基于大模型微调方法。

27、根据本公开的第七方面，提供了一种计算机程序产品，包括计算机指令，所述计算机指令在被处理器执行时实现如第一方面所述的基于大模型的意图识别方法的步骤，或者执行如第二方面所述的基于大模型微调方法的步骤。

28、本公开提供的基于大模型的意图识别方法、装置、电子设备及存储介质，存在如下有益效果：

29、本公开实施例中，获取查询语句、预设意图及预设意图的描述信息，之后将查询语句与预设意图及预设意图的描述信息进行匹配，以获取查询语句对应的第一候选意图，进而根据查询语句、第一候选意图及第一候选意图的描述信息，生成第一提示信息，最后将第一提示信息，输入大模型中，以从第一候选意图中确定查询语句对应的第一目标意图。由此，可以先确定查询语句对应的第一候选意图，之后基于第一候选意图及对应的描述信息，指导大模型从第一候选意图中，识别出查询语句对应的第一目标意图，从而可以先排除无关意图的干扰，降低大模型意图识别的任务难度，提高意图识别准确度。

30、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种基于大模型的意图识别方法，其中，包括：

2.根据权利要求1所述的方法，其中，所述根据所述查询语句、所述第一候选意图及所述第一候选意图的描述信息，生成第一提示信息，包括：

3.根据权利要求2所述的方法，其中，所述历史交互信息中包括以下至少一项：

4.根据权利要求1或2所述的方法，其中，所述将所述第一提示信息，输入大模型中，以从所述第一候选意图中确定所述查询语句对应的第一目标意图，包括：

5.根据权利要求1所述的方法，其中，所述将所述查询语句与所述预设意图及所述预设意图的描述信息进行匹配，以获取所述查询语句对应的第一候选意图，包括：

6.根据权利要求5所述的方法，其中，所述确定所述查询语句对应的第一编码向量、所述预设意图及所述预设意图的描述信息对应的第二编码向量，包括：

7.根据权利要求1所述的方法，其中，还包括：

8.一种大模型微调方法，其中，包括：

9.根据权利要求8所述的方法，其中，所述根据所述样本语句、所述第三候选意图及所述第三候选意图对应的描述信息，生成第四提示信息，包括：

10.根据权利要求8或9所述的方法，其中，所述将所述第四提示信息，输入初始大模型中，以获取所述样本语句对应的目标预测意图，包括：

11.根据权利要求10所述的方法，其中，所述根据所述目标预测意图与所述意图标签之间的差异，对所述初始大模型进行微调，以获取微调后的大模型，包括：

12.一种基于大模型的意图识别装置，其中，包括：

13.根据权利要求12所述的装置，其中，所述生成模块，用于：

14.根据权利要求13所述的装置，其中，所述历史交互信息中包括以下至少一项：

15.根据权利要求12或13所述的装置，其中，所述识别模块，用于：

16.根据权利要求12所述的装置，其中，所述匹配模块，用于：

17.根据权利要求16所述的装置，其中，所述匹配模块，用于：

18.根据权利要求12所述的装置，其中，还包括确定模块，用于：

19.一种大模型微调装置，其中，包括：

20.根据权利要求19所述的装置，其中，所述生成模块，用于：

21.根据权利要求19或20所述的装置，其中，所述预测模块，用于：

22.根据权利要求21所述的装置，其中，所述微调模块，用于：

23.一种电子设备，包括：

24.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法，或者能够执行权利要求8-11中任一项所述的方法。

25.一种计算机程序产品，包括计算机指令，所述计算机指令被处理器执行时实现权利要求1-7中任一项所述的方法的步骤，或者能够执行权利要求8-11中任一项所述的方法的步骤。

技术总结本公开提供了一种基于大模型的意图识别方法、装置、电子设备及存储介质，涉及计算机技术领域，尤其涉及涉及自然语言处理、大模型等人工智能技术领域。具体实现方案为：获取查询语句、预设意图及所述预设意图的描述信息；将所述查询语句与所述预设意图及所述预设意图的描述信息进行匹配，以获取所述查询语句对应的第一候选意图；根据所述查询语句、所述第一候选意图及所述第一候选意图的描述信息，生成第一提示信息；将所述第一提示信息，输入大模型中，以从所述第一候选意图中确定所述查询语句对应的第一目标意图。技术研发人员：王佳麒,裴中佑,施鹏受保护的技术使用者：北京百度网讯科技有限公司技术研发日：技术公布日：2024/11/14