技术新讯 > 计算推算,计数设备的制造及其应用技术 > 意图识别的方法、模型训练方法、装置及存储介质与流程  >  正文

意图识别的方法、模型训练方法、装置及存储介质与流程

  • 国知局
  • 2024-07-31 23:15:09

本公开涉及计算机,尤其涉及一种意图识别的方法、模型训练方法、装置及存储介质。

背景技术:

1、在机器人迎宾或自助式咨询等人机对话场景下,经常需要从用户所提出的问题中识别出用户的意图,以便根据用户的意图给出相应的回复,或者根据用户的意图执行相应的操作。

2、但是,随着人机对话的应用场景的逐渐丰富,利用现有的意图识别模型对用户意图进行识别时,存在识别准确率不高的问题。

技术实现思路

1、为克服相关技术中存在的问题,本公开提供一种意图识别的方法、模型训练方法、装置及存储介质。

2、根据本公开实施例的第一方面,提供一种意图识别的方法,包括:

3、获取用户输入的提问数据;

4、将所述提问数据输入至目标意图识别模型,得到所述目标意图识别模型输出的意图识别结果,所述目标意图识别模型是根据目标意图识别场景所对应的目标训练样本,对预设意图识别模型进行模型微调后获得的。

5、可选的,所述目标意图识别模型通过以下方式获得:

6、获取预先训练的预设意图识别模型,所述预设意图识别模型是根据多种意图识别场景对应的训练样本训练得到的;

7、获取目标意图识别场景所对应的目标训练样本;

8、利用所述目标训练样本,对所述预设意图识别模型进行模型微调,以获得与所述目标意图识别场景对应的目标意图识别模型。

9、可选的,所述目标意图识别模型包括槽位提取模块,所述方法还包括:

10、在所述意图识别结果表征识别到用户意图的情况下,将所述提问数据输入至所述槽位提取模块,得到所述槽位提取模块输出的所述提问数据中的槽位信息;

11、根据所述槽位信息,输出针对所述提问数据的回答信息。

12、可选的,所述目标意图识别模型的槽位提取模块通过以下方式获取:

13、获取槽位提取训练样本,所述槽位提取训练样本包括槽位提取语句样本以及对所述槽位提取语句样本的槽位提取结果样本;

14、利用所述槽位提取训练样本,对待训练的槽位提取初始模型进行训练,以获得目标意图识别模型的槽位提取模块。

15、可选的,所述方法还包括:

16、在所述意图识别结果表征识别到用户意图的情况下,根据所述用户意图,控制目标设备执行与所述用户意图所对应的操作。

17、可选的,所述方法还包括:

18、在所述意图识别结果表征未识别到用户意图的情况下,获取与用户之间的多轮对话数据,每轮对话数据包括提问数据以及针对所述提问数据的回答信息;

19、将所述提问数据输入至目标意图识别模型,得到所述目标意图识别模型输出的意图识别结果,包括:

20、将所述多轮对话数据输入至目标意图识别模型,得到目标意图识别模型所输出的针对所述多轮对话数据的意图识别结果。

21、可选的,所述方法还包括:

22、在所述意图识别结果表征未识别到用户意图的情况下,从预设答案数据库中,确定与所述提问数据对应的预设答案数据;

23、将所述预设答案数据作为针对所述提问数据的回答信息进行输出。

24、根据本公开实施例的第二方面,提供一种模型训练方法,包括:

25、获取预先训练的预设意图识别模型,所述预设意图识别模型是根据多种意图识别场景对应的训练样本训练得到的;

26、获取目标意图识别场景所对应的目标训练样本;

27、利用所述目标训练样本,对所述预设意图识别模型进行模型微调,以获得与所述目标意图识别场景对应的目标意图识别模型;

28、其中,所述目标意图识别模型用于对用户所输入的提问数据进行意图识别,得到对所述提问数据的意图识别结果。

29、可选的,所述目标意图识别模型包括槽位提取模块,所述槽位提取模块通过以下方式获取:

30、获取槽位提取训练样本,所述槽位提取训练样本包括槽位提取语句样本以及对所述槽位提取语句样本的槽位提取结果样本;

31、利用所述槽位提取训练样本,对待训练的槽位提取初始模型进行训练,以获得目标意图识别模型的槽位提取模块;其中,所述槽位提取模块用于在所述意图识别结果表征识别到用户意图的情况下,根据所述提问数据输出所述提问数据中的槽位信息。

32、根据本公开实施例的第三方面,提供一种意图识别的装置,包括:

33、获取模块,被配置为获取用户输入的提问数据;

34、输出模块,被配置为将所述提问数据输入至目标意图识别模型,得到所述目标意图识别模型输出的意图识别结果,所述目标意图识别模型是根据目标意图识别场景所对应的目标训练样本,对预设意图识别模型进行模型微调后获得的。

35、根据本公开实施例的第四方面,提供一种意图识别的装置,包括:

36、处理器;

37、用于存储处理器可执行指令的存储器;

38、其中,所述处理器被配置为:获取用户输入的提问数据;将所述提问数据输入至目标意图识别模型,得到所述目标意图识别模型输出的意图识别结果,所述目标意图识别模型是根据目标意图识别场景所对应的目标训练样本,对预设意图识别模型进行模型微调后获得的。

39、根据本公开实施例的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面或第二方面所提供的方法的步骤。

40、本公开的实施例提供的技术方案可以包括以下有益效果:通过获取用户输入的提问数据;并将提问数据输入至目标意图识别模型,得到目标意图识别模型输出的意图识别结果;由于目标意图识别模型是在目标意图识别场景所对应的目标训练样本基础上获得的,因此,使用目标意图识别模型在目标意图识别场景下进行意图识别时,能够获得更为准确的意图识别结果。

41、再者,由于目标意图识别模型是对预设意图识别模型进行模型微调后获得的,因此,相较于重新构建意图识别模型并进行模型训练,所需要的训练样本的数据量更少,模型训练过程的耗时更短;目标意图识别模型是对预设意图识别模型进行模型微调后获得的,目标意图识别模型所占用的存储空间更少,能够降低终端设备的存储压力。

42、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

技术特征:

1.一种意图识别的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述目标意图识别模型通过以下方式获得:

3.根据权利要求1所述的方法,其特征在于,所述目标意图识别模型包括槽位提取模块,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述目标意图识别模型的槽位提取模块通过以下方式获取:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:

8.一种模型训练方法,其特征在于,所述方法包括:

9.根据权利要求8所述的方法,其特征在于,所述目标意图识别模型包括槽位提取模块,所述槽位提取模块通过以下方式获取:

10.一种意图识别的装置,其特征在于,包括:

11.一种意图识别的装置,其特征在于,包括:

12.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~9中任一项所述方法的步骤。

技术总结本公开涉及一种意图识别的方法、模型训练方法、装置及存储介质,意图识别的方法包括:获取用户输入的提问数据;将所述提问数据输入至目标意图识别模型,得到所述目标意图识别模型输出的意图识别结果,所述目标意图识别模型是根据目标意图识别场景所对应的目标训练样本,对预设意图识别模型进行模型微调后获得的。通过上述技术方案,能够提升在目标意图识别场景下的意图识别准确率。技术研发人员:付霞受保护的技术使用者:达闼机器人股份有限公司技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/196638.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。