技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、服务器及计算机可读存储介质与流程 > 正文

语音交互方法、服务器及计算机可读存储介质与流程

国知局
2024-06-21 11:28:18

本技术涉及语音交互，特别涉及一种语音交互方法、服务器及计算机可读存储介质。

背景技术：

1、在大语言模型进行推理的过程中，提示(prompt)可以引导大语言模型(largelanguage model)理解和处理相应的自然语言指令输入，从而使大语言模型输出可靠的推理结果。然而，在提示为“请一步步思考、一步步解答”等固定文本时，难以可靠地引导大语言模型完成推理工作。

技术实现思路

1、本技术提供了一种语音交互方法、服务器及计算机可读存储介质。

2、本技术实施方式提供一种语音交互方法，包括：

3、获取当前语音请求；

4、识别所述当前语音请求对应的目标应用场景类别；

5、基于预先确定的应用场景类别与提示信息模板的对应关系，以及预先配置的多种所述提示信息模板，确定与所述目标应用场景类别相对应的目标提示信息；

6、根据所述目标提示信息和大语言模型，确定所述当前语音请求对应的目标车辆控制指令，完成所述语音交互，其中，所述大语言模型预先训练完成，且能够根据提示信息确定语音请求对应的车辆控制指令。

7、本技术实施方式提供的语音交互方法中，服务器可获取当前语音请求，识别当前语音请求对应的目标应用场景类别，基于预先确定的应用场景类别与提示信息模板的对应关系，及结合预先配置的多种提示信息模板，以确定出与目标应用场景类别相对应的目标提示信息，基于预先训练完成，且能根据提示信息确定语音请求对应的车辆控制指令的大语言模型，以根据目标提示信息和大语言模型，确定当前语音请求所对应的目标车辆控制指令，从而完成语音交互。

8、如此，在本技术实施方式中，服务器可根据当前语音请求对应的目标应用场景类别，以及预先配置的多种提示信息模板，确定与目标应用场景类别相对应的目标提示信息，使得大语言模型可根据目标提示信息，确定当前语音请求对应的目标车辆控制指令，服务器使得大语言模型可根据与语音请求相对应的提示信息完成车辆控制指令的确定，从而在一定程度上改善了固定的提示文本难以可靠地引导大语言模型完成推理工作的情况，大语言模型的推理精度得以保障。

9、在本技术某些实施方式中，所述提示信息模板包括应用场景描述信息，所述基于预先确定的应用场景类别与提示信息模板的对应关系，以及预先配置的多种所述提示信息模板，确定与所述目标应用场景类别相对应的目标提示信息，包括：

10、基于预先确定的应用场景类别与提示信息模板的对应关系，以及多种所述提示信息模板，得到目标应用场景描述信息，确定所述目标提示信息。

11、如此，本技术实施方式中的服务器可根据目标应用场景类别所对应的提示信息模板中的目标应用场景描述信息，完成目标提示信息的确定，进而使大语言模型可根据当前语音请求所对应的目标应用场景描述信息，完成目标车辆控制指令的确定，在一定程度上保障了目标车辆控制指令的准确性。

12、在本技术某些实施方式中，所述车辆控制指令包括指令关键字和所述指令关键字对应的索引数据，所述提示信息模板包括指令关键字，所述基于预先确定的应用场景类别与提示信息模板的对应关系，以及多种所述提示信息模板，得到目标应用场景描述信息，确定所述目标提示信息，包括：

13、基于预先确定的应用场景类别与提示信息模板的对应关系，以及多种所述提示信息模板，得到目标应用场景描述信息和目标指令关键字；

14、根据预先配置的多种索引数据的获取规则信息，确定所述目标指令关键字对应的索引数据的目标获取规则信息；

15、根据所述目标应用场景描述信息和所述目标获取规则信息，确定所述目标提示信息。

16、如此，本技术实施方式使得服务器可提示信息模板中的指令关键字，确定目标应用场景类别所对应的提示信息模板中的目标指令关键字，及根据预先配置的多种索引数据的获取规则信息，确定目标指令关键字所对应的索引数据的目标获取规则信息，从而完成目标提示信息的确定，在使大语言模型根据目标提示信息生成目标车辆控制指令时，无需进行目标指令关键字的生成，且目标指令关键字对应的目标索引数据的确定可根据目标提示信息中的目标获取规则信息完成，由此在一定程度上保障了大语言模型的准确性。

17、在本技术某些实施方式中，所述根据所述目标应用场景描述信息和所述目标获取规则信息，确定所述目标提示信息，包括：

18、根据所述目标应用场景描述信息、所述目标获取规则信息及预先确定的指令确定任务描述信息，确定所述目标提示信息。

19、如此，本技术实施方式可根据指令确定任务描述信息进行目标提示信息的确定，进而使大语言模型可根据目标提示信息中的指令确定任务描述信息，执行当前语音请求的处理，在一定程度上使得当前语音请求的处理得以可靠进行。

20、在本技术某些实施方式中，所述目标应用场景类别包括多个，所述基于预先确定的应用场景类别与提示信息模板的对应关系，以及预先配置的多种所述提示信息模板，确定与所述目标应用场景类别相对应的目标提示信息，包括：

21、基于预先确定的应用场景类别与提示信息模板的对应关系，以及预先配置的多种所述提示信息模板，确定每个所述目标应用场景类别分别对应的目标提示信息。

22、如此，本技术实施方式中可确定多个目标应用场景类别，及确定每个目标应用场景类别分别相对应的目标提示信息，在一定程度上保障了目标提示信息的可靠确定。

23、在本技术某些实施方式中，所述根据所述目标提示信息和大语言模型，确定所述当前语音请求对应的目标车辆控制指令，完成所述语音交互，包括：

24、根据每个所述目标提示信息和所述大语言模型，确定所述目标车辆控制指令，完成所述语音交互。

25、如此，本技术实施方式的服务器使得大语言模型可根据每个目标应用场景类别分别对应的目标提示信息，确定当前语音请求的车辆控制指令，使得目标车辆控制车辆得以可靠确定。

26、在本技术某些实施方式中，所述大语言模型的训练步骤包括：

27、获取语音请求样本、所述语音请求样本的车辆控制指令标签及所述语音请求样本的应用场景类别标签；

28、根据所述预先确定的应用场景类别与提示信息模板的对应关系，以及多种所述提示信息模板，确定所述应用场景类别标签相对应的第一提示信息；

29、根据所述语音请求样本、所述车辆控制指令标签及所述第一提示信息，训练参考模型，得到所述大语言模型。

30、如此，本技术实施方式的服务器可获取语音请求样本、车辆控制指令标签及应用场景类别标签，及根据应用场景类别标签确定第一提示信息，进而根据语音请求样本、车辆控制指令标签及第一提示信息完成参考模型的训练以得到大语言模型。

31、在本技术某些实施方式中，所述根据提示信息模板样本、所述车辆控制指令标签及所述第一提示信息，训练参考模型，得到所述大语言模型，包括：

32、根据所述多种所述提示信息模板，确定第二提示信息；

33、根据所述语音请求样本、所述车辆控制指令标签、所述第一提示信息及所述第二提示信息，训练所述参考模型，得到所述大语言模型。

34、如此，本技术实施方式的服务器可根据第一提示信息和第二提示信息完成参考模型的训练以得到大语言模型，使得大语言模型在训练完成后可根据多个提示信息以确定语音请求的车辆控制指令，在一定程度上保障了大语言模型的稳健性。

35、本技术实施方式提供一种服务器，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述的语音交互方法。

36、本技术实施方式提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现上述的语音交互方法。

37、本技术实施方式提供的服务器和计算机可读存储介质，可根据当前语音请求对应的目标应用场景类别，以及预先配置的多种提示信息模板，确定与目标应用场景类别相对应的目标提示信息，使得大语言模型可根据目标提示信息，确定当前语音请求对应的目标车辆控制指令，服务器使得大语言模型可根据与语音请求相对应的提示信息完成车辆控制指令的确定，从而在一定程度上改善了固定的提示文本难以可靠地引导大语言模型完成推理工作的情况，大语言模型的推理精度得以保障。

38、本技术的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实施方式的实践了解到。