技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、服务器及计算机可读存储介质与流程 > 正文

语音交互方法、服务器及计算机可读存储介质与流程

国知局
2024-06-21 11:50:04

本技术涉及语音交互，特别涉及一种语音交互方法、服务器及计算机可读存储介质。

背景技术：

1、目前，车载语音技术可以支持用户通过语音在车辆座舱内与车辆进行交互，例如控制车辆零部件或与车载系统小程序进行交互。然而，在用户与车载系统小程序进行语音交互的场景中，仅支持用户通过语音控制小程序的开启或关闭，若用户需使用小程序中的具体功能往往需要多次手动操作，影响语音交互的流畅性和便捷性，用户使用体验不佳。

技术实现思路

1、本技术提供了一种语音交互方法、服务器及计算机可读存储介质。

2、本技术实施方式提供一种语音交互方法，包括：

3、获取车辆转发的当前语音请求；

4、通过大语言模型，确定响应所述当前语音请求的目标车载系统小程序，及所述目标车载系统小程序中用于实现所述当前语音请求的目标功能页面，其中，所述大语言模型预先训练完成，且能根据语音请求确定车载系统小程序及所述车载系统小程序中用于实现所述语音请求的功能页面；

5、控制所述车辆显示所述目标功能页面以完成语音交互。

6、本技术实施方式提供的语音交互方法中，服务器可获取车辆转发的当前语音请求，并调用预先训练完成的大语言模型，以根据大语言模型具备的根据语音请求确定车载系统小程序及车载系统小程序中用于实现所述语音请求的功能页面的能力，确定可响应当前语音请求的目标车载系统小程序，及目标车载系统小程序中可用于实现当前语音请求的目标功能页面，及控制车辆显示目标车载系统小程序的目标功能页面，以完成与用户的语音交互。

7、如此，在本技术实施方式中，当用户需要执行小程序中的具体功能时，可通过语音与车辆进行交互，服务器根据大语言模型，确定能够响应当前语音请求的目标车载系统小程序，和确定能完成当前语音请求的目标功能页面，及控制车辆显示目标功能页面以完成语音交互过程，使得用户无需进行过多的手动操作即可使自身需求得到处理，语音交互的便捷性和车载系统小程序的使用效率得以提高，用户的使用体验得以改善。

8、在本技术某些实施方式中，所述大语言模型的训练步骤包括：

9、配置提示信息模板；

10、根据所述提示信息模板、语音请求样本及与所述语音请求样本相对应的标注结果，训练参考模型以得到所述大语言模型，其中，所述大语言模型能根据所述提示信息模板及所述语音请求样本，确定所述与所述语音请求样本相对应的标注结果。

11、如此，本技术实施方式的服务器使得参考模型可在训练过程中，学习到根据提示信息模板所表征的推理方式或思考方式，通过语音请求样本推理出车载系统小程序标注结果和功能页面标注结果的能力，从而完成训练以得到大语言模型，大语言模型的推理能力在一定程度上得到保障。

12、在本技术某些实施方式中，所述大语言模型的训练步骤包括：

13、向基础模型注入预先确定的车载系统小程序知识信息，得到所述参考模型。

14、如此，本技术实施方式通过向基础模型注入车载系统小程序知识信息，以得到能确认学习到与车载系统小程序相关的字、词语及句子的语义的参考模型，在一定程度上保障参考模型后续能对语音请求样本进行准确地理解。

15、在本技术某些实施方式中，所述标注结果包括车载系统小程序标注结果，及包括所述车载系统小程序标注结果中用于实现所述语音请求样本的功能页面标注结果，所述根据所述提示信息模板、语音请求样本及与所述语音请求样本相对应的标注结果，训练参考模型以得到所述大语言模型，包括：

16、根据所述提示信息模板、所述语音请求样本及所述参考模型，确定车载系统小程序预测结果及功能页面预测结果；

17、根据所述车载系统小程序预测结果、所述功能页面预测结果、车载系统小程序标注结果及所述功能页面标注结果，训练所述参考模型以得到所述大语言模型。

18、如此，本技术实施方式的服务器可根据车载系统小程序预测结果与车载系统小程序标注结果，以及功能页面预测结果和功能页面标注结果，训练参考模型以使参考模型能学习到根据提示信息模板和语音请求样本，推理出车载系统小程序标注结果及功能页面标注结果的能力，参考模型的训练效果在一定程度上得到保障。

19、在本技术某些实施方式中，所述提示信息模板包括第一提示信息子模板和第二提示信息子模板，所述根据所述提示信息模板、所述语音请求样本及所述参考模型，确定车载系统小程序预测结果及功能页面预测结果，包括：

20、根据所述第一提示信息子模板、所述语音请求样本及所述参考模型，确定车载系统小程序特征信息；

21、根据所述第二提示信息子模板、所述语音请求样本、所述参考模型以及与所述车载系统小程序特征信息相对应的候选车载系统小程序和候选功能页面，确定所述车载系统小程序预测结果和所述功能页面预测结果。

22、如此，本技术实施方式使大语言模型可根据第一提示信息子模板推理出车载系统小程序特征信息，及根据第二提示信息子模板和车载系统小程序特征信息推理出车载系统小程序预测结果及功能页面预测结果，使得完整推理过程可划分为两个部分，因而推理难度在一定程度上降低，大语言模型的预测精度能在一定程度上得到保障。

23、在本技术某些实施方式中，所述方法还包括：

24、通过所述车载系统小程序特征信息，搜索预先确定的小程序知识数据，确定所述候选车载系统小程序和所述候选功能页面。

25、如此，本技术实施方式的服务器可根据小程序知识数据，确定候选车载系统小程序和候选功能页面，避免大语言模型需根据语音请求直接推理出车载系统小程序和功能页面的情况出现，推理难度在一定程度上得以降低，因而推理精度在一定程度上得到提升。

26、在本技术某些实施方式中，所述通过大语言模型，确定响应所述当前语音请求的目标车载系统小程序，及所述目标车载系统小程序中用于实现所述当前语音请求的目标功能页面，包括：

27、根据所述大语言模型和预先配置的目标提示信息模板，确定所述目标车载系统小程序及所述目标功能页面。

28、如此，本技术实施方式使得大语言模型根据当前语音请求推理出目标车载系统小程序及目标功能页面的过程中，可基于目标提示信息模板的提示来进行推理，使得目标车载系统小程序及目标功能页面的可信度在一定程度上得以保障。

29、在本技术某些实施方式中，所述控制所述车辆显示所述目标功能页面以完成语音交互，包括：

30、在所述目标功能页面为多个的情况下，根据多个所述目标功能页面生成询问指令，并将所述询问指令转发至所述车辆；

31、响应于所述车辆转发的对所述询问指令的回复请求，控制所述车辆显示与所述回复请求相对应的所述目标功能页面，以完成所述语音交互。

32、如此，本技术实施方式的服务器可在确定出多个目标功能页面的情况下，根据询问指令相应的回复请求，使多个目标功能页面中与回复请求相对应的页面显示于车辆，由此使得当前语音请求得以可靠处理，在一定程度上使得用户的使用体验得以提升。

33、本技术实施方式提供一种服务器，包括存储器和处理器，所述存储器中存储有计算机程序，所述计算机程序被所述处理器执行时，实现上述的语音交互方法。

34、本技术实施方式提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当所述计算机程序被一个或多个处理器执行时，实现上述的语音交互方法。

35、本技术实施方式提供的服务器和计算机可读存储介质，当用户需要执行小程序中的具体功能时，可通过语音与车辆进行交互，服务器根据大语言模型，确定能够响应当前语音请求的目标车载系统小程序，和确定能完成当前语音请求的目标功能页面，及控制车辆显示目标功能页面以完成语音交互过程，使得用户无需进行过多的手动操作即可使自身需求得到处理，语音交互的便捷性和车载系统小程序的使用效率得以提高，用户的使用体验得以改善。

36、本技术的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实施方式的实践了解到。