技术新讯 > 乐器声学设备的制造及制作,分析技术 > 车辆语音交互方法、服务器以及存储介质与流程 > 正文

车辆语音交互方法、服务器以及存储介质与流程

国知局
2024-06-21 11:44:10

本申请涉及车辆语音处理，具体涉及一种车辆语音交互方法、服务器以及计算机可读存储介质。

背景技术：

1、在目前新能源车辆出口的背景下，车机系统对非通用语种语音请求的支持变得越来越重要，比如挪威语、荷兰语等非通用语种。但非通用语种的语义标签标注数据非常少，标注的成本明显高于通用语种。而车机系统的研发者一般并不能掌握非通用语种，进而导致对车机系统非通用语种语音请求的支持存在很高的研发难度。

技术实现思路

1、本申请提供了一种车辆语音交互方法、服务器以及计算机可读存储介质。

2、本申请实施方式涉及的车辆语音交互方法，包括如下步骤：

3、接收车辆转发的目标语种语音请求，其中所述目标语种非汉语且非英语；

4、根据预设语料集，确定目标语种训练语料，其中所述预设语料集的语种为汉语和英语；

5、根据所述目标语种语音请求以及预设语言处理模型，确定与所述目标语种语音请求对应的目标语义标签，其中所述预设语言处理模型根据预设提示文本以及所述目标语种训练语料经训练得到；

6、根据所述目标语义标签，执行语音交互。

7、如此，本申请能够基于通用语言的语料集确定出对应目标语种的训练语料，并基于上述的训练语料以及预设的提示文本，引导大语言模型在车辆功能的领域内进行语义标签生成训练，生成上述的预设语言处理模型，最后利用该模型针对用户输入的非通用语种下的语音请求进行语义识别，确定出对应的目标语义标签，最终根据语义标签执行相关的车辆功能，实现交互功能。本申请通过上述的方式，基于通用语以及少量的根据通用语种确定的非通用语种训练语料，对大语言模型进行训练，得到一个能够直接应用于对应非通用语种的语言处理模型，规避了可参考数据少、研发人员难以开发非通用语种内容的问题，有效提高了研发效率、降低了研发难度。

8、在某些实施方式中，所述根据预设语料集，确定目标语种提示文本、以及目标语种训练语料，包括：

9、获取所述预设语料集当中的多条语料文本以及对应的语义标签；

10、根据所述语料文本、所述语义标签，确定目标语种训练语料，其中所述目标语种训练语料包括目标语种训练语料文本、以及与所述目标语种训练语料文本对应的目标语种语义标签。

11、如此，本申请能够根据通用语种的预设与料及确定出用于训练的语料文本以及语义标签，并进一步利用用于训练的数据翻译确定出非通用语种中对应的用于训练的语料文本以及语义标签。

12、在某些实施方式中，所述预设语言处理模型经过如下步骤训练得到：

13、根据所述预设提示文本，将预设的大语言模型的解码侧重引导至目标垂直领域；

14、根据所述目标语种训练语料，对已被引导的所述大语言模型执行训练处理，确定所述预设语言处理模型。

15、如此，本申请能够根据预设的提示文本将预设的大语言模型引导到对应垂直领域内，并基于上述非通用语种的训练语料针对预设的大语言模型进行训练处理，确定出预的设语言处理模型。

16、在某些实施方式中，所述根据所述目标语种训练语料，对所述大语言模型执行训练处理，确定所述预设语言处理模型，包括：

17、根据所述目标语种训练语料，以第一语句形式输入给所述大语言模型；

18、对所述大语言模型进行有监督微调的训练处理，确定所述预设语言处理模型。

19、如此，本申请能够通过具有输入输出示例的指令形式的非通用语种训练语料，在有监督微调的规则下对大语言模型进行训练。

20、在某些实施方式中，所述根据所述目标语种训练语料，对所述大语言模型执行训练处理，确定所述预设语言处理模型，还包括：

21、基于预设的大规模模型分布式训练工具，根据所述目标语种训练语料，对所述大语言模型执行训练处理，确定所述预设语言处理模型。

22、如此，本申请还能通过预设的训练工具提高训练的效率。

23、在某些实施方式中，所述根据所述目标语种训练语料，对所述大语言模型执行训练处理，确定所述预设语言处理模型，之后还包括：

24、对所述预设语言处理模型进行轻量化处理。

25、如此，本申请还能够对生成的语言处理模型进行轻量化处理，使训练得到的预设语言处理模型能够部署到存储空间有限、网络连接条件有限的车辆或设备上。

26、在某些实施方式中，所述根据所述目标语种语音请求以及预设语言处理模型，确定与所述目标语种语音请求对应的目标语义标签，包括：

27、根据所述目标语种语音请求对应的语音文本，确定所述预设语言处理模型的输入数据；

28、根据所述输入数据以及所述预设语言处理模型，确定所述目标语种语音请求对应的目标语义标签。

29、如此，本申请能够利用非通用语种的语音请求直接得到一个车机系统能够直接识别的目标语义标签。

30、在某些实施方式中，所述根据所述目标语种语音请求对应的语音文本，确定所述预设语言处理模型的输入数据，包括：

31、根据所述目标语种对应的预设语音识别模型，确定所述目标语种语音请求对应的语音文本。

32、如此，本申请还能够基于支持非通用语种的识别模型将语音请求转换为输入的文本。

33、本申请的实施方式的服务器包括处理器和存储器，所述存储器上存储有计算机程序，当所述计算机程序被所述处理器执行时，实现上述的方法。

34、本申请实施方式的计算机可读存储介质存储有计算机程序，所述计算机程序被一个或多个处理器执行的情况下，实现上述的方法。

35、本申请的实施方式的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实施方式的实践了解到。

技术特征：

1.一种车辆语音交互方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据预设语料集，确定目标语种提示文本、以及目标语种训练语料，包括：

3.根据权利要求1所述的方法，其特征在于，所述预设语言处理模型经过如下步骤训练得到：

4.根据权利要求3所述的方法，其特征在于，所述根据所述目标语种训练语料，对所述大语言模型执行训练处理，确定所述预设语言处理模型，包括：

5.根据权利要求3所述的方法，其特征在于，所述根据所述目标语种训练语料，对所述大语言模型执行训练处理，确定所述预设语言处理模型，还包括：

6.根据权利要求3所述的方法，其特征在于，所述根据所述目标语种训练语料，对所述大语言模型执行训练处理，确定所述预设语言处理模型，之后还包括：

7.根据权利要求1所述的方法，其特征在于，所述根据所述目标语种语音请求以及预设语言处理模型，确定与所述目标语种语音请求对应的目标语义标签，包括：

8.根据权利要求7所述的方法，其特征在于，所述根据所述目标语种语音请求对应的语音文本，确定所述预设语言处理模型的输入数据，包括：

9.一种服务器，其特征在于，所述服务器包括存储器与处理器，所述存储器存储有计算机程序，在所述计算机程序被所述处理器执行的情况下，实现权利要求1-8任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，在所述计算机程序被一个或多个处理器执行的情况下，实现权利要求1-8任一项所述的方法。

技术总结本申请公开了一种车辆语音交互方法，包括：接收车辆转发的目标语种语音请求，其中目标语种非汉语且非英语；根据预设语料集，确定目标语种训练语料，其中预设语料集的语种为汉语和英语；根据目标语种语音请求以及预设语言处理模型，确定与目标语种语音请求对应的目标语义标签，其中预设语言处理模型根据预设提示文本以及目标语种训练语料经训练得到；根据目标语义标签，执行语音交互。本申请通过上述的方式，基于通用语以及少量的根据通用语种确定的非通用语种训练语料，对大语言模型进行训练，得到一个能够直接应用于对应非通用语种的语言处理模型，规避了可参考数据少、研发人员难以开发非通用语种内容的问题，有效提高研发效率、降低研发难度。技术研发人员：孙仿逊,蔡恩磊,秦如雨,曹川受保护的技术使用者：广州小鹏汽车科技有限公司技术研发日：技术公布日：2024/4/17