技术新讯 > 乐器声学设备的制造及制作,分析技术 > 车辆语音交互方法、服务器及计算机可读存储介质与流程  >  正文

车辆语音交互方法、服务器及计算机可读存储介质与流程

  • 国知局
  • 2024-06-21 10:41:09

本技术涉及语音交互,特别涉及一种车辆语音交互方法、服务器及计算机可读存储介质。

背景技术:

1、为保障车辆在离线状态下能响应用户的语音请求,可在车辆上部署语音交互模型,使得车辆能不借助服务器或网络,完成与用户的语音交互。然而,训练语音交互模型时所需的训练数据通常需人工收集和人工标注,训练数据获取难度高,因而模型的训练难度上升。

技术实现思路

1、本技术提供了一种车辆语音交互方法、服务器及计算机可读存储介质。

2、本技术实施方式提供一种车辆语音交互方法,包括:

3、根据第一大语言模型,更新第二大语言模型生成的原始训练数据,得到目标训练数据,其中,所述第一大语言模型预先训练完成,所述第二大语言模型预先训练完成;

4、根据目标训练数据训练预设模型,得到语音交互模型;

5、部署所述语音交互模型至所述车辆,以使所述车辆能根据部署的所述语音交互模型和获取到的当前语音请求完成语音交互。

6、本技术实施方式提供的车辆语音交互方法中,服务器可根据预先训练完成的第一大语言模型,对同样预先训练完成的第二大语言模型所生成的原始训练数据进行更新,得到目标训练数据。根据目标训练数据训练预设模型以得到语音交互模型。将语音交互模型部署至车辆,使得车辆能根据本地部署的语音交互模型,及获取到的当前语音请求完成语音交互。

7、如此,在本技术实施方式中,服务器可通过与第一大语言模型不同的第二大语言模型,对第一大语言模型生成的原始训练数据进行更新以得到目标训练数据,从而在一定程度上使得原始训练数据中的噪声数据或错误数据得以消除,通过目标训练数据训练得到的语音交互模型的可靠性得以保障。在本技术实施方式中,车辆可通过部署的语音交互模型,对获取到的当前语音请求进行处理,从而完成与用户的语音交互,使得车辆能在离线状态下完成语音交互,车辆语音交互功能的使用场景得以拓宽。本技术实施方式通过大语言模型生成训练数据,在一定程度上改善训练数据由人工生成和人工标注而得到的情况,训练数据的获取难度降低,语音交互模型的训练难度降低。

8、在本技术某些实施方式中,所述原始训练数据包括样本数据及所述样本数据的标注结果,所述根据第一大语言模型,更新第二大语言模型生成的原始训练数据,得到目标训练数据,包括:

9、根据所述第一大语言模型,确定所述样本数据的标注结果验证信息,其中,所述第一大语言模型能够对所述样本数据的所述标注结果进行验证;

10、根据所述标注结果验证信息更新所述原始训练数据。

11、如此,本技术实施方式中根据第一大语言模型能够对样本数据的标注结果进行验证的能力,通过第一大语言模型得到样本数据的标注结果验证信息,及根据样本数据的标注结果验证信息对原始训练数据进行更新,使得原始训练数据的更新能基于标注结果验证信息进行,从而在一定程度上使得原始训练数据的可靠更新得以保障。

12、在本技术某些实施方式中,所述根据所述标注结果验证信息更新所述原始训练数据,包括:

13、根据所述标注结果有误的目标样本数据,更新所述原始训练数据。

14、如此,本技术实施方式的服务器可根据标注结果有误的目标样本数据完成原始训练数据的更新,在一定程度上使得有原始训练数据的有效更新得以保障。

15、在本技术某些实施方式中,所述原始训练数据包括多个所述样本数据,所述根据所述标注结果有误的目标样本数据,更新所述原始训练数据,包括:

16、划分所述多个样本数据以得到多个数据组;

17、根据所述目标样本数据所属的目标数据组,更新所述原始训练数据。

18、如此,本技术实施方式中,服务器可在原始训练数据中的多个样本数据划分为多个数据组的情况下,根据目标样本数据所属的目标数据组,进行原始训练数据的更新,由此使得原始训练数据的更新效率在一定程度上得以提升。

19、在本技术某些实施方式中,所述根据所述目标样本数据所属的目标数据组,更新所述原始训练数据,包括:

20、根据获取到的所述目标数据组中样本数据的真实标注信息,更新所述原始训练数据。

21、如此,本技术实施方式可根据目标数据组中各个样本数据的真实标注信息,对原始训练数据进行更新,使得原始训练数据的可靠更新在一定程度上得到保障。

22、在本技术某些实施方式中,所述第二大语言模型能根据样本基础信息确定对应的样本数据和标注结果,所述划分所述多个样本数据以得到多个数据组,包括:

23、根据所述样本基础信息和所述标注结果,划分所述多个样本数据以得到所述多个数据组。

24、如此,本技术实施方式可根据样本数据的标注结果,及样本数据对应的样本基础信息,对原始训练数据中的多个样本数据进行划分,使得划分得到的多个数据组能可靠表征特征不同的各类样本数据,进而,在后续确定出标注结果有误的目标样本数据的情况下,可根据目标样本数据,及目标数据组中与目标样本数据特征相似或相同的其他样本数据对原始训练数据进行更新,从而在一定程度上可保证原始训练数据的更新可靠。

25、在本技术某些实施方式中,所述根据所述第一大语言模型,确定所述样本数据的标注结果验证信息,包括:

26、根据所述第一大语言模型和所述样本数据的样本基础信息,确定所述样本数据的所述标注结果验证信息。

27、如此,本技术实施方式使得第一大语言模型可根据样本数据对应的样本基础信息,及样本数据的标注结果,确定样本数据的标注结果验证信息,因而在一定程度上使得标注结果验证信息的确定能得到充分的数据支撑,标注结果验证信息的可信度得以保障。

28、在本技术某些实施方式中,所述根据所述第一大语言模型和所述样本数据的样本基础信息,确定所述样本数据的所述标注结果验证信息,包括:

29、根据所述第一大语言模型,及所述数据组中预设数量所述样本数据的样本基础信息,确定所述数据组中预设数量所述样本数据的所述标注结果验证信息。

30、如此,本技术实施方式的服务器使得第一大语言模型可对各个数据组中预设数量的样本数据进行标注结果验证,在一定程度上使得验证样本数据的标注结果所需的时间和负荷降低,进而使得原始训练数据的更新效率得以提升。

31、在本技术某些实施方式中,所述方法还包括:

32、根据所述目标训练数据更新所述第一大语言模型和/或所述第二大语言模型。

33、如此,本技术实施方式使得第一大语言模型和/或第二大语言模型可根据目标训练数据进行更新或优化,进而,在一定程度上,使得第二大语言模型完成更新后生成的训练数据无需利用第一大语言模型进行更新,和/或,使第一大语言模型完成更新后能可靠地用于原始训练数据的更新。

34、本技术实施方式提供一种服务器,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述的车辆语音交互方法。

35、本技术实施方式提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现上述的车辆语音交互方法。

36、本技术实施方式提供的服务器及计算机可读存储介质,可通过与第一大语言模型不同的第二大语言模型,对第一大语言模型生成的原始训练数据进行更新以得到目标训练数据,从而在一定程度上使得原始训练数据中的噪声数据或错误数据得以消除,通过目标训练数据训练得到的语音交互模型的可靠性得以保障。在本技术实施方式中,车辆可通过部署的语音交互模型,对获取到的当前语音请求进行处理,从而完成与用户的语音交互,使得车辆能在离线状态下完成语音交互,车辆语音交互功能的使用场景得以拓宽。本技术实施方式通过大语言模型生成训练数据,在一定程度上改善训练数据由人工生成和人工标注而得到的情况,训练数据的获取难度降低,语音交互模型的训练难度降低。

37、本技术的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实施方式的实践了解到。

本文地址:https://www.jishuxx.com/zhuanli/20240618/21201.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。