车辆语音交互方法、服务器及计算机可读存储介质与流程
- 国知局
- 2024-06-21 10:40:10
本技术涉及交互方法,特别涉及一种车辆语音交互方法、服务器及计算机可读存储介质。
背景技术:
1、为保障车辆在离线状态下能响应用户的语音请求,可在车辆上部署语音交互模型,使得车辆能不借助服务器或网络,完成与用户的语音交互。然而,训练语音交互模型时所需的训练数据通常需人工收集和人工标注,训练数据获取难度高,因而模型的训练难度上升。
技术实现思路
1、本技术提供了一种车辆语音交互方法、服务器及计算机可读存储介质。
2、本技术实施方式提供一种车辆语音交互方法,包括:
3、根据大语言模型更新原始训练数据,得到目标训练数据,其中,所述大语言模型预先训练完成,所述原始训练数据由所述大语言模型生成;
4、根据所述目标训练数据训练预设模型,得到语音交互模型;
5、部署所述语音交互模型至所述车辆,以使所述车辆能根据部署的所述语音交互模型及获取到的当前语音请求完成语音交互。
6、本技术实施方式提供的车辆语音交互方法中,服务器可在根据预先训练完成的大语言模型生成原始训练数据的情况下,利用大语言模型对原始训练数据进行更新以得到目标训练数据。根据目标训练数据更新预设模型,得到能处理语音请求的语音交互模型。部署语音交互模型至车辆,以使得车辆可根据本地部署的语音交互模型,以及获取到的当前语音请求完成语音交互。
7、如此,本技术实施方式中,服务器可通过大语言模型生成的目标训练数据,得到可部署至车辆的语音交互模型,进而使车辆可通过本地部署的语音交互模型,对获取到的当前语音请求进行处理以完成与用户的语音交互,因而能完成离线状态下的语音交互,车辆语音交互功能的使用场景得以拓宽。本技术实施方式的服务器可通过大语言模型生成原始训练数据,并通过大语言模型对原始训练数据进行更新以得到目标训练数据,从而在一定程度上改善大语言模型因偶发致幻,导致训练语音交互模型的数据存在噪声的情况,由目标训练数据训练的语音交互模型的可靠性得以保障。本技术实施方式的服务器通过大语言模型生成用于训练模型的目标训练数据,使得样本生成和样本标注均需由人工完成的情况得以改善,目标训练数据的获取难度降低,因而语音交互模型的训练难度降低。
8、在本技术某些实施方式中,所述原始训练数据包括样本数据和与所述样本数据相对应的标注结果,所述根据大语言模型更新原始训练数据,得到目标训练数据,包括:
9、根据所述大语言模型、所述标注结果及所述预设模型对所述样本数据的预测结果,更新所述原始训练数据。
10、如此,本技术实施方式使得服务器更新原始训练数据的过程中,可根据大语言模型、原始训练数据中样本数据的标注结果以及预设模型对样本数据的预测结果进行,从而能考虑到预设模型的实际推理情形,也即是考虑到预设模型对样本数据的预测结果,使得原始训练数据的降噪效果在一定程度上得以保障。
11、在本技术某些实施方式中,所述样本数据包括多个,所述根据所述大语言模型、所述标注结果及所述预设模型对所述样本数据的预测结果,更新所述原始训练数据,包括:
12、根据所述预测结果,确定多个所述样本数据中的待校验样本数据;
13、根据所述大语言模型确定所述待校验样本数据的标注结果验证信息,其中,所述大语言模型能够对所述待校验样本数据的标注结果进行验证;
14、根据所述标注结果有误的所述待校验样本数据,更新所述原始训练数据。
15、如此,本技术实施方式的服务器可根据预设模型对样本数据的预测结果,确定出可能为噪声的待校验样本数据,及根据语言模型对待校验样本数据的标注结果进行验证,在一定程度上避免大语言模型需对原始数据集中全部数据进行验证的情况出现,还能避免人工验证各个待校验样本数据的标注结果的情况出现,数据的验证效率和原始训练数据的更新处理效率得以保障。
16、在本技术某些实施方式中,所述预测结果包括多个预测子结果,所述多个预测子结果由所述预设模型对所述样本数据进行多次预测得到,所述根据所述预测结果,确定多个所述样本数据中的待校验样本数据,包括:
17、根据所述预测结果中存在不匹配的两个所述预测子结果的样本数据,确定所述待校验样本数据。
18、如此,本技术实施方式的服务器可使预设模型对原始训练数据中每个样本数据进行多次预测或多次推理,以得到多个预测子结果,及根据多个预测子结果确定出可能为噪声的待验证样本数据,在一定程度上保障待验证样本数据的可靠确定。
19、在本技术某些实施方式中,所述预测结果包括与所述标注结果相对应的置信度,所述根据所述预测结果,确定多个所述样本数据中的待校验样本数据,包括:
20、根据所述预测结果中所述置信度低于预设阈值的所述样本数据,确定所述待校验样本数据。
21、如此,本技术实施方式的服务器可根据预设模型针对样本数据输出的相对于标注结果的置信度,确定多个样本数据中可能为噪声的待校验数据,在一定程度上保障待验证噪声数据的可靠确定。
22、在本技术某些实施方式中,所述预测结果中所述置信度包括多个,多个所述置信度由所述预设模型对所述样本数据进行多次预测得到,所述根据所述预测结果中所述置信度低于预设阈值的所述样本数据,确定所述待校验样本数据,包括:
23、在所述预测结果中多个所述置信度的平均值满足所述预设阈值的情况下,确定所述样本数据为所述待校验样本数据。
24、如此,本技术实施方式的服务器可根据预设模型针对同一个样本数据进行多次预测,以得到相对于标注结果的多个置信度,及根据样本数据的多个置信度的平均值确定待校验数据,从而在一定程度上保障待验证噪声数据的可靠确定。
25、在本技术某些实施方式中,所述大语言模型能够根据样本基础信息确定对应的样本数据和标注结果,所述根据所述大语言模型确定所述待校验样本数据的标注结果验证信息,包括:
26、根据所述大语言模型、所述待校验样本数据的样本基础信息及所述待校验样本数据的标注结果,确定所述待校验样本数据的标注结果验证信息。
27、如此,本技术实施方式的服务器可基于大语言模型生成待校验数据所使用的样本基础信息,以及待校验数据的标注数据,使大语言模型输出相应的标注结果验证信息,使得大语言模型能根据充分的输入信息来验证待校验数据的标注数据是否有误,一定程度上使得大语言模型输出的标注结果验证信息的可信度得到保障。
28、在本技术某些实施方式中,所述根据所述大语言模型、所述待校验样本数据的样本基础信息及所述待校验样本数据的标注结果,确定所述待校验样本数据的标注结果验证信息,包括:
29、根据所述大语言模型、所述待校验样本数据的样本基础信息、所述待校验样本数据的标注结果及预先配置的提示信息模板,确定所述待校验样本数据的标注结果验证信息。
30、如此,本技术实施方式可根据预先配置的提示信息模板,使得大语言模型以预定的思考方式或推理方式来推理标注结果校验信息,在一定程度上保障标注结果校验信息的可信度。
31、本技术实施方式提供一种服务器,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述的车辆语音交互方法。
32、本技术实施方式提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现上述的车辆语音交互方法。
33、本技术实施方式提供的车辆和计算机可读存储介质,可通过大语言模型生成的目标训练数据,得到可部署至车辆的语音交互模型,进而使车辆可通过本地部署的语音交互模型,对获取到的当前语音请求进行处理以完成与用户的语音交互,因而能完成离线状态下的语音交互,车辆语音交互功能的使用场景得以拓宽。本技术实施方式的服务器可通过大语言模型生成原始训练数据,并通过大语言模型对原始训练数据进行降噪以得到目标训练数据,从而在一定程度上改善大语言模型因偶发致幻,导致训练语音交互模型的数据存在噪声的情况,由目标训练数据训练的语音交互模型的可靠性得以保障。本技术实施方式的服务器通过大语言模型生成用于训练模型的目标训练数据,使得样本生成和样本标注均需由人工完成的情况得以改善,目标训练数据的获取难度降低,因而语音交互模型的训练难度降低。
34、本技术的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实施方式的实践了解到。
本文地址:https://www.jishuxx.com/zhuanli/20240618/21062.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。