语音交互方法、服务器及计算机可读存储介质与流程
- 国知局
- 2024-06-21 11:56:26
本技术涉及语音交互,特别涉及一种语音交互方法、服务器及计算机可读存储介质。
背景技术:
1、在用户刚开始使用车辆时,由于对车辆和车辆的语音交互功能较为陌生,故可能会表述一些模糊的、不完整的语音指令,而车辆在处理这些语音指令时,因难以理解出语音指令的实际含义,进而无法执行相应的功能,导致语音交互失败。
技术实现思路
1、本技术提供了一种语音交互方法、服务器及计算机可读存储介质。
2、本技术实施方式提供的一种语音交互方法,包括:
3、接收车辆转发的当前语音请求;
4、在根据所述当前语音请求,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据大语言模型和所述当前语音请求,确定用于引导用户对所述当前语音请求进行调整的目标引导信息,所述大语言模型预先训练完成,且能够基于第一语音请求样本生成多个候选引导信息,并基于所述多个候选引导信息的排序结果确定一个预测引导信息;
5、反馈所述目标引导信息,以引导用户完成所述语音交互。
6、本技术实施方式提供的语音交互方法中,服务器可接收车辆转发的当前语音请求,并在未能确认出与当前语音请求相对应的车辆控制指令的情况下,调用预先训练完成的、能够通过第一语音请求样本生成多个候选引导信息,和基于多个候选引导信息的排序结果确定一个预测引导信息的大语言模型,确定用于引导用户对当前语音请求进行调整的目标引导信息,及将目标引导信息反馈,以引导用户完成语音交互。
7、如此,在本技术实施方式中,服务器可在未能确定出与语音请求相对应的车辆控制指令的情况下,基于预先完成的大语言模型,确定出用于引导用户对语音请求进行调整的目标引导信息,及将目标引导信息反馈给用户,以引导用户对语音请求进行调整,由此在用户在不清楚如何表述用于控制车辆的语音请求的情况下,可通过目标引导信息引导用户对语音请求进行调整,用户对于车辆及车辆语音交互功能的使用体验得以保障。本技术实施方式可根据当前语音请求确定目标引导信息,因而目标引导信息能够与当前语音请求相关,进而可在一定程度上保障目标引导信息与用户当下使用需求的匹配,目标引导信息的可靠性能得到保障。以及,本技术实施方式可通过大语言模型确定目标引导信息,因而目标引导信息的可信程度能得到一定程度的保障。以及,本技术实施方式中的大语言模型能够根据多个候选引导信息的排序结果,确定出多个候选引导信息中的预测引导信息,因而预测引导信息能够与多个候选引导信息排序结果相关,预测引导信息和目标引导信息的可信度能得到一定程度的保障。
8、在本技术某些实施方式中,所述大语言模型的训练步骤包括:
9、根据所述第一语音请求样本和预先训练完成的参考模型,确定所述多个候选引导信息;
10、根据所述排序结果,确定所述多个候选引导信息中的第一候选引导信息和第二候选引导信息;
11、根据所述第一候选引导信息与所述第二候选引导信息构成的组合,对所述参考模型进行训练以得到所述大语言模型。
12、如此,在本技术实施方式中,服务器可在参考模型针对第一语音请求样本确定出多个候选引导信息的情况下,根据多个候选引导信息的排序结果确定多个候选引导信息中的第一候选引导信息和第二候选引导信息,及通过第一候选引导信息和第二候选引导信息的组合,完成参考模型的训练,使得参考模型能够在一定程度上学习到组合中第一候选引导信息和第二候选引导信息的关联。
13、在本技术某些实施方式中,所述根据所述第一候选引导信息与所述第二候选引导信息构成的组合,对所述参考模型进行训练以得到所述大语言模型,包括:
14、根据所述组合及所述参考模型,确定所述参考模型对于所述组合中第一候选引导信息的第一预测结果,及对于所述组合中第二候选引导信息的第二预测结果;
15、根据所述第一预测结果和所述第二预测结果的差异程度,对所述参考模型进行训练以得到所述大语言模型。
16、如此,本技术实施方式中,服务器可在确定出参考模型预测出组合中第一候选引导信息的第一预测结果,及参考模型预测出组合中第二候选引导信息的第二预测结果的情况下,基于第一预测结果和第二预测结果的差异程度进行参考模型的训练。
17、在本技术某些实施方式中,所述参考模型包括目标模型和所述目标模型的副本模型,所述差异程度包括与所述目标模型相对应的第一差异程度和与所述副本模型相对应的第二差异程度,所述根据所述第一预测结果和所述第二预测结果的差异程度,对所述参考模型进行训练以得到所述大语言模型,包括:
18、根据所述第一差异程度和所述第二差异程度,对所述目标模型进行训练以得到所述大语言模型。
19、如此,在本技术实施方式中,可基于副本模型的预测结果进行目标模型的训练,从而能在一定程度上目标模型的训练能参照副本模型来进行,从而能在一定程度上降低目标模型因训练而出现性能退化的可能性,目标模型的训练得以可靠进行。
20、在本技术某些实施方式中,所述大语言模型的训练步骤包括:
21、根据所述第一语音请求样本、所述参考模型及预先配置的提示信息模板,确定所述多个候选引导信息。
22、如此,在本技术实施方式中,参考模型可基于提示信息模板的指示,对第一语音请求样本进行自然语言理解和处理,从而生成第一语音请求样本的候选引导信息,使得参考模型的稳健运行得以保障。
23、在本技术某些实施方式中,所述大语言模型的训练步骤包括:
24、获取第二语音请求样本及所述第二语音请求样本对应的引导信息标签;
25、根据所述第二语音请求样本和所述引导信息标签,对预先确定的基础模型进行训练以确定所述参考模型。
26、如此,在本技术实施方式中,服务器可通过未与车辆控制指令对应的第二语音请求样本,及与第二语音求你去相对应的引导信息标签,训练基础模型以得到能够根据未与车辆控制指令对应的语音请求来生成引导信息的参考模型。
27、在本技术某些实施方式中,所述在根据所述当前语音请求,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据大语言模型和所述当前语音请求,确定用于引导用户对所述当前语音请求进行调整的目标引导信息,包括:
28、在根据所述当前语音请求未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据所述大语言模型和所述当前语音请求,生成与所述当前语音请求相对应的推荐语音请求以确定所述目标引导信息。
29、如此,在本技术实施方式中,服务器可基于大语言模型,推理出与当前语音请求相对应的推荐语音请求,并基于推荐语音请求形成目标引导信息,进而用户可基于推荐语音请求进行当前语音请求的调整,因而目标引导信息的有效性得以保障。
30、在本技术某些实施方式中,所述在根据所述当前语音请求,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据大语言模型和所述当前语音请求,确定用于引导用户对所述当前语音请求进行调整的目标引导信息,包括:
31、在基于所述大语言模型、所述当前语音请求及预先配置的思维链提示信息模板中的第一子提示信息模板,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据所述大语言模型、所述当前语音请求及所述思维链提示信息模板中的第二子提示信息模板,确定所述目标引导信息。
32、如此,在本技术实施方式中,大语言模型可基于思维链提示信息模板中的第一子提示信息模板、第二子提示信息模板及当前语音请求,确认当前语音请求与车辆控制指令的对应关系,及在确认出当前语音请求与能与车辆控制指令相对应的情况下,确认出当前语音请求对应的目标引导信息,实现有大语言模型基于思维链提示信息模板的推理,因而大语言模型的推理精度能得到一定程度地保障。
33、本技术实施方式提供一种服务器,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述的语音交互方法。
34、本技术实施方式提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现上述的语音交互方法。
35、本技术实施方式的服务器和计算机可读存储介质,可在未能确定出与语音请求相对应的车辆控制指令的情况下,基于预先完成的大语言模型,确定出用于引导用户对语音请求进行调整的目标引导信息,及将目标引导信息反馈给用户,以引导用户对语音请求进行调整,由此在用户在不清楚如何表述用于控制车辆的语音请求的情况下,可通过目标引导信息引导用户对语音请求进行调整,用户对于车辆及车辆语音交互功能的使用体验得以保障。本技术实施方式可根据当前语音请求确定目标引导信息,因而目标引导信息能够与当前语音请求相关,进而可在一定程度上保障目标引导信息与用户当下使用需求的匹配,目标引导信息的可靠性能得到保障。以及,本技术实施方式可通过大语言模型确定目标引导信息,因而目标引导信息的可信程度能得到一定程度的保障。以及,本技术实施方式中的大语言模型能够根据多个候选引导信息的排序结果,确定出多个候选引导信息中的预测引导信息,因而预测引导信息能够与多个候选引导信息排序结果相关,预测引导信息和目标引导信息的可信度能得到一定程度的保障。
36、本技术的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实施方式的实践了解到。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24607.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表