技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、服务器及计算机可读存储介质与流程  >  正文

语音交互方法、服务器及计算机可读存储介质与流程

  • 国知局
  • 2024-06-21 11:56:21

本技术涉及语音交互,特别涉及一种语音交互方法、服务器及计算机可读存储介质。

背景技术:

1、在用户刚开始使用车辆时,由于对车辆和车辆的语音交互功能较为陌生,故可能会表述一些模糊的、不完整的语音指令,而车辆在处理这些语音指令时,因难以理解出语音指令的实际含义,进而无法执行相应的功能,导致语音交互失败。

技术实现思路

1、本技术提供了一种语音交互方法、服务器及计算机可读存储介质。

2、本技术实施方式提供一种语音交互方法,包括:

3、接收车辆转发的当前语音请求;

4、在根据所述当前语音请求,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据大语言模型和所述当前语音请求,确定用于引导用户对所述当前语音请求进行调整的目标引导信息,所述大语言模型能够根据语音请求生成引导信息,所述大语言模型每一训练轮次的训练基于前一训练轮次的第一引导信息预测结果和当前训练轮次的第二引导信息预测结果进行;

5、反馈所述目标引导信息,以引导用户完成所述语音交互。

6、本技术实施方式提供的语音交互方法中,服务器可接收车辆转发的当前语音请求,并在根据当前语音请求未能确定出与当前语音请求相对应的车辆控制指令的情况下,根据预先训练完成的大语言模型和当前语音请求,确定用于引导用户对所述当前语音请求进行调整的目标引导信息,及反馈所述目标引导信息,以引导用户完成所述语音交互。

7、如此,在本技术实施方式中,服务器在未能确定出与当前语音请求相对应的车辆控制指令的情况下,可确定用于引导用户对语音请求进行调整的目标引导信息,并将目标引导信息反馈,使得用户可基于目标引导信息的引导进行当前语音请求的调整,进而,在用户在不清楚如何表述用于控制车辆的语音请求的情况下,可通过目标引导信息引导用户对语音请求进行调整,使得用户对于车辆及车辆语音交互功能的使用体验得以保障。本技术实施方式可根据当前语音请求确定目标引导信息,因而使目标引导信息能够与当前语音请求相关,进而可在一定程度保障目标引导信息与用户当下使用需求的适配,目标引导信息的可靠性能得到保障。本技术实施方式可通过大语言模型确定目标引导信息,因而目标引导信息的可信度能得到一定程度的保障。以及,本技术实施方式使得大语言模型在每一训练轮次的更新,均可基于大语言在前一训练轮次的第一引导信息预测结果,以及大语言模型在当前训练轮次的第二引导信息预测结果进行,实现有基于前一轮训练轮次和当前训练轮次的模型训练,模型训练效果能够得到一定程度的保障。

8、在本技术某些实施方式中,所述大语言模型的训练步骤包括:

9、获取语音请求样本及与所述语音请求样本相对应的引导信息标签;

10、根据所述语音请求样本和所述引导信息标签,训练预先确定的第一参考模型以确定得到所述大语言模型。

11、如此,在本技术实施方式中,服务器可通过获取到的语音请求样本,及语音请求样本对应的引导信息标签,对第一参考模型进行训练以确定大语言模型,使得大语言模型能够可靠地根据语音请求输出相应的引导信息。

12、在本技术某些实施方式中,所述根据所述语音请求样本和所述引导信息标签,训练预先确定的第一参考模型以确定得到所述大语言模型,包括:

13、根据所述语音请求样本和所述引导信息标签,训练所述第一参考模型以得到第二参考模型;

14、根据所述二参考模型和所述语音请求样本,确定所述第二参考模型根据所述语音请求样本在前一训练轮次的所述第一引导信息预测结果和在当前训练轮次的所述第二引导信息预测结果;

15、根据所述第一引导信息预测结果和所述第二引导信息预测结果,训练所述第二参考模型以得到所述大语言模型。

16、如此,在本技术实施方式中,服务器可根据第二参考模型在前一训练轮次针对于语音请求样本的第一引导信息预测结果,以及第二参考模型在当前训练轮次针对于语音请求样本的第二引导信息预测结果,进行第二参考模型的训练并由此得到大语言模型,使得第二参考模型的训练可基于每次更新前后针对于语音请求样本的预测结果进行,第二参考模型的训练效果可在一定程度上得到保障。

17、在本技术某些实施方式中,所述第一引导信息预测结果包括所述第二参考模型在前一训练轮次根据所述语音请求样本确定出所述引导信息标签的第一概率,所述第二引导信息预测结果包括所述第二参考模型在当前训练轮次根据所述语音请求样本确定出所述引导信息标签的第二概率,所述根据所述第一引导信息预测结果和所述第二引导信息预测结果,训练所述第二参考模型以得到所述大语言模型,包括:

18、根据所述第一概率与所述第二概率的相似程度,训练所述第二参考模型以得到所述大语言模型。

19、如此,在本技术实施方式中,服务器可基于第二参考模型在前一训练轮次中通过语音请求样本,预测出语音请求样本对应的引导信息标签的第一概率,以及第二参考模型在当前训练轮次中通过语音请求样本预测出引导信息标签的第二概率,进行第二参考模型的训练以得到大语言模型,使得大语言模型的训练能够依赖于自身在前后两个训练轮次针对语音请求样本对应的引导信息标签的预测概率,从而可实现大语言模型的自我对弈和更新,及使得大语言模型能够在一定程度上与获取到的语音请求样本及引导信息标签对齐,大语言模型的性能可得到保障。

20、在本技术某些实施方式中,所述第一引导信息预测结果包括所述参考模型在前一训练轮次根据所述语音请求样本确定的引导信息预测的第三概率,所述第二引导信息预测结果包括所述参考模型在当前训练轮次根据所述语音请求样本确定出所述引导信息预测的第四概率,所述根据所述第一概率与所述第二概率的相似程度,训练所述第二参考模型以得到所述大语言模型,包括:

21、根据所述第一概率与所述第二概率的相似程度,以及所述第三概率与所述第四概率的相似程度,训练所述第二参考模型以得到所述大语言模型。

22、如此,在本技术实施方式中,服务器可通过第二参考模型在上一个训练轮次中通过语音请求样本预测的引导信息预测的第三概率,以及第二参考模型在当前训练轮次中通过语音请求样本预测出这个引导信息预测的第四概率,进行第二参考模型在当前训练轮次的训练,从而可在一定程度上避免第二参考模型因训练的不断进行而导致预测结果过于发散的情况出现,第二参考模型的训练效果可得到保障。

23、在本技术某些实施方式中,所述在根据所述当前语音请求,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据大语言模型和所述当前语音请求,确定用于引导用户对所述当前语音请求进行调整的目标引导信息,包括:

24、在根据所述当前语音请求和所述大语言模型,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据所述大语言模型和所述当前语音请求确定所述目标引导信息。

25、如此,在本技术实施方式中,服务器可通过大语言模型确认当前语音请求的车辆控制指令,及在大语言模型未能预测出当前语音请求的车辆控制指令的情况下,基于大语言模型确定当前语音请求对应的目标引导信息,使得当前语音请求的车辆控制指令预测及当前语音请求的目标引导信息预测均可基于大语言模型实现,避免服务器中需单独设置用于语音请求对应的车辆控制指令的模块,和用于预测目标引导信息的模块的情况出现,服务器的负荷得以降低。

26、在本技术某些实施方式中,所述在根据所述当前语音请求和所述大语言模型,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据所述大语言模型和所述当前语音请求确定所述目标引导信息,包括:

27、在根据所述当前语音请求和所述大语言模型,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据所述当前语音请求、所述大语言模型及预先配置的提示信息模板,确定所述目标引导信息。

28、如此,在本技术实施方式中,大语言模型可基于提示信息模板的指示,对当前语音请求进行自然语言理解和处理,从而生成当前语音请求的目标引导信息,使得大语言模型的稳健运行得以保障。

29、在本技术某些实施方式中,所述提示信息模板包括第一提示信息子模板和第二提示信息子模板,所述在根据所述当前语音请求和所述大语言模型,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据所述当前语音请求、所述大语言模型及预先配置的提示信息模板,确定所述目标引导信息,包括:

30、在根据所述当前语音请求、所述大语言模型及所述第一提示信息子模板,未能确定出与所述当前语音请求相对应的车辆控制指令的情况下,根据所述当前语音请求、所述大语言模型及所述第二提示信息子模板,确定所述目标引导信息。

31、如此,在本技术实施方式中,大语言模型可基于提示信息模板中的第一子提示信息模板、第二子提示信息模板及当前语音请求,确认当前语音请求与车辆控制指令的对应关系,及在确认出当前语音请求与能与车辆控制指令相对应的情况下,确认出当前语音请求对应的目标引导信息,实现有大语言模型基于提示信息模板的推理,因而大语言模型的推理精度能得到一定程度地保障。

32、本技术实施方式提供一种服务器,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述的语音交互方法。

33、本技术实施方式提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现上述的语音交互方法。

34、本技术实施方式提供的服务器和计算机可读存储介质,在未能确定出与当前语音请求相对应的车辆控制指令的情况下,可确定用于引导用户对语音请求进行调整的目标引导信息,并将目标引导信息反馈,使得用户可基于目标引导信息的引导进行当前语音请求的调整,进而,在用户在不清楚如何表述用于控制车辆的语音请求的情况下,可通过目标引导信息引导用户对语音请求进行调整,使得用户对于车辆及车辆语音交互功能的使用体验得以保障。本技术实施方式可根据当前语音请求确定目标引导信息,因而使目标引导信息能够与当前语音请求相关,进而可在一定程度保障目标引导信息与用户当下使用需求的适配,目标引导信息的可靠性能得到保障。本技术实施方式可通过大语言模型确定目标引导信息,因而目标引导信息的可信度能得到一定程度的保障。以及,本技术实施方式使得大语言模型在每一训练轮次的更新,均可基于大语言在前一训练轮次的第一引导信息预测结果,以及大语言模型在当前训练轮次的第二引导信息预测结果进行,实现有基于前一轮训练轮次和当前训练轮次的模型训练,模型训练效果能够得到一定程度的保障。

35、本技术的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实施方式的实践了解到。

本文地址:https://www.jishuxx.com/zhuanli/20240618/24592.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。