技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、服务器及计算机可读存储介质与流程  >  正文

语音交互方法、服务器及计算机可读存储介质与流程

  • 国知局
  • 2024-06-21 11:26:36

本技术涉及语音交互,特别涉及一种语音交互方法、服务器及计算机可读存储介质。

背景技术:

1、为满足用户的语音交互,车辆或与车辆联网的服务器中可搭载有训练完成的语音交互模型,以使得车辆可通过语音交互模型完成与用户的交互。然而,在语音交互模型的训练过程中,训练数据过多则会导致训练时间过长,训练数据过少则可能导致模型预测精度不佳。

技术实现思路

1、本技术提供了一种语音交互方法、服务器及计算机可读存储介质。

2、本技术实施方式提供一种语音交互方法,包括:

3、获取初始训练数据,所述初始训练数据包括多个样本;

4、根据第一预设模型,确定所述初始训练数据中样本的多个标签推理结果;

5、根据所述多个标签推理结果,确定所述初始训练数据中的参考样本;

6、在候选训练数据中,选取与所述参考样本语义相近的目标样本,以确定目标训练数据;

7、利用所述目标训练数据训练第二预设模型,得到语音交互模型,以根据所述语音交互模型完成所述语音交互。

8、本技术实施方式提供的语音交互方法中,服务器可获取由多个样本构成的初始训练数据,根据第一预设模型,确定初始训练数据中每个样本的多个标签推理结果,根据每个样本的多个标签推理结果,确定初始训练数据中的参考样本,在候选训练数据中选取与参考样本语义相近的目标样本,以确定目标训练数据,利用目标训练数据对第二预设模型进行训练,以根据完成训练的第二预设模型得到语音交互模型,进而能根据语音交互模型完成语音交互。

9、如此,在本技术实施方式中,服务器可根据选取数据量较大的候选训练数据中与参考样本语义相近的目标样本,以确定数据量较小的目标训练数据,及根据目标训练数据训练第二预设模型,以得到能用于语义交互的语音交互模型,使得语音交互模型的训练时长可得到保障。本技术实施方式的服务器可根据初始训练数据中各个样本的标签推理结果,确定初始训练数据中的参考样本,及选取候选训练数据中与参考样本语义相近的目标样本,使得目标样本的选取能考虑到第一预设模型的多次推理情况,目标样本的可信度和有效性在一定程度上得到保障,也因此,通过包括有目标样本的目标训练数据训练得到的语音交互模型的预测精度在一定程度上得到保障。

10、在本技术某些实施方式中,所述根据所述多个标签推理结果,确定所述初始训练数据中的参考样本,包括:

11、根据所述初始训练数据中,所述多个标签推理结果中存在预设数量的错误标签推理结果的样本,确定所述参考样本,所述错误标签推理结果包括与所述样本的标签存在差异的标签推理结果。

12、如此,本技术实施方式的服务器可在根据初始训练数据中,多个标签推理结果中存在预设数量的错误标签推理结果的样本,完成参考样本的确定,使得参考样本的推理难度可在一定程度上保障,进而,根据参考样本选取的目标样本的推理难度亦能保障,利用目标训练数据训练得到的语音交互模型的预测精度亦可得到保障。

13、在本技术某些实施方式中,所述在候选训练数据中,选取与所述参考样本语义相近的目标样本,以确定目标训练数据,包括:

14、根据所述候选训练数据中,与所述参考样本的相似度满足预设条件的所述目标样本,确定所述目标训练数据。

15、如此,本技术实施方式可根据候选训练数据中,与参考样本的相似度满足预设条件的样本来确定目标样本,由此在一定程度上保障有目标样本与参考样本的相似性,通过目标样本训练第二预设模型而产生的训练效果也能在一定程度上得到保障。

16、在本技术某些实施方式中,所述候选训练数据由预设的图谱数据确定,所述在候选训练数据中,选取与所述参考样本语义相近的目标样本,以确定目标训练数据,包括:

17、在所述图谱数据包括所述参考样本的情况下,选取所述候选训练数据内与所述参考样本语义相近的目标样本,以确定目标训练数据。

18、如此,本技术实施方式在候选训练数据由图谱数据确定,而图谱数据不包括初始训练数据中的参考样本的情况下,直接选取候选训练数据中与参考样本语义相近的目标样本以确定目标训练数据,进而,使得由目标训练数据训练得到语音交互模型能学习到语义相近的不同目标样本的区分方式,语音交互模型的可靠性和预测精度均能在一定程度上得到保障。

19、在本技术某些实施方式中,所述初始训练数据由预设的图谱数据确定,所述在候选训练数据中,选取与所述参考样本语义相近的目标样本,以确定目标训练数据,包括:

20、在所述图谱数据未包括所述参考样本的情况下,根据所述候选训练数据中,与所述参考样本语义相近且与所述参考样本对应的业务功能相匹配的目标样本,确定所述目标训练数据。

21、如此,本技术实施方式可选取候选训练数据中与参考样本语义相近,且与参考样本对应的业务功能相匹配的样本以作为目标样本,进而在通过由目标样本构成的目标训练数据执行第二预设模型的训练时,第二预设模型能学习到语义相似且业务功能匹配的样本的标签推理知识或标签推理能力,从而使第二预设模型的泛化能力在一定程度上提升。

22、在本技术某些实施方式中,所述第一预设模型包括多个,所述根据第一预设模型,确定所述初始训练数据中样本的多个标签推理结果,包括:

23、利用多个所述第一预设模型分别推理所述初始训练数据中样本,确定多个所述标签推理结果。

24、如此,本技术实施方式可根据多个第一预设模型对同一个样本进行推理,以得到由多个第一预设模型得到的多个标签推理结果,使得后续的参考样本可以由不同第一预设模型所对应的标签推理结果来确定,在一定程度上保障有参考样本的合理确定。

25、在本技术某些实施方式中,所述根据第一预设模型,确定所述初始训练数据中样本的多个标签推理结果,包括:

26、利用所述第一预设模型对所述初始训练数据中样本进行多次推理,确定多个所述标签推理结果。

27、如此,本技术实施方式的服务器可根据利用一个第一预设模型对初始训练数据中样本进行多次推理,从而得到一个样本的多个标签推理结果,进而能在一定程度上降低服务器调用第一预设模型所需的负荷。

28、在本技术某些实施方式中,所述方法还包括:

29、抽取原始训练数据中的样本以确定所述候选训练数据。

30、如此,本技术实施方式可通过抽取原始训练数据中的样本,以完成候选训练数据的确定,从而能避免直接对原始训练数据进行目标样本采样的情况出现,也使得候选训练数据的获取效率能在一定程度上得到保障。

31、在本技术某些实施方式中,所述抽取原始训练数据中的样本以确定所述候选训练数据,包括:

32、根据预先确定的业务功能与样本的对应关系,根据所述业务功能抽取所述原始训练数据中的样本以确定所述候选训练数据。

33、如此,本技术实施方式使得服务器可根据业务功能与样本的对应,抽取原始训练数据中各个业务功能的样本以构建候选训练数据,在一定程度上保障候选训练数据和目标训练数据中样本的合理分布。

34、在本技术某些实施方式中,所述方法还包括:

35、根据预设的图谱数据,确定所述原始训练数据。

36、如此,本技术实施方式的服务器可根据预先确定的图谱数据得到原始训练数据的样本,使得原始训练数据中样本的获取难度得以降低,样本获取效率得以保障。

37、本技术实施方式提供一种服务器,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述的语音交互方法。

38、本技术实施方式提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现上述的语音交互方法。

39、本技术实施方式提供的服务器和计算机可读存储介质,可根据选取数据量较大的候选训练数据中与参考样本语义相近的目标样本,以确定数据量较小的目标训练数据,及根据目标训练数据训练第二预设模型,以得到能用于语义交互的语音交互模型,使得语音交互模型的训练时长可得到保障。本技术实施方式的服务器可根据初始训练数据中各个样本的标签推理结果,确定初始训练数据中的参考样本,及选取候选训练数据中与参考样本语义相近的目标样本,使得目标样本的选取能考虑到第一预设模型的多次推理情况,目标样本的可信度和有效性在一定程度上得到保障,也因此,通过包括有目标样本的目标训练数据训练得到的语音交互模型的预测精度在一定程度上得到保障。

40、本技术的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实施方式的实践了解到。

本文地址:https://www.jishuxx.com/zhuanli/20240618/21550.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。