技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音控制方法与装置及车机系统、电子设备和存储介质与流程 > 正文

语音控制方法与装置及车机系统、电子设备和存储介质与流程

国知局
2024-06-21 10:41:57

本申请的实施方式涉及车辆语音控制，更具体地，涉及一种语音控制方法与装置及车机系统、电子设备和存储介质。

背景技术：

1、随着汽车智能化的不断发展，智能驾驶、人机交互等新兴技术已成为智能汽车的重要发展方向。例如车辆搭载的语音识别系统利用语音助手等实现了诸多语音交互功能。

2、目前，智能汽车的语音控制系统可基于用户的语音输入信息进行语音识别处理，进而可与用户进行语音交互，例如询问天气情况等；此外还可根据识别出的控制指令对车机系统执行相应的控制，从而实现对车机系统的例如音乐播放、导航以及空调温度设定等各种控制。

3、然而，由于语音输入的多样性和模糊性，实现准确的语音指令判断仍然是一个难点。在实际应用中，随着语义理解的词条总数变大以及更多的泛化，可能会带来更多的误理解，导致语音误触发会变得越来越多，影响用户体验。

技术实现思路

1、本申请的实施方式的一个目的在于提供一种应用于语音控制方法与装置及车机系统、电子设备和存储介质，其优势在于通过收集和使用非交互意图类的语料数据构建训练数据集，对意图识别模型进行训练，能够更准确地识别出用户真实意图，从而可解决在实际应用中语音交互意图识别准确率较低，用户体验较差的问题。

2、本申请的实施方式的另一个目的在于提供一种应用于语音控制方法与装置及车机系统、电子设备和存储介质，其优势在于通过构建语料库并使用语料库中标注的语料数据构建训练数据集，具体地，通过将交互意图类语料数据作为样本数据，将非交互意图类语料数据作为负例样本来共同构建训练数据集，对意图识别模型进行训练，经过训练的意图识别模型可实现对非交互意图类的语句实现准确判断，降低语音指令判断的错误率，提升用户体验。

3、本申请的实施方式的另一个目的在于提供一种应用于语音控制方法与装置及车机系统、电子设备和存储介质，其优势在于在初步识别出用户的交互意图时，可对用户的语音输入信息进行进一步识别处理，根据用户的语音指令实现用户与车机系统之间的语音交互。

4、本申请的实施方式的另一个目的在于提供一种应用于语音控制方法与装置及车机系统、电子设备和存储介质，其优势在于在初步识别出用户的交互意图时，可对用户的语音输入信息进行进一步识别处理，根据识别出的控制指令对车机系统执行相应的控制操作。

5、本申请的实施方式的另一个目的在于提供一种应用于语音控制方法与装置及车机系统、电子设备和存储介质，其优势在于根据收集的意图识别模型的识别结果以及用户的行为数据等反馈信息更新语料库，对意图识别模型进行不断优化，进而提高模型的准确率，适应更多语音应用场景的需求。

6、为实现上述目的，依据本申请的第一方面，本申请的实施方式提供了一种应用于车机系统的语音控制方法，其可包括：响应于接收到语音输入信息，将语音输入信息处理为待识别信息；将待识别信息输入预先训练的意图识别模型，得到意图类别的识别结果，其中意图识别模型的训练数据集包括非交互意图类的语料数据；以及响应于识别结果为非交互意图类，对待识别信息进行忽略处理。

7、在一些实施方式中，训练数据集还可包括交互意图类的语料数据；训练数据集通过将交互意图类语料数据作为样本数据，将非交互意图类语料数据作为负例样本共同构建得到。

8、在一些实施方式中，预先训练的意图识别模型可采用以下方法训练得到：基于收集的语料数据构建语料库；对语料库中的语料数据进行意图类别标注，其中意图类别包括交互意图类和非交互意图类；以及使用语料库中标注的语料数据构建训练数据集，对意图识别模型进行训练。

9、在一些实施方式中，将待识别信息输入预先训练的意图识别模型，得到识别结果，可包括：将待识别信息转换为特征向量表示；基于特征向量表示，分别计算每个意图类别的匹配度得分；以及将匹配度得分最高的、或者匹配度得分高于对应的预定阈值的意图类别作为识别结果，其中非交互意图类对应的预定阈值高于交互意图类对应的预定阈值。

10、在一些实施方式中，语音控制方法还可包括：响应于识别结果为交互意图类，对待识别信息进行识别处理；响应于对待识别信息识别出控制指令，将控制指令进行显示或者进行语音播报，提示用户进行确认或拒绝操作；以及响应于接收到用户的确认操作，对车机系统执行相应的控制。

11、在一些实施方式中，语音控制方法还可包括：根据收集的反馈信息更新语料库，以用于对意图识别模型进行优化；其中反馈信息包括：意图识别模型的识别结果、以及用户的行为数据，其中行为数据包括对控制指令的确认或拒绝操作。

12、依据本申请的第二方面，本申请的实施方式还提供了一种应用于车机系统的语音控制装置，其可包括：预处理模块，配置为响应于接收到语音输入信息，将语音输入信息处理为待识别信息；意图识别模型，配置为接收待识别信息作为输入，对待识别信息进行意图识别，得到意图类别的识别结果，其中意图识别模型的训练数据集包括非交互意图类的语料数据；以及控制模块，配置为响应于识别结果为非交互意图类，对待识别信息进行忽略处理。

13、依据本申请的第三方面，本申请的实施方式还提供了一种车机系统，其包括如上述本申请第二方面提供的语音控制装置。

14、依据本申请的第四方面，本申请的实施方式还提供了一种电子设备，包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请第一方面所述的语音控制方法。

15、依据本申请的第五方面，本申请的实施方式还提供了一种非瞬态计算机可读存储介质，其上存储有机器可执行指令，机器可执行指令在被执行时使机器执行如上述本申请第一方面提供的语音控制方法。

16、应当理解，本部分所描述的内容并非旨在标识本公开的实施方式的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种应用于车机系统的语音控制方法，其特征在于，所述方法包括：

2.根据权利要求1的方法，其中，所述训练数据集还包括交互意图类的语料数据；

3.根据权利要求1所述的方法，其中，所述预先训练的意图识别模型是采用以下方法训练得到：

4.根据权利要求3所述的方法，其中，将所述待识别信息输入预先训练的意图识别模型，得到识别结果，包括：

5.根据权利要求2-4中任一项所述的方法，其中，所述方法还包括：

6.根据权利要求5所述的方法，其中，所述方法还包括：

7.一种应用于车机系统的语音控制装置，其特征在于，所述语音控制装置包括：

8.一种车机系统，其特征在于，包括如权利要求7所述的语音控制装置。

9.一种电子设备，其特征在于，包括：

10.一种计算机可读存储介质，其上存储有机器可执行指令，所述机器可执行指令在被执行时使机器执行权利要求1至6中任一项所述的语音控制方法。

技术总结本申请实施方式涉及应用于车机系统的语音控制方法与装置及车机系统、电子设备和存储介质。该应用于车机系统的语音控制方法可包括：响应于接收到语音输入信息，将所述语音输入信息处理为待识别信息；将所述待识别信息输入预先训练的意图识别模型，得到意图类别的识别结果，其中所述意图识别模型的训练数据集包括非交互意图类的语料数据；以及响应于所述识别结果为非交互意图类，对所述待识别信息进行忽略处理。技术研发人员：唐涛受保护的技术使用者：博泰车联网（南京）有限公司技术研发日：技术公布日：2024/2/1