技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种智能驾舱语音分析方法、装置、电子设备及车辆与流程  >  正文

一种智能驾舱语音分析方法、装置、电子设备及车辆与流程

  • 国知局
  • 2024-06-21 11:33:00

本技术涉及车辆智能驾舱语音识别,尤其涉及一种智能驾舱语音分析方法、装置、电子设备及车辆。

背景技术:

1、随着车辆的智能化发展,传统驾舱也已经发展至智能驾舱的阶段。语音交互技术越来越多的应用到智能驾舱中。当用户说出特定的关键词后,能唤醒车机交互系统,通过语音控制车辆状态以及车机系统,完成如打开车窗、播放音乐、地图导航等操作。

2、随着技术的发展,用户对语音交互的需求也越来越高,越来越具有个性化倾向。现有的智能驾舱语音交互方案中,为满足用户的个性化交互需求,需对用户声音信息的多种特征进行分析,如用户的性别特征、用户的年龄特征等。为此,在智能驾舱的语音交互系统中单独为每一个特征的识别任务部署一个识别算法模型,通过识别算法模型对语音交互时收到的语音信息进行所需特征表征的提取,每一个识别算法模型提取的特征表征代入到一个用于识别特征的模型中得到识别结果。而随着用户需求的提高,需要识别的特征表征的数量快速增加,需要的识别算法模型也不断增多,语音交互系统的复杂度越来越高,数据处理压力也越来越大。因此,需要对现有的语音交互系统中的语音分析算法进行改进。

技术实现思路

1、本技术的目的在于提供一种智能驾舱语音分析方法、装置、电子设备及车辆,以解决现有技术中智能驾舱的语音分析方法导致语音交互系统复杂程度高、数据处理压力大的技术问题。

2、为解决上述技术问题,本技术第一方面的技术方案提供一种智能驾舱语音分析方法,包括如下步骤:

3、对获取到的语音信息进行语音信号分析,得到所述语音信息的声学特征;

4、将所述声学特征输入至预置的特征提取模型,根据所述特征提取模型的输出得到与所述语音信息对应的全部特征表征;

5、将所述全部特征表征输入至多个预置的特征分类模型,根据每一所述特征分类模型的输出得到相应特征识别任务所需的目标特征表征;其中,每一所述特征分类模型与一个特征识别任务相对应;

6、根据各个所述目标特征表征得到与所述语音信息对应的目标特征识别结果。

7、在一些方案中的智能驾舱语音分析方法,所述特征提取模型为支持多任务学习的神经网络中的特征提取器,多个所述特征分类模型为支持多任务学习的神经网络中的多个分类器;所述特征提取模型和多个所述特征分类模型通过如下方式得到:

8、以样本语音信息的声学特征样本作为输入,以与所述样本语音信息对应的多个任务特征标签作为输出,对支持多任务学习的神经网络进行训练;其中,每一所述任务特征标签对应于一个目标特征识别结果;

9、完成训练后,所述神经网络中的特征提取器为所述特征提取模型,所述神经网络中的分类器为所述特征分类模型,每一所述特征分类模型对应于一个所述任务特征标签。

10、在一些方案中的智能驾舱语音分析方法,所述根据各个所述目标特征表征得到与所述语音信息对应的目标特征识别结果的步骤之后还包括:

11、对比每一所述目标特征表征对应的任务特征标签和目标特征识别结果;

12、若任意一组任务特征标签和目标特征识别结果不同,则根据所述目标特征识别结果对所述神经网络的整体损失函数进行调整。

13、在一些方案中的智能驾舱语音分析方法,所述对获取到的语音信息进行语音信号分析,得到所述语音信息的声学特征的步骤中:所述声学特征包括声纹特征、性别特征、年龄特征、口音特征和语气特征中的至少两个;

14、所述将所述声学特征输入至预置的特征提取模型,根据所述特征提取模型的输出得到与所述语音信息对应的全部特征表征的步骤中:所述全部特征表征用于映射声纹特征、性别特征、年龄特征、口音特征、语气特征中的至少两个;

15、将所述全部声学特征参数输入至多个预置的特征分类模型,根据每一所述特征分类模型的输出得到相应特征识别任务所需的目标特征表征的步骤中:所述特征分类模型包括与声纹特征识别任务相对应的声纹特征分类模型、与性别特征识别任务相对应的性别特征分类模型、与年龄特征识别任务相对应的年龄特征分类模型、与口音特征识别任务相对应的口音特征分类模型以及与语气特征识别任务相对应的语气特征分类模型中的至少两个。

16、在一些方案中的智能驾舱语音分析方法,以样本语音信息的声学特征样本作为输入,以与所述样本语音信息对应的多个任务特征标签作为输出,对支持多任务学习的神经网络进行训练的步骤中:

17、所述任务特征标签包括声纹特征标签、性别特征标签、年龄特征标签、口音特征标签以及语气特征标签中的至少两个;在所述神经网络中,以与声纹特征标签对应的训练任务作为主要任务,以其他特征标签对应的训练任务作为辅助任务。

18、在一些方案中的智能驾舱语音分析方法,还包括如下步骤:

19、根据所述目标特征识别结果确定用户的偏好交互方式;

20、根据所述偏好交互方式播放与所述语音信息相对应的音频。

21、本技术第二方面的技术方案提供一种智能驾舱语音分析装置,包括:

22、语音信号分析模块,对获取到的语音信息进行语音信号分析,得到所述语音信息的声学特征;

23、声学特征参数提取模块,将所述声学特征输入至预置的特征提取模型,根据所述特征提取模型的输出得到与所述语音信息对应的全部特征表征;

24、目标特征提取模块,将所述全部特征表征输入至多个预置的特征分类模型,根据每一所述特征分类模型的输出得到相应特征识别任务所需的目标特征表征;其中,每一所述特征分类模型与一个特征识别任务相对应;

25、特征识别模块,根据各个所述目标特征表征得到与所述语音信息对应的目标特征识别结果。

26、本技术第三方面的技术方案提供一种电子设备,所述电子设备包括至少一个处理器和至少一个存储器,至少一个所述存储器中存储有程序信息,至少一个所述处理器读取所述程序信息后执行第一方面中任一项所述的智能驾舱语音分析方法。

27、本技术第四方面的技术方案提供一种存储介质,所述存储介质中存储有程序信息,计算机读取所述程序信息后执行第一方面任一项所述的智能驾舱语音分析方法。

28、本技术第五方面的技术方案提供一种车辆,所述车辆包括第二方面所述的智能驾舱语音分析装置或第三方面所述的电子设备或第四方面所述的存储介质。

29、采用上述技术方案,具有以下有益效果:

30、本技术技术方案中,在得到语音信息后,根据语音信息得到声学特征,利用声学特征和预置的特征提取模型将语音信息中的全部特征表征提取出来,之后全部特征表征输入到各个特征识别任务对应的特征分类模型中,每一个特征分类模型都能够获取到特征识别所需要的目标特征表征,根据目标特征表征就能够得到目标特征识别结果。显然,本技术技术方案仅需要一个特征提取模型得到全部的特征表征参数,之后利用特征分类模型依据特征识别任务将全部特征表征分类参数进行分类即可,相比于现有技术中针对每一个需要识别的目标特征都需要预置特征提取的识别算法模型来说,本技术减少了算法模型的数量,精简了智能驾舱语音交互系统,且降低了语音交互系统对于数据处理的压力。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22176.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。