技术新讯 > 乐器声学设备的制造及制作,分析技术 > 车载语音系统语音识别方法、装置、存储介质及车辆与流程  >  正文

车载语音系统语音识别方法、装置、存储介质及车辆与流程

  • 国知局
  • 2024-06-21 11:52:11

本发明涉及语音识别,具体而言,涉及一种车载语音系统语音识别方法、装置、存储介质及车辆。

背景技术:

1、车载语音系统是车辆的智能设备之一,其能够对接收的车辆用户语音数据进行识别,根据语音识别结果对车辆进行控制,从而实现与车辆用户的智能交互。然而,现有的车载语音系统其词库丰富度低、缺乏细节内容以及对于车辆用户的适应性差,导致无法准确识别特定车辆用户的语音数据,进而导致用户用车体验差。

2、由上分析可知,针对上述现有的车载语音系统词库对于不同车辆用户的适应性差的问题,目前尚未提出有效的解决方案。

技术实现思路

1、本发明实施例提供了一种车载语音系统语音识别方法、装置、存储介质及车辆,以至少解决现有的车载语音系统词库对于不同车辆用户的适应性差的技术问题。

2、根据本发明实施例的一个方面,提供了一种车载语音系统语音识别方法,包括:

3、获取目标词库,其中,目标词库基于对抗生成网络、目标神经网络和待训练词汇数据集生成,待训练词汇数据集为第一词汇、第二词汇和第三词汇的集合,第一词汇为车载语音系统初始词库中的词汇,第二词汇为从历史语音数据中提取的特征词汇,第三词汇为第一词汇和第二词汇的预测词汇;采用目标词库对目标语音数据进行识别,得到识别结果,其中,目标语音数据用于进行车辆控制。

4、可选地,上述车载语音系统语音识别方法还包括:获取初始词库和历史语音数据;利用对抗生成网络对第一词汇和第二词汇进行对抗训练,得到第三词汇;基于目标神经网络和待训练词汇数据集生成目标词库。

5、可选地,上述车载语音系统语音识别方法还包括:对历史语音数据进行降噪处理,得到降噪后语音数据;对降噪后语音数据进行特征提取,得到第二词汇。

6、可选地,对抗生成网络包括生成器和判别器,生成器用于进行数据预测,判别器用于进行数据真实性判断,利用对抗生成网络对第一词汇和第二词汇进行对抗训练,得到第三词汇包括:利用生成器对第一词汇和第二词汇进行预测,得到预测词汇;将第二词汇和预测词汇进行混合,得到混合词汇;利用判别器判断混合词汇中任意一个词汇是否属于第二词汇,得到判断结果;根据判断结果确定判别器的判断成功率,其中,判断成功率用于评估预测词汇与第二词汇的拟合程度;响应于判断成功率小于预设值,将当前预测词汇作为第三词汇。

7、可选地,目标神经网络包括基础卷积神经网络和基于注意力机制的卷积神经网络,基于目标神经网络和待训练词汇数据集生成目标词库包括:将待训练词汇数据集划分为第一数据集和第二数据集;利用基础卷积神经网络对第一数据集进行训练,得到第一词库;利用基于注意力机制的卷积神经网络对第二数据集进行训练,得到第二词库;将第一词库与第二词库进行拼接,得到目标词库。

8、可选地,基于注意力机制的卷积神经网络包括编码器和解码器,编码器用于基于注意力权重进行特征提取,解码器用于基于注意力权重进行特征重建。

9、可选地,利用基于注意力机制的卷积神经网络对第二数据集进行训练,得到第二词库,包括:利用编码器对第二数据集的词汇进行特征提取,得到特征向量矩阵;利用解码器对特征向量矩阵进行特征重建,得到构成第二词库的词汇。

10、根据本发明实施例的另一方面,还提供了一种车载语音系统语音识别装置,包括:

11、获取模块,用于获取目标词库,其中,目标词库基于对抗生成网络、目标神经网络和待训练词汇数据集生成,待训练词汇数据集为第一词汇、第二词汇和第三词汇的集合,第一词汇为车载语音系统初始词库中的词汇,第二词汇为从历史语音数据中提取的特征词汇,第三词汇为第一词汇和第二词汇的预测词汇;识别模块,用于采用目标词库对目标语音数据进行识别,得到识别结果,其中,目标语音数据用于进行车辆控制。

12、可选地,上述车载语音系统语音识别装置还包括:训练模块,用于获取初始词库和历史语音数据;利用对抗生成网络对第一词汇和第二词汇进行对抗训练,得到第三词汇;基于目标神经网络和待训练词汇数据集生成目标词库。

13、可选地,上述车载语音系统语音识别装置还包括:处理模块,用于对历史语音数据进行降噪处理,得到降噪后语音数据;对降噪后语音数据进行特征提取,得到第二词汇。

14、可选地,上述训练模块还用于:对抗生成网络包括生成器和判别器,生成器用于进行数据预测,判别器用于进行数据真实性判断,利用对抗生成网络对第一词汇和第二词汇进行对抗训练,得到第三词汇包括:利用生成器对第一词汇和第二词汇进行预测,得到预测词汇;将第二词汇和预测词汇进行混合,得到混合词汇;利用判别器判断混合词汇中任意一个词汇是否属于第二词汇,得到判断结果;根据判断结果确定判别器的判断成功率,其中,判断成功率用于评估预测词汇与第二词汇的拟合程度;响应于判断成功率小于预设值,将当前预测词汇作为第三词汇。

15、可选地,上述训练模块还用于:目标神经网络包括基础卷积神经网络和基于注意力机制的卷积神经网络,基于目标神经网络和待训练词汇数据集生成目标词库包括:将待训练词汇数据集划分为第一数据集和第二数据集;利用基础卷积神经网络对第一数据集进行训练,得到第一词库;利用基于注意力机制的卷积神经网络对第二数据集进行训练,得到第二词库;将第一词库与第二词库进行拼接,得到目标词库。

16、可选地,上述训练模块还用于:基于注意力机制的卷积神经网络包括编码器和解码器,编码器用于基于注意力权重进行特征提取,解码器用于基于注意力权重进行特征重建。

17、可选地,上述训练模块还用于:利用基于注意力机制的卷积神经网络对第二数据集进行训练,得到第二词库,包括:利用编码器对第二数据集的词汇进行特征提取,得到特征向量矩阵;利用解码器对特征向量矩阵进行特征重建,得到构成第二词库的词汇。

18、根据本发明实施例的又一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行前述任意一项车载语音系统语音识别方法。

19、根据本发明实施例的又一方面,还提供了一种车辆,包括车载存储器和车载处理器,车载存储器中存储有计算机程序,车载处理器被设置为运行计算机程序以执行前述任意一项的车载语音系统语音识别方法。

20、在本发明实施例中,首先获取基于对抗生成网络、目标神经网络和待训练词汇数据集生成的目标词库,其中,待训练词汇数据集为第一词汇、第二词汇和第三词汇的集合,第一词汇为车载语音系统初始词库中的词汇,第二词汇为从历史语音数据中提取的特征词汇,第三词汇为第一词汇和第二词汇的预测词汇,再采用目标词库对目标语音数据进行识别,得到识别结果,其中,目标语音数据用于进行车辆控制。通过利用对抗生成网络对待训练词汇数据集进行词汇扩充,再利用目标神经网络对待训练词汇数据集进行训练,得到个性化目标词库,达到了提升车载语音系统词库对于车辆用户的适应性的目的,从而实现了在提高目标词库对于目标语音数据的识别准确度的同时,提升目标词库与车辆用户的适应性的技术效果进而解决了现有的车载语音系统词库对于不同车辆用户的适应性差的技术问题。

本文地址:https://www.jishuxx.com/zhuanli/20240618/24119.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。