基于云端协同的车载语音识别方法、系统、设备及介质与流程
- 国知局
- 2024-06-21 11:47:35
本技术涉及语音识别,尤其是基于云端协同的车载语音识别方法、系统、设备及存储介质。
背景技术:
1、当前,随着信息技术的发展,越来越多的应用被开发出来,给人们的工作生活带来了不少便捷的服务。例如,在汽车领域,存在有车载语音识别的应用,车载语音识别是指将语音识别技术应用于汽车领域,实现车辆内部的语音交互和控制。具体地,比如说车载语音识别可以实现语音导航功能,驾驶员可以通过语音指令告诉车辆目的地,而无需手动操作导航系统。这样可以提高驾驶员的安全性,减少分散注意力带来的风险。
2、相关技术中,语音识别一般基于人工智能领域的语音识别模型来实现。该语音识别模型可以配置到汽车的本地,或者通过云服务器来提供语音识别功能。在实际应用中发现,基于汽车本地配置的语音识别模型往往受限于存储压力,功能较为简略,准确度存在较低的问题;而通过云服务器来提供语音识别功能,需要和云服务器进行网络交互,可能存在较大的延时,难以提供较为稳定的语音识别服务。
3、综上,相关技术存在的问题亟需得到解决。
技术实现思路
1、本技术的目的在于至少一定程度上解决相关技术中存在的技术问题之一。
2、为此,本技术实施例的一个目的在于提供基于云端协同的车载语音识别方法、系统、设备及存储介质。
3、为了达到上述技术目的,本技术实施例所采取的技术方案包括:
4、一方面,本技术实施例提供了基于云端协同的车载语音识别方法,所述方法包括:
5、从云服务器获取并配置目标语音识别模型;
6、响应于用户的交互指令,采集所述用户的原始语音数据;
7、对所述原始语音数据进行降噪处理,得到目标语音数据;
8、检测车载网络的质量信息,根据所述质量信息和车载应用的语音识别性能需求信息,判断所述车载网络是否满足所述车载应用的语音识别的性能需求;
9、若车载网络不满足所述车载应用的语音识别的性能需求,通过所述目标语音识别模型对所述目标语音数据进行识别,得到语音识别结果;或者,若车载网络满足所述车载应用的语音识别的性能需求,将所述目标语音数据发送到所述云服务器进行识别,并接收所述云服务器返回的语音识别结果。
10、另外,根据本技术上述实施例的基于云端协同的车载语音识别方法,还可以具有以下附加的技术特征:
11、进一步地,在本技术的一个实施例中,所述目标语音识别模型通过以下步骤得到:
12、预训练语音识别模型;
13、获取车载应用领域的小样本训练数据;
14、通过所述小样本训练数据,基于帧级标签分配和字符级别分布匹配对预训练的语音识别模型进行迁移学习,得到所述目标语音识别模型。
15、进一步地,在本技术的一个实施例中,所述方法还包括:
16、通过模型蒸馏算法,对所述目标语音识别模型进行模型压缩。
17、进一步地,在本技术的一个实施例中,所述对所述原始语音数据进行降噪处理,得到目标语音数据,包括:
18、对所述原始语音数据进行主成分分析,得到所述原始语音数据对应的主成分特征值矩阵;
19、根据所述主成分特征值矩阵,对所述原始语音数据进行降噪处理,得到目标语音数据。
20、进一步地,在本技术的一个实施例中,所述方法还包括:
21、检测所述原始语音数据的信噪比;
22、若所述信噪比小于或者等于预设的比例阈值,将所述目标语音数据发送到所述云服务器进行识别,并接收所述云服务器返回的语音识别结果。
23、进一步地,在本技术的一个实施例中,所述语音识别性能需求信息,通过以下步骤得到:
24、检测当前使用语音识别功能的车载应用的应用类型;
25、根据所述应用类型,确定语音识别性能需求信息。
26、进一步地,在本技术的一个实施例中,所述根据所述质量信息和车载应用的语音识别性能需求信息,判断所述车载网络是否满足所述车载应用的语音识别的性能需求,包括:
27、根据所述目标语音数据的数据大小,确定数据发送时延;
28、根据所述质量信息,确定网络传播时延;
29、根据所述数据发送时延、所述网络传播时延和所述云服务器的语音识别处理时延,确定第一时延;
30、根据所述语音识别性能需求信息,确定时延阈值;
31、若所述第一时延小于或者等于所述时延阈值,确定所述车载网络满足所述车载应用的语音识别的性能需求。
32、另一方面,本技术实施例提供基于云端协同的车载语音识别系统,所述系统包括:
33、获取单元,用于从云服务器获取并配置目标语音识别模型;
34、采集单元,用于响应于用户的交互指令,采集所述用户的原始语音数据;
35、处理单元,用于对所述原始语音数据进行降噪处理,得到目标语音数据;
36、检测单元,用于检测车载网络的质量信息,根据所述质量信息和车载应用的语音识别性能需求信息,判断所述车载网络是否满足所述车载应用的语音识别的性能需求;
37、识别单元,用于若车载网络不满足所述车载应用的语音识别的性能需求,通过所述目标语音识别模型对所述目标语音数据进行识别,得到语音识别结果;或者,若车载网络满足所述车载应用的语音识别的性能需求,将所述目标语音数据发送到所述云服务器进行识别,并接收所述云服务器返回的语音识别结果。
38、另一方面,本技术实施例提供了一种电子设备,包括:
39、至少一个处理器;
40、至少一个存储器,用于存储至少一个程序;
41、当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现上述的基于云端协同的车载语音识别方法。
42、另一方面,本技术实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,上述处理器可执行的程序在由处理器执行时用于实现上述的基于云端协同的车载语音识别方法。
43、本技术的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到:
44、本技术实施例所公开的基于云端协同的车载语音识别方法、系统、设备及存储介质,从云服务器获取并配置目标语音识别模型;响应于用户的交互指令,采集所述用户的原始语音数据;对所述原始语音数据进行降噪处理,得到目标语音数据;检测车载网络的质量信息,根据所述质量信息和车载应用的语音识别性能需求信息,判断所述车载网络是否满足车载应用的语音识别的性能需求;若车载网络不满足语音识别的性能需求,通过所述目标语音识别模型对所述目标语音数据进行识别,得到语音识别结果;或者,若车载网络满足语音识别的性能需求,将所述目标语音数据发送到所述云服务器进行识别,并接收所述云服务器返回的语音识别结果。该方法能够自动根据车载应用对语音识别性能的需求,结合当前车载网络的质量来判别在汽车本地进行语音识别或者在云服务器中进行语音识别,有利于提高语音识别的准确度和效率,尽可能保障语音识别的可靠性与可用性,降低语音识别服务的延时,从而改善用户的使用体验。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23592.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。