技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种语音质量评价方法和装置与流程  >  正文

一种语音质量评价方法和装置与流程

  • 国知局
  • 2024-06-21 11:58:29

本发明涉及人工智能,特别涉及一种语音质量评价方法和装置。

背景技术:

1、语音唤醒广泛的应用于家居电池类智能设备中,不唤醒时候,设备保持低电模式,唤醒时设备可以操作一些功耗较高的功能。考虑到鲁棒性、低误唤醒等目的,预定义的唤醒词较长,一般是三到四个汉字。唤醒率是衡量设备的唤醒系统鲁棒性的重要方面,除此之外,为了应对用户在实际中说出唤醒词的速度不同,需要用不同速率的唤醒词来对设备的唤醒系统做时长鲁棒性测试。

2、在智能设备实际使用的声学场景中,多半是有一定的环境噪声的,设备的唤醒系统如图1所示,一般包括一个用于对输入语音进行降噪处理的语音增强模块,再加上核心的唤醒模块。经语音增强模块处理的语音质量,会影响唤醒模块的唤醒成功率,因此,需要对经语音增强模块处理的语音质量进行评价,从而衡量语音增强算法是否能够满足降噪需求。

技术实现思路

1、有鉴于此,本发明的目的在于提供了一种语音质量评价方法和装置,本发明提供的语音质量评价方法,先执行语音对齐再利用语音质量评价系统进行质量评价,克服了语音质量评价系统在语音对齐方面的缺陷,可以提高其语音质量评价结果的准确性,进一步地,还可利用上述语音质量评价方法对唤醒系统中的语音增强模块进行评价,从而更为精准地确定唤醒系统所采用的语音增强算法是否能够满足降噪需求,以便指导后续操作,比如,语音增强算法不满足降噪需求,则可以用于使得后续操作根据需要来更换语音增强算法或者调整语音增强算法的参数。

2、为了达到上述目的,本发明提供了如下技术方案:

3、一种语音质量评价方法,包括:

4、获取干净语音、以及干净语音对应的带噪变速语音经待测试语音增强模块处理后得到的降噪变速语音;其中,干净语音对应的带噪变速语音是对干净语音进行变速不变调处理和加噪处理后得到的语音;

5、对干净语音和降噪变速语音进行语音对齐,得到干净语音和降噪变速语音之间的时间对齐信息;

6、将干净语音、降噪变速语音、以及干净语音和降噪变速语音之间的时间对齐信息输入语音质量评价系统,以使语音质量评价系统根据干净语音和降噪变速语音之间的时间对齐信息对干净语音和降噪变速语音进行对比,得到降噪变速语音的语音质量评分。

7、一种语音质量评价装置,包括:

8、语音获取单元,用于获取干净语音、以及干净语音对应的带噪变速语音经待测试语音增强模块处理后得到的降噪变速语音;其中,干净语音对应的带噪变速语音是对干净语音进行变速不变调处理和加噪处理后得到的语音;

9、语音对齐单元,用于对干净语音和降噪变速语音进行语音对齐,得到干净语音和降噪变速语音之间的时间对齐信息;

10、语音评分单元,用于将干净语音、降噪变速语音、以及干净语音和降噪变速语音之间的时间对齐信息输入语音质量评价系统,以使语音质量评价系统根据干净语音和降噪变速语音之间的时间对齐信息对干净语音和降噪变速语音进行对比,得到降噪变速语音的语音质量评分。

11、一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通过总线相连的存储器;所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序;所述至少一个处理器执行所述一个或多个计算机程序时实现上述语音质量评价方法中的步骤。

12、一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个计算机程序,所述一个或多个计算机程序被处理器执行时实现上述语音质量评价方法中的步骤。

13、由上面的技术方案可知,本发明提供的语音质量评价方法中,先将干净语音和降噪变速语音进行语音对齐,再将干净语音、降噪变速语音、及干净语音和降噪变速语音之间的时间对齐信息送入语音质量评价系统进行语音质量评价,可以克服语音质量评价系统在语音对齐方面的缺陷,因而能够有效提高语音质量评价结果的准确性。另外,还可利用本发明提供的语音质量评价方法对语音增强模块的降噪质量进行评分,以此作为对语音增强模块所采用的语音增强算法是否能够满足降噪需求的评价。

技术特征:

1.一种语音质量评价方法,其特征在于,该方法包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,

4.根据权利要求2所述的方法,其特征在于,

5.根据权利要求1所述的方法,其特征在于,

6.根据权利要求5所示的方法,其特征在于,

7.根据权利要求1所述的方法,其特征在于,

8.根据权利要求7所述的方法,其特征在于,

9.一种语音质量评价装置,其特征在于,该装置包括:

10.一种电子设备,包括:至少一个处理器,以及与所述至少一个处理器通过总线相连的存储器;所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序;其特征在于,所述至少一个处理器执行所述一个或多个计算机程序时实现权利要求1-8中任一权项所述的方法中的步骤。

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储一个或多个计算机程序,所述一个或多个计算机程序被处理器执行时实现权利要求1-8中任一权项所述的方法中的步骤。

技术总结本发明提供了一种语音质量评价方法和装置,本发明提供的语音质量评价方法中,先对干净语音和干净语音对应的带噪变速语音经待测试语音增强模块处理后得到的降噪变速语音进行语音对齐,得到干净语音和降噪变速语音之间的时间对齐信息;再将干净语音、降噪变速语音、以及干净语音和降噪变速语音之间的时间对齐信息输入语音质量评价系统进行语音质量评价,使得语音质量评价系统可以克服其在语音对齐方面的缺陷,因而能够有效提高语音质量评价结果的准确性。本发明还利用上述语音质量评价方法对唤醒系统中的语音增强模块进行评价以确定其所采用的语音增强算法是否能够满足降噪需求。技术研发人员:袁斌,艾国,杨作兴受保护的技术使用者:深圳比特微电子科技有限公司技术研发日:技术公布日:2024/6/13

本文地址:https://www.jishuxx.com/zhuanli/20240618/24817.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。