技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音去噪方法、装置、计算机设备及存储介质与流程  >  正文

语音去噪方法、装置、计算机设备及存储介质与流程

  • 国知局
  • 2024-06-21 10:44:25

本申请实施例涉及语音信号处理,特别涉及一种语音去噪方法、装置、计算机设备及存储介质。

背景技术:

1、现实生活中,语音信号一般都带有噪声,在进一步进行信号处理(如语音识别,语音编码)之前,为了确保信号处理的准确性,往往要对语音信号进行降噪。比如,在对一段语音进行语音转文本识别之前,如果语音中携带有噪声,影响识别结果的准确性。

2、目前常用的语音去噪技术是语音增强方法,比如自适应滤波,谱减法,维纳滤波法等等。但是语音增强算法的去噪效果受到带噪语音信号的信噪比的影响,并且对实时率要求较高,随着信噪比的减小,降噪方法处理的效果也随之变差,语音信号的增强效果也随之变差。因此,如何提高带噪语音的降噪效果,尤其是针对低信噪比的带噪语音,成为当今语音信号处理领域研究的热点问题之一。

技术实现思路

1、本申请实施例提供了一种语音去噪方法、装置、计算机设备及存储介质,可以提高获取带噪语音的去噪效果,提升语音信号增强能力。该技术方案如下:

2、一方面,提供了一种语音去噪方法,所述方法包括:

3、获取带噪语音信号,并对所述带噪语音信号进行变换处理,得到所述带噪语音信号的时频谱;其中,所述时频谱中包含实部信息和虚部信息;

4、通过语音信号增强模型中级联的n个特征图提取模块依次对所述时频谱进行特征图提取,得到与所述n个特征图提取模块一一对应的n个中间处理结果,n为正整数;

5、基于通道权重机制对所述n个中间处理结果进行整合处理,并对整合处理的结果进行逆变换得到去噪语音信号。

6、另一方面,提供了一种语音去噪装置,所述装置包括:

7、获取模块,用于获取带噪语音信号,并对所述带噪语音信号进行变换处理,得到所述带噪语音信号的时频谱;所述时频谱中包含实部信息和虚部信息;

8、所述获取模块,用于通过语音信号增强模型中的级联的n个特征图提取模块依次对所述时频谱进行特征图提取,得到与所述n个特征图提取模块一一对应的n个中间处理结果,n为正整数;

9、整合处理模块,用于基于通道权重机制对所述n个中间处理结果进行整合处理,并对整合处理的结果进行逆变换得到去噪语音信号。

10、另一方面,提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现上述的语音去噪方法。

11、另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述的语音去噪方法。

12、另一方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述各种可选实现方式中提供的语音去噪方法。

13、本申请提供的技术方案可以包括以下有益效果:

14、本申请实施例提供的语音去噪方法,通过对带噪语音信号进行变换,获得带噪语音信号的时频谱,该时频谱中包含实部信息和虚部信息;将该时频谱输入到包含有级联的n个特征图提取模块的语音信号增强模型中,通过级联的n个特征提取模块依次对时频谱进行特征图提取以得到与n个特征图提取模块一一对应的n个中间处理结果,之后基于通道权重机制对n个中间处理结果进行整合处理,基于整合处理的结果进行逆变换得到去噪语音信号。在上述语音去噪方法中,时谱图中包含了实部信息和虚部信息,采用语音信号增强模型对时谱图进行处理实质是对时谱图中实部信息和虚部信息进行处理。需要说明的是,带噪语音信号和去噪语音信号在时谱图上的差异是可以在对应的实部信息和虚部信息体现的。因此,本申请的语音去噪方法的主要构思是将时域语音去噪问题转换为对频域中实部信息和虚部信息的处理问题(也即对时谱图的处理),如此可以降低现有语音增强算法中对实时性的要求。并且,在频域中对实部信息和虚部信息进行处理时,通过语音信号增强模型对频域中时谱图进行多维度的特征处理,实现了综合多维度特征进行干净语音信号模拟,确保了干净语音信号模拟的准确性,最后将频域的处理结果转换回时域便得到去噪语音信号,提高了语音去噪效果。可见,本申请的语音去噪方法在降低对实时性要求的同时,提高语音去噪的效果,在一定程度上提升了语音信号增强能力。

15、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

技术特征:

1.一种语音去噪方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述语音信号增强模型包括n个解码模块,所述n个解码模块与所述n个特征图提取模块一一对应;

3.根据权利要求2所述的方法,其特征在于,每个特征图提取模块包括卷积层以及第一卷积调制层;所述n个特征图提取模块中包括目标特征图提取模块,所述目标特征图提取模块是级联的n个特征图提取模块中的任意一个;所述通过所述语音信号增强模型中级联的n个特征图提取模块依次对所述时频谱进行特征图提取,获得n个层级特征图,包括:

4.根据权利要求3所述的方法,其特征在于,每个特征图提取模块中的卷积调制层包括调制路径和被调制路径;所述通过所述目标特征图提取模块中的第一卷积调制层对所述目标特征图提取模块的初始特征图进行卷积调制,获得所述目标特征提取模块对应的层级特征图,包括:

5.根据权利要求3所述的方法,其特征在于,每个解码模块包括解码层以及第二卷积调制层;所述通过各个特征图提取模块对应述解码模块对相应的层级特征图进行解码还原,获得n个中间处理结果,包括:

6.根据权利要求1所述的方法,其特征在于,所述语音信号增强模型包括整合模块;所述基于通道权重机制对所述n个中间处理结果进行整合处理,包括:

7.根据权利要求1所述的方法,其特征在于,所述通过语音信号增强模型中级联的n个特征图提取模块依次对所述时频谱进行特征图提取,得到与所述n个特征图提取模块一一对应的n个中间处理结果,包括:

8.一种语音去噪装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现如权利要求1至7任一所述的语音去噪方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至7任一所述的语音去噪方法。

技术总结本申请涉及一种语音去噪方法、装置、计算机设备及存储介质,涉及语音信号处理技术领域。该方法包括:获取带噪语音信号,并对带噪语音信号进行变换处理,得到带噪语音信号的时频谱;其中,该时频谱中包含实部信息和虚部信息;通过语音信号增强模型中级联的N个特征图提取模块依次对时频谱进行特征图提取,得到与N个特征图提取模块一一对应的N个中间处理结果,N为正整数;基于通道权重机制对N个中间处理结果进行整合处理,并对整合处理的结果进行逆变换得到去噪语音信号。通过上述方法,可以提高去噪的效果,提升语音信号增强能力。技术研发人员:熊雪军,蒋宁,陆全,刘敏,吴海英受保护的技术使用者:马上消费金融股份有限公司技术研发日:技术公布日:2024/2/6

本文地址:https://www.jishuxx.com/zhuanli/20240618/21467.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。