技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音降噪方法、装置、电子设备及存储介质与流程 > 正文

语音降噪方法、装置、电子设备及存储介质与流程

国知局
2024-06-21 11:45:23

本申请涉及音频处理，尤其涉及一种语音降噪方法、装置、电子设备及存储介质。

背景技术：

1、语音信号在传输和记录过程中，常常会受到环境噪声、设备噪声等多种因素的影响，导致语音质量下降，影响人们的正常使用。因此，需要通过对语音信号进行降噪处理，来提升语音质量。

2、现阶段，对语音进行降噪处理通常采用基于谱估计的降噪方法，通过减去语音信号的频谱估计，降低噪声的影响，例如，谱减法、自适应谱减法、变分谱减法等。但是，这种方式的降噪效果较差，对于复杂的噪声环境，难以达到较为理想的效果。

技术实现思路

1、基于上述需求，本申请提出一种语音降噪方法、装置、电子设备及存储介质，能够提高语音降噪的准确度，进而提高语音降噪效果。

2、为实现上述目的，本申请提出如下技术方案：

3、根据本申请实施例的第一方面，提供了一种语音降噪方法，包括：

4、获取待降噪语音对应的语音特征，所述语音特征包括波形特征和语谱图特征；

5、利用预先确定的语音降噪参数，对所述语音特征进行降噪处理，得到降噪语音信号；

6、其中，所述语音降噪参数，是利用预先采集的样本噪声语音的样本语音特征，进行降噪处理训练而确定的，所述样本语音特征包括所述样本噪声语音的波形特征和语谱图特征。

7、可选的，获取待降噪语音对应的语音特征，包括：

8、基于待降噪语音的波形信号，提取所述待降噪语音的波形特征，所述波形特征包括：能量特征和/或频谱特征；

9、基于所述待降噪语音的波形信号，确定所述待降噪语音的语谱图，并获取所述语谱图的语谱图特征；

10、将所述波形特征和所述语谱图特征进行特征融合，得到语音特征。

11、可选的，获取所述语谱图的语谱图特征，包括：

12、对所述语谱图进行图像降噪处理，得到降噪语谱图；

13、对所述降噪语谱图进行图像特征提取，得到语谱图特征。

14、可选的，利用预先确定的语音降噪参数，对所述语音特征进行降噪处理，得到降噪语音信号，包括：

15、利用预先训练的语音降噪模型，对所述语音特征进行降噪处理，得到降噪语音信号；

16、所述语音降噪模型用于按照所述语音降噪参数对输入的特征进行降噪处理。

17、可选的，所述语音降噪模型是通过语音判别训练而得到的，其中，所述语音判别训练，以使所述语音降噪模型对样本噪声语音的样本语音特征降噪处理后，无法准确判别得到的样本降噪语音的语音类型，为目标；

18、其中，所述语音类型包括：降噪语音和无噪语音；所述无噪语音类型的样本降噪语音，与所述样本噪声语音之间的相似度不小于预设阈值。

19、可选的，所述语音降噪模型的训练过程，包括：

20、将第一样本噪声语音的第一样本语音特征输入到所述语音降噪模型中，得到所述第一样本噪声语音对应的第一样本降噪语音；

21、将所述第一样本降噪语音输入到预设的判别器中，得到所述第一样本降噪语音的第一语音类型；

22、以所述第一语音类型与所述第一样本降噪语音的真实语音类型不同为目标，对所述语音降噪模型进行参数调整，得到训练后的语音降噪模型。

23、可选的，所述判别器的训练过程包括：

24、将第二样本语音输入到预设的判别器中，得到所述第二样本降噪语音的第二语音类型；所述第二样本语音包括降噪语音和无噪语音；

25、以所述第二语音类型与所述第二样本语音的真实语音类型相同为目标，对所述判别器的参数进行调整，得到训练后的判别器。

26、可选的，获取待降噪语音对应的语音特征之前，还包括：

27、对采集的初始语音进行语音无效信息清洗，得到第一语音信号；

28、对所述第一语音信号进行信号标准化处理，得到待降噪语音。

29、根据本申请实施例的第二方面，提供了一种语音降噪装置，包括：

30、特征获取模块，用于获取待降噪语音对应的语音特征，所述语音特征包括：波形特征和语谱图特征；

31、降噪处理模块，用于利用预先确定的语音降噪参数，对所述语音特征进行降噪处理，得到降噪语音信号；

32、其中，所述语音降噪参数，是利用预先采集的样本噪声语音的样本语音特征，进行降噪处理训练而确定的，所述样本语音特征包括所述样本噪声语音的波形特征和语谱图特征。

33、根据本申请实施例的第三方面，提供了一种电子设备，包括：存储器和处理器；

34、所述存储器与所述处理器连接，用于存储程序；

35、所述处理器，用于通过运行所述存储器中的程序，实现上述语音降噪方法。

36、根据本申请实施例的第四方面，提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现上述语音降噪方法。

37、本申请提出的语音降噪方法，获取待降噪语音对应的语音特征，语音特征包括波形特征和语谱图特征；利用预先确定的语音降噪参数，对语音特征进行降噪处理，得到降噪语音信号；其中，语音降噪参数，是利用预先采集的样本噪声语音的样本语音特征，进行降噪处理训练而确定的，样本语音特征包括样本噪声语音的波形特征和语谱图特征。采用本申请的技术方案，利用样本噪声语音的波形特征和语谱图特征对语音降噪参数进行训练，实现了在语音的时域和频域上结合降噪训练，提高了语音降噪参数的降噪准确度，从而提高了利用语音降噪参数进行降噪处理时，语音的降噪效果。

技术特征：

1.一种语音降噪方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，获取待降噪语音对应的语音特征，包括：

3.根据权利要求2所述的方法，其特征在于，获取所述语谱图的语谱图特征，包括：

4.根据权利要求1所述的方法，其特征在于，利用预先确定的语音降噪参数，对所述语音特征进行降噪处理，得到降噪语音信号，包括：

5.根据权利要求4所述的方法，其特征在于，所述语音降噪模型是通过语音判别训练而得到的，其中，所述语音判别训练，以使所述语音降噪模型对样本噪声语音的样本语音特征降噪处理后，无法准确判别得到的样本降噪语音的语音类型，为目标；

6.根据权利要求5所述的方法，其特征在于，所述语音降噪模型的训练过程，包括：

7.根据权利要求6所述的方法，其特征在于，所述判别器的训练过程包括：

8.根据权利要求1所述的方法，其特征在于，获取待降噪语音对应的语音特征之前，还包括：

9.一种语音降噪装置，其特征在于，包括：

10.一种电子设备，其特征在于，包括：存储器和处理器；

11.一种存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现如权利要求1至8中任意一项所述的语音降噪方法。

技术总结本申请提出一种语音降噪方法、装置、电子设备及存储介质，该方法获取待降噪语音对应的语音特征，语音特征包括波形特征和语谱图特征；利用预先确定的语音降噪参数，对语音特征进行降噪处理，得到降噪语音信号；其中，语音降噪参数，是利用预先采集的样本噪声语音的样本语音特征，进行降噪处理训练而确定的，样本语音特征包括样本噪声语音的波形特征和语谱图特征。采用本申请的技术方案，利用样本噪声语音的波形特征和语谱图特征对语音降噪参数进行训练，实现了在语音的时域和频域上结合降噪训练，提高了语音降噪参数的降噪准确度，从而提高了利用语音降噪参数进行降噪处理时，语音的降噪效果。技术研发人员：许乾坤,马峰,高建清,管青松,史明春,张子洋,李欣受保护的技术使用者：科大讯飞股份有限公司技术研发日：技术公布日：2024/4/22