技术新讯 > 乐器声学设备的制造及制作,分析技术 > 电子设备及电子设备的语音信号处理方法与流程 > 正文

电子设备及电子设备的语音信号处理方法与流程

国知局
2024-06-21 11:41:34

本公开涉及语音信号处理，尤其涉及一种电子设备及电子设备的语音信号处理方法。

背景技术：

1、目前，语音增强算法通过将带有噪语音信号在频域上进行映射；之后，在频域上进行噪声的判别和降噪，最终将降噪结果逆运算至时域，以重新构建干净语音信号。目前，通过谱减法，以将噪声从嘈杂的语音频谱中减去。但是谱减法适用于噪声比较平稳，且语音信号与噪声不相关的信号。对于带噪语音学信号中噪声和语音音频混叠的部分，通过谱减法不仅难以去除噪声且容易导致语音失真。

技术实现思路

1、为了解决上述技术问题，本公开提供了一种电子设备及电子设备的语音信号处理方法，能够基于训练后的噪声预测模型和多段参考信号，对待处理语音信号进行降噪处理，提高降噪处理的精确度，从而提高降噪效果，使得不易引入失真。

2、本公开的技术方案如下：

3、第一方面，本公开提供一种电子设备，包括：

4、通信器，被配置为接收用户输入的待处理语音信号；

5、控制器，与所述通信器耦接，且被配置为：

6、在所述待处理语音信号包括语音信号和噪声信号，且所述语音信号和所述噪声信号的音频至少部分重叠的情况下，基于第一预设信号长度，从所述待处理语音信号中截取多段参考信号；

7、基于训练后的噪声预测模型和所述多段参考信号，对所述待处理语音信号进行处理，得到目标语音信号。

8、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述多段参考信号中相邻两段参考信号的部分音频相同，且所述相邻两段参考信号音频相同的长度小于第二预设信号长度；所述第二预设信号长度小于所述第一预设信号长度。

9、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述控制器，具体被配置为：

10、基于所述训练后的噪声预测模型，得到预测的噪声参数；

11、基于所述多段参考信号，对所述预测的噪声参数进行修正，得到修正后的噪声参数；

12、基于所述修正后的噪声参数，对所述待处理语音信号进行去噪处理，得到所述目标语音信号。

13、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述控制器，具体被配置为：

14、基于所述预测的噪声参数中的预测均值、所述参考信号以及参考信号中语音信号和噪声信号的比值，得到所述修正后的噪声参数中的目标均值；

15、基于所述预测的噪声参数中的预测标准差以及参考信号中语音信号和噪声信号的比值，得到所述修正后的噪声参数中的目标标准差。

16、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述目标均值通过如下公式得到：

17、

18、其中，表示所述目标均值；γt表示所述参考信号中语音信号和噪声信号的比值；μθ(xtt)表示所述预测均值；表示超参数。

19、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述目标标准差通过如下公式得到：

20、

21、其中，表示所述目标标准差；γt表示所述参考信号中语音信号和噪声信号的比值；σt表示所述预测标准差；表示超参数。

22、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述控制器，具体被配置为：

23、基于所述目标均值和所述目标标准差，得到所述待处理语音信号对应的目标噪声信号；

24、基于所述目标噪声信号对所述待处理语音信号进行去噪处理，得到所述目标语音信号。

25、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述控制器，具体被配置为：

26、基于所述目标噪声信号，对所述待处理语音信号中的所述噪声信号进行去除，得到多段子目标语音信号；所述多段子目标语音信号包括去除所述噪声信号后的参考信号，和/或，所述待处理语音信号中未与所述噪声信号的音频重叠的语音信号；

27、对所述多段子目标语音信号中相邻两段子目标语音信号音频重叠部分进行去除，并拼接去除音频重叠部分后的多段子目标语音信号，得到所述目标语音信号。

28、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述控制器，还被配置为：

29、构建去噪扩散概率模型，基于所述去噪扩散概率模型得到第一高斯随机噪声；

30、基于所述第一高斯随机噪声和语音样本信号，得到服从标准正态分布的噪声样本信号；

31、基于所述去噪扩散概率模型，对所述噪声样本信号进行采样，得到所述噪声样本信号对应的噪声样本参数，并对所述噪声样本参数进行拟合，得到噪声预测模型；

32、基于所述噪声预测模型，得到预测噪声信号，确定所述预测噪声信号和所述第一高斯随机噪声之间的损失值，并基于所述损失值对所述噪声预测模型进行梯度更新，得到更新后的噪声预测模型；

33、基于更新后的噪声预测模型和所述噪声样本信号，确定所述训练后的噪声预测模型。

34、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述控制器，具体被配置为：

35、将所述第一高斯随机噪声输入至所述语音样本信号中，以得到服从标准正态分布的噪声样本信号。

36、结合第一方面和上述可能的实现方式，在另一种可能的实现方式中，所述控制器，具体被配置为：

37、基于更新后的噪声预测模型，得到第二高斯随机噪声；

38、在预设步数之内，基于所述第二高斯随机噪声对所述带噪语音样本信号进行去噪处理；若得到所述语音样本信号，则确定所述更新后的噪声预测模型为所述训练后的噪声预测模型。

39、第二方面，本公开提供一种电子设备的语音信号处理方法，方法包括：

40、接收用户输入的待处理语音信号；

41、在所述待处理语音信号包括语音信号和噪声信号，且所述语音信号和所述噪声信号的音频至少部分重叠的情况下，基于第一预设信号长度，从所述待处理语音信号中截取多段参考信号；

42、基于训练后的噪声预测模型和所述多段参考信号，对所述待处理语音信号进行处理，得到目标语音信号。

43、结合第二方面和上述可能的实现方式，在另一种可能的实现方式中，所述多段参考信号中相邻两段参考信号的部分音频相同，且所述相邻两段参考信号音频相同的长度小于第二预设信号长度；所述第二预设信号长度小于所述第一预设信号长度。

44、结合第二方面和上述可能的实现方式，在另一种可能的实现方式中，所述基于训练后的噪声预测模型和所述多段参考信号，对所述待处理语音信号进行处理，得到目标语音信号，包括：

45、基于所述训练后的噪声预测模型，得到预测的噪声参数；

46、基于所述多段参考信号，对所述预测的噪声参数进行修正，得到修正后的噪声参数；

47、基于所述修正后的噪声参数，对所述待处理语音信号进行去噪处理，得到所述目标语音信号。

48、结合第二方面和上述可能的实现方式，在另一种可能的实现方式中，所述基于所述多段参考信号，对所述预测的噪声参数进行修正，得到修正后的噪声参数，包括：

49、基于所述预测的噪声参数中的预测均值、所述参考信号以及参考信号中语音信号和噪声信号的比值，得到所述修正后的噪声参数中的目标均值；

50、基于所述预测的噪声参数中的预测标准差、所述参考信号以及参考信号中语音信号和噪声信号的比值，得到所述修正后的噪声参数中的目标标准差。

51、结合第二方面和上述可能的实现方式，在另一种可能的实现方式中，所述基于所述修正后的噪声参数，对所述待处理语音信号进行去噪处理，得到所述目标语音信号，包括：

52、基于所述目标均值和所述目标标准差，得到所述待处理语音信号对应的目标噪声信号；

53、基于所述目标噪声信号对所述待处理语音信号进行去噪处理，得到所述目标语音信号。

54、结合第二方面和上述可能的实现方式，在另一种可能的实现方式中，所述基于所述目标噪声信号对所述待处理语音信号进行去噪处理，得到所述目标语音信号，包括：

55、基于所述目标噪声信号，对所述待处理语音信号中的所述噪声信号进行去除，得到多段子目标语音信号；所述多段子目标语音信号包括去除所述噪声信号后的参考信号，和/或，所述待处理语音信号中未与所述噪声信号的音频重叠的语音信号；

56、对所述多段子目标语音信号中相邻两段子目标语音信号音频重叠部分进行去除，并拼接去除音频重叠部分后的多段子目标语音信号，得到所述目标语音信号。

57、结合第二方面和上述可能的实现方式，在另一种可能的实现方式中，所述方法还包括：

58、构建去噪扩散概率模型，基于所述去噪扩散概率模型得到第一高斯随机噪声；

59、基于所述第一高斯随机噪声和语音样本信号，得到服从标准正态分布的噪声样本信号；

60、基于所述去噪扩散概率模型，对所述噪声样本信号进行采样，得到所述噪声样本信号对应的噪声样本参数，并对所述噪声样本参数进行拟合，得到噪声预测模型；

61、基于所述噪声预测模型，得到预测噪声信号，确定所述预测噪声信号和所述第一高斯随机噪声之间的损失值，并基于所述损失值对所述噪声预测模型进行梯度更新，得到更新后的噪声预测模型；

62、基于更新后的噪声预测模型和所述噪声样本信号，确定所述训练后的噪声预测模型。

63、第三方面，本公开提供一种电子设备，包括：存储器和处理器，存储器用于存储计算机程序；处理器用于在执行计算机程序时，使得电子设备实现如第一方面提供的任一项的电子设备的语音信号处理方法。

64、第四方面，本发明提供一种计算机可读存储介质，包括：计算机可读存储介质上存储计算机程序，计算机程序被处理器执行如第一方面提供的任一项的电子设备的语音信号处理方法。

65、第五方面，本发明提供一种计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行如第一方面提供的任一项的电子设备的语音信号处理方法。

66、本技术实施例提供一种电子设备及电子设备的语音信号处理方法，其中，电子设备的语音信号处理方法包括：接收用户输入的待处理语音信号；在所述待处理语音信号包括语音信号和噪声信号，且所述语音信号和所述噪声信号的音频至少部分重叠的情况下，基于第一预设信号长度，从所述待处理语音信号中截取多段参考信号；基于训练后的噪声预测模型和所述多段参考信号，对所述待处理语音信号进行处理，得到目标语音信号；如此，对待处理语音信号进行处理时，以参考信号作为数据支撑，能够提高从待处理语音信号中去除的噪声信号的精确度，从而提高降噪效果，使得不易引入失真。