技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音降噪方法、处理终端及存储介质与流程  >  正文

语音降噪方法、处理终端及存储介质与流程

  • 国知局
  • 2024-06-21 11:30:09

本发明涉及语音处理,尤其涉及一种语音降噪方法、处理终端及存储介质。

背景技术:

1、由于环境中存在大量的噪音,电子设备在采集语音信号的过程中不可避免的会同时采集得到噪音信号,从而使得语音信号受噪音污染,不纯净。因此,需要对采集得到的语音信号进行去噪,提取出纯净的语音信号。

2、现有技术中,基于神经网络模型自学习的特性,可采用神经网络模型自适应地学习不同类型和程度的噪声,从而对语音信号进行去噪。但由于神经网络模型对于复杂和高维度的数据结构不够灵活,导致其用于对语音信号去噪时计算复杂,准确度不够高。

技术实现思路

1、本发明实施例提供了一种语音降噪方法、处理终端及存储介质,以解采用神经网络模型对语音信号去噪,计算量大,准确率不够高的问题。

2、第一方面,本发明实施例提供了一种语音降噪方法,包括:

3、对当前帧语音数据进行傅里叶变换,得到傅里叶变换频谱;

4、将傅里叶变换频谱输入神经网络模型进行噪声估计得到噪声谱,并根据噪声谱确定各频点的增益系数;

5、根据各个频点的增益系数乘以傅里叶变换频谱,得到降噪后的频谱;

6、对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据。

7、可选的,根据噪声谱确定各频点的增益系数,包括:

8、根据噪声谱,确定各频点的先验信噪比和后验信噪比;

9、根据各频点的先验信噪比和后验信噪比,确定各频点的增益系数。

10、可选的,根据各频点的先验信噪比和后验信噪比,确定各频点的增益系数,包括:

11、根据各频点的先验信噪比和后验信噪比,确定各频点语音存在时的条件增益;

12、根据各频点的先验信噪比和后验信噪比,确定各频点语音存在的概率;

13、根据各频点语音存在时的条件增益及各频点语音存在时的条件增益,确定各频点的增益系数。

14、可选的,根据各频点的先验信噪比和后验信噪比,确定各频点语音存在的概率,包括:

15、根据各频点的先验信噪比进行决策,确定各频点语音缺失的概率;

16、根据各频点语音缺失的概率、各频点的先验信噪比和后验信噪比,确定各频点语音存在的概率。

17、可选的,当前帧语音数据的点数为2n;当前帧语音数据中的前n个点的数据与上一帧语音数据中的后n个点的数据重合;在对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据之后,方法还包括:

18、将上一帧降噪后的语音数据中的后n个点的语音数据,与当前帧降噪后的语音数据中的前n个点的语音数据平均,得到该n个点降噪后的语音数据。

19、可选的,在对当前帧语音数据进行傅里叶变换,得到傅里叶变换频谱之前,上述方法还可以包括:

20、对待检测语音数据进行加窗,得到当前帧语音数据。

21、可选的,当前帧语音数据的点数为2n;当前帧语音数据中的前n个点的数据与上一帧语音数据中的后n个点的数据重合;在对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据之后,上述方法还包括:

22、将上一帧降噪后的语音数据中的后n个点的语音数据,与当前帧降噪后的语音数据中的前n个点的语音数据相加,得到该n个点降噪后的语音数据。

23、可选的,神经网络模型为gru模型、lstm模型、cnn模型或dnn模型。

24、第二方面,本发明实施例提供了一种处理终端,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式提供的语音降噪方法的步骤。

25、第三方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式提供的语音降噪方法的步骤。

26、本发明实施例提供一种语音降噪方法、处理终端及存储介质。该方法包括:对当前帧语音数据进行傅里叶变换,得到傅里叶变换频谱;将傅里叶变换频谱输入神经网络模型进行噪声估计得到噪声谱,并根据噪声谱确定各频点的增益系数;根据各个频点的增益系数乘以傅里叶变换频谱,得到降噪后的频谱;对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据。本发明实施例中不直接利用神经网络模型进行噪声去除,而仅采用神经网络计算噪声谱,进而根据噪声谱对语音数据进行降噪,降低了计算复杂度,同时对平稳噪声和非平稳噪声均可进行更准确的估计,准确率高。

技术特征:

1.一种语音降噪方法,其特征在于,包括:

2.根据权利要求1所述的语音降噪方法,其特征在于,所述根据所述噪声谱确定各频点的增益系数,包括:

3.根据权利要求2所述的语音降噪方法,其特征在于,所述根据各频点的先验信噪比和后验信噪比,确定各频点的增益系数,包括:

4.根据权利要求3所述的语音降噪方法,其特征在于,所述根据各频点的先验信噪比和后验信噪比,确定各频点语音存在的概率,包括:

5.根据权利要求4所述的语音降噪方法,其特征在于,所述当前帧语音数据的点数为2n;所述当前帧语音数据中的前n个点的数据与上一帧语音数据中的后n个点的数据重合;在所述对所述降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据之后,所述方法还包括:

6.根据权利要求4所述的语音降噪方法,其特征在于,在所述对当前帧语音数据进行傅里叶变换,得到傅里叶变换频谱之前,所述方法还包括:

7.根据权利要求6所述的语音降噪方法,其特征在于,所述当前帧语音数据的点数为2n;所述当前帧语音数据中的前n个点的数据与上一帧语音数据中的后n个点的数据重合;在所述对所述降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据之后,所述方法还包括:

8.根据权利要求1至7任一项所述的语音降噪方法,其特征在于,所述神经网络模型为gru模型、lstm模型、cnn模型或dnn模型。

9.一种处理终端,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如权利要求1至8中任一项所述的语音降噪方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至8中任一项所述语音降噪方法的步骤。

技术总结本发明提供一种语音降噪方法、处理终端及存储介质。该方法包括:对当前帧语音数据进行傅里叶变换,得到傅里叶变换频谱;将傅里叶变换频谱输入神经网络模型进行噪声估计得到噪声谱,并根据噪声谱确定各频点的增益系数;根据各个频点的增益系数乘以傅里叶变换频谱,得到降噪后的频谱;对降噪后的频谱进行反傅里叶变换得到当前帧降噪后的语音数据。本发明采用神经网络计算噪声谱,进而根据噪声谱对语音数据进行降噪,并不直接采用神经网络模型降噪,降低了计算量,同时对平稳噪声和非平稳噪声均可进行更准确的估计,准确率高。技术研发人员:王江,张家源,崔斌,王鑫受保护的技术使用者:漳州立达信光电子科技有限公司技术研发日:技术公布日:2024/2/25

本文地址:https://www.jishuxx.com/zhuanli/20240618/21900.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。