语音降噪方法、电子设备、存储介质及程序产品与流程
- 国知局
- 2024-06-21 11:46:45
本公开涉及语音通信,本公开尤其涉及一种语音降噪方法、电子设备、存储介质及程序产品。
背景技术:
1、在语音通信应用中,无论是助听或者耳机等场景中,往往由于嘈杂的背景噪声导致传输过程中,语音通信质量较差;人们通过研究单通道降噪方法,例如维纳滤波、谱减法等方法对背景噪声进行抑制,然而很难对背景噪声有准确的判断,而且单通道降噪过滤不干净导致产生附加的噪声更加恶化通信质量。随着神经网络的兴起,其优异的降噪效果,逐渐成为单通道降噪方法的主流,然而在一些低资源的dsp平台,仍然难以取得较好的效果。
2、传统单通道降噪,需要从已经获取的麦克风信号中去估计背景噪声信息,传统单通道噪声估计的方法已经有比较成熟的发展,例如最小值跟踪的方法等。
3、但是传统单通道噪声只能通过单通道的功率谱估计,容易错误的估计到正常的语音信号。
技术实现思路
1、本公开提供了一种语音降噪方法、电子设备、存储介质及程序产品。
2、在本公开的一个方面,提供了一种语音降噪方法,包括:
3、获取双通道麦克风的麦克风信号;
4、基于所述麦克风信号获取麦克风双通道的相关性和空间特征;
5、基于所述相关性和空间特征获取语音存在可能性;
6、基于所述语音存在可能性对所述麦克风信号中的环境噪声进行降噪处理,得到目标语音信号。
7、根据本公开一种可选地实施方式,获取双通道麦克风的麦克风信号,包括:
8、获取双通道麦克风的时域信号,将所述时域信号转换为频域信号。
9、根据本公开一种可选地实施方式,基于所述麦克风信号获取麦克风双通道的相关性,包括:
10、基于所述频域信号获取双通道的功率频谱;
11、基于所述功率频谱获取所述双通道的相关性。
12、根据本公开一种可选地实施方式,基于所述功率频谱获取所述双通道的相关性,包括:通过如下公式获取双通道的相关性:
13、
14、其中,γx(t,k)为双通道的相关性,为一阶平滑互功率频谱,为一阶平滑自功率频谱,i=1,表示第一个通道,j=2,表示第二个通道。
15、根据本公开一种可选地实施方式,基于所述频域信号获取双通道的功率频谱,包括:通过如下公式获取双通道的功率频谱:
16、
17、
18、其中,为一阶平滑互功率频谱,为一阶平滑自功率频谱,γ为平滑系数,k为频率索引,xi(t,k)为第一通道的频域信号,为第二通道的共轭频域信号,为第一通道的共轭频域信号。
19、根据本公开一种可选地实施方式,基于所述麦克风信号获取麦克风双通道的空间特征,包括:
20、获取麦克风双通道的空间直达噪声和扩射场噪声;
21、将所述空间直达噪声和扩射场噪声作为所述空间特征。
22、根据本公开一种可选地实施方式,基于所述相关性和空间特征获取语音存在可能性,包括:
23、基于所述相关性和空间特征获取语音后验存在可能性。
24、根据本公开一种可选地实施方式,基于所述相关性和空间特征获取语音后验存在可能性,包括:
25、获取先验信噪比和后验信噪比;
26、获取语音先验存在可能性;
27、基于所述先验信噪比和后验信噪比以及所述语音先验存在可能性得到语音后验存在可能性。
28、根据本公开一种可选地实施方式,通过如下公式得到语音后验存在可能性:
29、
30、υ(t,k)=γ(t,k)ξ(t,k)/(1+ξ(t,k))
31、其中,p(t,k)为语音后验存在可能性,ξ(t,k)为先验信噪比,γ(t,k)为后验信噪比,q(t,k)为语音先验存在可能性。
32、根据本公开一种可选地实施方式,获取语音先验存在可能性,包括:
33、获取全频带语音存在可能性、局部语音存在可能性以及全局语音存在可能性;
34、基于所述全频带语音存在可能性、局部语音存在可能性以及全局语音存在可能性得到所述语音先验存在可能性。
35、根据本公开一种可选地实施方式,获取全频带语音存在可能性,包括:
36、获取高频带语音存在可能性与低频带语音存在可能性。
37、基于所述高频带语音存在可能性与所述低频带语音存在可能性以及所述局部语音存在可能性得到全频带语音存在可能性。
38、根据本公开一种可选地实施方式,基于所述高频带语音存在可能性与低频带语音存在可能性得到所述全频带语音存在可能性,包括通过如下公式得到所述全频带语音存在可能性:
39、
40、其中,qthr1,qthr2为常数阈值,qframe(t)为全频带语音存在可能性,qlow(t)为高频带语音存在可能性,qhigh(t)为低频带语音存在可能性。
41、根据本公开一种可选地实施方式,获取低频带语音存在可能性,包括通过如下公式得到所述低频带语音存在可能性:
42、
43、qlow(t)为低频带语音存在可能性,klow1,khigh1,klow2为划分的频带范围,qlocal(t,k)为局部语音存在可能性。
44、根据本公开一种可选地实施方式,获取高频带语音存在可能性,包括通过如下公式得到所述高频带语音存在可能性:
45、
46、qhigh(t)为高频带语音存在可能性,khigh1,klow2,khigh2为划分的频带范围,qlocal(t,k)为局部语音存在可能性。
47、根据本公开一种可选地实施方式,获取语音先验存在可能性,包括通过如下公式得到所述语音先验存在可能性:
48、q(t,k)=1-[1-qlocal(t,k)][1-qglocal(t,k)][1-qframe(t)]
49、其中,q(t,k)为语音先验存在可能性,qlocal(t,k)为局部语音存在可能性,qglocal(t,k)为全局语音存在可能性,qframe(t)为全频带语音存在可能性。
50、根据本公开一种可选地实施方式,获取全局语音存在可能性,包括:
51、基于所述双通道的相关性获取局部语音存在可能性;
52、基于所述局部语音存在可能性获取全局语音存在可能性。
53、根据本公开一种可选地实施方式,基于所述语音存在可能性对所述麦克风信号中的环境噪声进行降噪处理,得到目标语音信号,包括:
54、获取环境噪声功率谱;
55、基于所述环境噪声功率谱对所述麦克风信号中的环境噪声进行压制,得到目标语音信号。
56、根据本公开一种可选地实施方式,获取环境噪声功率谱,包括:
57、获取平滑因子;
58、基于所述平滑因子以及所述频域信号得到所述环境噪声功率谱。
59、根据本公开的另一个方面,提供了一种电子设备,包括:
60、存储器,所述存储器存储执行指令;
61、处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行上述中任一项所述的语音降噪方法。
62、根据本公开的还一个方面,提供了一种可读存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现上述中任一项所述的语音降噪方法。
63、根据本公开的再一个方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述中任一项所述的语音降噪方法。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23516.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表