一种噪声抑制方法及装置与流程
- 国知局
- 2024-06-21 10:39:42
本发明涉及音频处理,特别涉及一种噪声抑制方法及装置。
背景技术:
1、语音增强技术,通常是指对语音信号进行降噪处理,在通讯技术日益发达的今天,有着非常广泛的应用场景。在传统语音增强技术中,可以通过诸如分位数估计的方法估计噪声成分并通过谱减法、维纳滤波器等去除噪声,然而噪声抑制的过程中如果对噪声的抑制不强,会残留较多的噪声,如果对噪声的抑制过强,也会损失语音的质量。
2、需要说明的是,公开于该发明背景技术部分的信息仅仅旨在加深对本发明一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
技术实现思路
1、本发明的目的在于提供一种噪声抑制方法及装置,以解决现有噪声抑制方法对噪声抑制程度难以控制的问题。
2、为解决上述技术问题,本发明提供一种噪声抑制方法,包括以下步骤:
3、信号预处理,对获得的麦克风信号进行时频变换,计算其梅尔频带功率谱;
4、噪声估计,基于最小值跟踪法和nn-vad估计噪声,利用预设参数对不同频带进行噪声估计修正;
5、噪声抑制,使用om-lsa计算梅尔频带增强增益,获得每个频点的增益并和所述麦克风信号的频点相乘获得噪声抑制后的频域信号,将所述频域信号经过逆变换得到噪声抑制后的时域信号。
6、优选地,基于最小值跟踪法和nn-vad估计噪声包括:
7、对所述梅尔频带功率谱进行帧间平滑,使用改进的最小值跟踪法,即采用如下公式结合相邻频带获得频带的最小值:
8、emin(bi,t)=min(emin(bi,t-1),emel‘(bi-1,t),
9、emel‘(bi,t),emel‘(bi+1,t))
10、其中,emel‘(bi,t)为当前时刻t的第i个梅尔频带功率谱,emel‘(bi,t-1)为上一时刻t-1的第i个梅尔频带功率谱;emel‘(bi+1,t)为当前时刻t的第i+1个梅尔频带功率谱,emin(bi,t-1)为上一时刻t-1的最小值。
11、优选地,在获得频带的最小值后,计算语音存在概率的估计值:
12、
13、其中,thr、beta为预设的常数门限,emel(bi,t)表示当前时刻t的第i个梅尔频带功率谱;emin(bi,t)为频带的最小值。
14、优选地,使用nn-vad的结果对所述语音存在概率的估计值进行修正:
15、p′speech(bi,t)=pspeech(bi,t)*pnn(t)
16、其中,pnn(t)为nn-vad输出的当前帧为语音的概率,pspeech(bi,t)为所述语音存在概率的估计值;
17、根据所述语音存在概率利用一阶递归计算噪声频带功率谱的估计值;
18、使用所述预设参数进行所述噪声频带功率谱的估计值的修正:
19、
20、其中,λ(bi)为各个频带的噪声估计修正因子,λ(bi)取值范围为(0,10]。
21、优选地,使用om-lsa计算梅尔频带增强增益的过程包括:计算先验信噪比和后验信噪比:
22、
23、
24、其中,γ是后验信噪比,是修正后的所述噪声频带功率谱的估计值,emel(bi,t)表示t时刻的第i个梅尔频带功率谱,η是先验信噪比,aη是预设平滑常数,gh1(bi,t一1)是上一时刻计算得到的语音存在时的增益,gh1的计算公式如下:
25、
26、其中,
27、再进行先验信噪比的平滑:
28、ξ(bi,t)=αξξ(bi,t-1)+(1-αξ)η(bi,t)
29、其中αξ为预设的平滑因子。
30、优选地,在计算先验信噪比和后验信噪比后,计算各频带和全频带的语音存在概率:
31、
32、
33、其中,plocal(bi,t)为各频带的语音存在概率,pframe(t)为全频带的语音存在概率,thrll、thrlu、thrfl、thrfu均为预设门限值,pmin为预设的较小常量;为ξ(bi,t)转化为db的表示:
34、
35、为ξ(bi,t)取均值后转化为db的表示:
36、
37、优选地,修正所述各频带的语音存在概率:
38、plocal‘(bi,t)=plocal(bi,t)*alphalocal,i=[lstart,lend]
39、其中,alphalocal为预设常数,alphalocal∈(0,1);
40、由所述各频带的语音存在概率和所述全频带的语音存在概率得到语音不存在概率:
41、
42、其中,qmax为预设常量,qmax<1。
43、优选地,使用所述语音不存在概率计算所述梅尔频带增强增益:
44、
45、其中,gmin是预设最小增益,p(bi,t)的计算公式如下:
46、
47、优选地,将得到的所述梅尔频带增强增益经过三角滤波器组计算得到每个频点的增益:
48、
49、其中,gmel(bi,t)为所述梅尔频带增强增益,a(bi,ωk,t)表示第i个梅尔频带对应的频点k的滤波器系数。
50、一种噪声抑制装置,包括:
51、信号预处理模块,用于对获得的麦克风信号进行时频变换,计算其梅尔频带功率谱;
52、噪声估计模块,用于基于最小值跟踪法和nn-vad估计噪声,利用预设参数对不同频带进行噪声估计修正;
53、噪声抑制模块,用于使用om-lsa计算梅尔频带增强增益,获得每个频点的增益并和所述麦克风信号的频点相乘获得噪声抑制后的频域信号,将所述频域信号经过逆变换得到噪声抑制后的时域信号。
54、在本发明提供的噪声抑制方法中,通过对带噪的麦克风信号进行梅尔频带划分,然后利用基于最小值跟踪法(改进的最小值控制的递归平均算法mmcra)结合神经网络语音活动检测(nn-vad)进行频带噪声估计,通过最优改进对数幅度谱估计(om-lsa)进行频带增强增益的计算,保证了对噪声抑制的效果。
55、本发明提供的噪声抑制装置与本发明提供的噪声抑制方法属于同一发明构思,因此,本发明提供的噪声抑制装置至少具有本发明提供的噪声抑制方法的所有优点,在此不再赘述。进一步的,通过引入表征人耳听觉感知特性的梅尔频带功率谱,利用最小值跟踪法(改进的最小值控制的递归平均算法mmcra)结合nn-vad进行频带噪声,还通预设参数进行噪声估计修正,便于调整噪声抑制的强弱。
技术特征:1.一种噪声抑制方法,其特征在于,包括以下步骤:
2.如权利要求1所述的噪声抑制方法,其特征在于,基于最小值跟踪法和nn-vad估计噪声包括:
3.如权利要求2所述的噪声抑制方法,其特征在于,在获得频带的最小值后,计算语音存在概率的估计值:
4.如权利要求3所述的噪声抑制方法,其特征在于,使用nn-vad的结果对所述语音存在概率的估计值进行修正:
5.如权利要求4所述的噪声抑制方法,其特征在于,使用om-lsa计算梅尔频带增强增益的过程包括:计算先验信噪比和后验信噪比:
6.如权利要求5所述的噪声抑制方法,其特征在于,在计算先验信噪比和后验信噪比后,计算各频带和全频带的语音存在概率:
7.如权利要求6所述的噪声抑制方法,其特征在于,修正所述各频带的语音存在概率:
8.如权利要求7所述的噪声抑制方法,其特征在于,使用所述语音不存在概率计算所述梅尔频带增强增益:
9.如权利要求8所述的噪声抑制方法,其特征在于,将得到的所述梅尔频带增强增益经过三角滤波器组计算得到每个频点的增益:
10.一种噪声抑制装置,其特征在于,包括:
技术总结本发明公开了一种噪声抑制方法及装置,属于音频处理技术领域,该噪声抑制方法,包括以下步骤:信号预处理,对获得的麦克风信号进行时频变换,计算其梅尔频带功率谱;噪声估计,基于最小值跟踪法和NN‑VAD估计噪声,利用预设参数对不同频带进行噪声估计修正;噪声抑制,使用OM‑LSA计算梅尔频带增强增益,获得每个频点的增益并和所述麦克风信号的频点相乘获得噪声抑制后的频域信号,将所述频域信号经过逆变换得到噪声抑制后的时域信号。通过对带噪的麦克风信号进行梅尔频带划分,然后利用基于最小值跟踪法结合NN‑VAD进行频带噪声估计,通过OM‑LSA进行频带增强增益的计算,保证了对噪声抑制的效果。技术研发人员:邹灵琦,董鹏宇,居彩霞受保护的技术使用者:上海富瀚微电子股份有限公司技术研发日:技术公布日:2024/1/15本文地址:https://www.jishuxx.com/zhuanli/20240618/21032.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表