语音增益控制方法、装置、终端及存储介质与流程
- 国知局
- 2024-06-21 11:45:12
本发明涉及信号处理,尤其涉及一种语音增益控制方法、装置、终端及存储介质。
背景技术:
1、实时语音交互场景中,语音质量会受到其所在环境中噪声的干扰。为了提高语音质量,现有技术中常用的方法有以下几种。
2、第一种,基于信号幅度的dagc(delayed automatic gain control,延迟自动增益控制)算法,该算法通过测量输入信号的幅度来确定增益。其通常会首先对输入信号进行均方根(rms)或峰值检测,然后根据检测到的幅度来调整增益。这种方法简单直观,但在处理非线性信号或存在噪声的情况下可能会受到影响。
3、第二种,基于信号统计特性的dagc算法,这种方法使用信号的统计特性(如均值、方差等)来调整增益。例如,如果输入信号的均值过低,则可以增加增益以提升信号的强度。这种方法在处理非线性和噪声问题上具有一定的优势,因为其可以考虑到信号的整体特性,而不仅仅是单个的瞬时值。然而,这种方法需要一定的时间来积累统计数据,因此其响应速度可能较慢。
4、可见,现有的语音处理方法在实时语音交互场景中的增益控制效果较差。
技术实现思路
1、本发明实施例提供了一种语音增益控制方法、装置、终端及存储介质,以解决现有技术中实时语音交互场景中语音增益控制效果差的问题。
2、第一方面,本发明实施例提供了一种语音增益控制方法,包括:
3、对当前帧原始语音信号进行傅里叶变换,得到当前帧原始语音信号的频谱,并确定所述频谱中各个频点的幅度值;
4、计算所述频谱中各个频点的信噪比;
5、根据各个频点的信噪比和幅度值,确定对应频点的增益系数;
6、基于各个频点的增益系数对相应频点的幅度值进行增强,得到目标语音信号。
7、第二方面,本发明实施例提供了一种语音增益控制装置,包括:
8、频谱获取模块,用于对当前帧原始语音信号进行傅里叶变换,得到当前帧原始语音信号的频谱,并确定所述频谱中各个频点的幅度值;
9、信噪比计算模块,用于计算所述频谱中各个频点的信噪比;
10、增益系数确定模块,用于根据各个频点的信噪比和幅度值,确定对应频点的增益系数;
11、语音增强模块,用于基于各个频点的增益系数对相应频点的幅度值进行增强,得到目标语音信号。
12、第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面任一种可能的实现方式所述方法的步骤。
13、第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面任一种可能的实现方式所述方法的步骤。
14、本发明实施例提供一种语音增益控制方法、装置、终端及存储介质,该方法首先对当前帧原始语音信号进行傅里叶变换,得到当前帧原始语音信号的频谱,并确定所述频谱中各个频点的幅度值;然后计算所述频谱中各个频点的信噪比;根据各个频点的信噪比和幅度值,确定对应频点的增益系数;最后基于各个频点的增益系数对相应频点的幅度值进行增强,得到目标语音信号。上述方法能够对实时语音交互场景中采集的实时语音信号进行分帧处理,并在频域对当前帧原始语音信号不同频点的幅度值基于其信噪比和幅度值确定适应的增益值,从而在增益控制过程中降低噪声的干扰,不仅能改善语音增益控制效果,还能提高响应速度。
技术特征:1.一种语音增益控制方法,其特征在于,包括:
2.根据权利要求1所述的语音增益控制方法,其特征在于,所述根据各个频点的信噪比和幅度值,确定对应频点的增益系数,包括:
3.根据权利要求1所述的语音增益控制方法,其特征在于,所述计算所述频谱中各个频点的信噪比,包括:
4.根据权利要求3所述的语音增益控制方法,其特征在于,所述对所述频谱进行噪声估计,得到各个频点对应的噪声估计值,包括:
5.根据权利要求3所述的语音增益控制方法,其特征在于,所述根据各个频点对应的噪声估计值计算相应频点对应的语音增益,包括:
6.根据权利要求1所述的语音增益控制方法,其特征在于,所述基于各个频点的增益系数对相应频点的幅度值进行增强,得到目标语音信号,包括:
7.根据权利要求6所述的语音增益控制方法,其特征在于,在所述对当前帧原始语音信号进行傅里叶变换之前,所述方法还包括:
8.一种语音增益控制装置,其特征在于,包括:
9.一种终端,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如权利要求1至7中任一项所述的语音增益控制方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至7中任一项所述语音增益控制方法的步骤。
技术总结本发明提供一种语音增益控制方法、装置、终端及存储介质。该方法包括:对当前帧原始语音信号进行傅里叶变换,得到当前帧原始语音信号的频谱,并确定所述频谱中各个频点的幅度值;计算所述频谱中各个频点的信噪比;根据各个频点的信噪比和幅度值,确定对应频点的增益系数;基于各个频点的增益系数对相应频点的幅度值进行增强,得到目标语音信号。上述方法能够对原始语音信号进行分帧处理,并在频域对当前帧原始语音信号不同频点的幅度值基于其信噪比和幅度值确定适应的增益值,从而在增益控制过程中降低噪声的干扰,不仅能改善语音增益控制效果,还能提高响应速度。技术研发人员:王江,张家源,崔斌,王鑫,林友钦受保护的技术使用者:漳州立达信光电子科技有限公司技术研发日:技术公布日:2024/4/22本文地址:https://www.jishuxx.com/zhuanli/20240618/23370.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表