技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音增强方法、设备及存储介质与流程 > 正文

语音增强方法、设备及存储介质与流程

国知局
2024-06-21 11:47:54

本申请涉及数据传输，特别是涉及一种语音增强方法、设备及存储介质。

背景技术：

1、在真实的通信环境中，干净语音往往混杂着一些噪声，当噪声较大时则会影响通信设备性能，因此需要在保留语音的前提下消除混杂噪声，达到增强干净语音强度、清晰度的目的。对于语音增强算法，如何平衡噪声抑制和语音保留是重点关注的方向，如果噪声抑制不足会达不到所需要的通信质量，使设备的应用场景受限；而噪声抑制过度会造成语音失真，降低信号的分辨率等。

2、一般的环境噪声可以视为加性噪声，即与干净语音的关系是相加的，例如办公室的机器运行声或者室外的风声、车流声等，目前的语音增强算法基本只考虑到对加性噪声进行噪声抑制，但是，除此之外，还会存在一些由于设备不理想、信道损失等造成的非加性噪声，以及由于对加性噪声进行噪声抑制不准确造成的残余噪声，因此，语音质量和可靠性有待进一步改善。

技术实现思路

1、本申请至少提供一种语音增强方法、设备及存储介质。

2、本申请第一方面提供了一种语音增强方法，方法包括：对待处理音频信号进行加性噪声抑制处理，确定待处理音频信号进行加性噪声抑制处理采用的语音估计增益系数；提取待处理音频信号对应的基音频率，根据基音频率确定平滑系数；按照平滑系数对语音估计增益系数进行平滑，得到平滑增益系数；根据平滑增益系数对待处理音频信号进行语音增强，得到目标纯净语音信号。

3、在一实施例中，在对待处理音频信号进行频谱分析，提取待处理音频信号中含有的初始纯净语音信号之前，方法还包括：获取原始音频信号，原始音频信号含有噪声和语音；采用非线性变换算法对原始音频信号对应的信号谱进行压缩，得到压缩谱；根据预设滤波器对压缩谱进行滤波处理，得到滤波结果；对滤波结果进行非线性扩展，得到待处理音频信号。

4、在一实施例中，预设滤波器包括带通滤波器。

5、在一实施例中，提取待处理音频信号对应的基音频率，包括：采用非线性变换算法对待处理音频信号对应的信号谱进行压缩，得到压缩谱；对压缩谱进行峰值检测，得到基音特征因子；基于基音特征因子计算待处理音频信号对应的基音频率。

6、在一实施例中，根据基音频率确定平滑系数，包括：根据基音频率计算谐波频率；利用谐波频率构建傅里叶变换域索引，傅里叶变换域索引的数量为在采样周期内基音频率的最大倍数；根据傅里叶变换域索引确定平滑系数。

7、在一实施例中，根据傅里叶变换域索引确定平滑系数，包括：基于傅里叶变换域索引确定基音位置和谐波位置；为基音位置和谐波位置设置第一平滑系数。

8、在一实施例中，在对基音位置和谐波位置设置第一平滑系数之前，方法还包括：识别待处理音频信号中的语音帧，语音帧是指含有语音的音频帧；对基音位置和谐波位置设置第一平滑系数，包括：对语音帧中的基音位置和谐波位置设置第一平滑系数；以及，针对语音帧中除基音位置和谐波位置之外的其它位置，对语音帧中的频率低于预设频率阈值的位置设置第二平滑系数，对语音帧中的频率不低于预设频率阈值的位置设置第三平滑系数。

9、在一实施例中，根据平滑增益系数对待处理音频信号进行语音增强，得到目标纯净语音信号，包括：获取待处理音频信号对应的原始语音相位谱；根据平滑增益系数和原始语音相位谱，对待处理音频信号进行语音增强，得到目标纯净语音信号。

10、本申请第二方面提供了一种语音增强装置，装置包括：增益平滑系数确定模块，用于对待处理音频信号进行加性噪声抑制处理，确定待处理音频信号进行加性噪声抑制处理采用的语音估计增益系数；平滑系数确定模块，用于提取待处理音频信号对应的基音频率，根据基音频率确定平滑系数；增益平滑模块，用于按照平滑系数对语音估计增益系数进行平滑，得到平滑增益系数；语音增强模块，用于根据平滑增益系数对待处理音频信号进行语音增强，得到目标纯净语音信号。

11、本申请第三方面提供了一种电子设备，包括存储器和处理器，处理器用于执行存储器中存储的程序指令，以实现上述语音增强方法。

12、本申请第四方面提供了一种计算机可读存储介质，其上存储有程序指令，程序指令被处理器执行时实现上述语音增强方法。

13、上述方案，通过对待处理音频信号进行加性噪声抑制处理，确定待处理音频信号进行加性噪声抑制处理采用的语音估计增益系数，并提取待处理音频信号对应的基音频率，根据基音频率确定平滑系数；按照平滑系数对语音估计增益系数进行平滑，得到平滑增益系数；根据平滑增益系数对待处理音频信号进行语音增强，得到目标纯净语音信号，可以在抑制加性噪声的前提下，有效抑制因为噪声抑制不准确造成的残余噪声，且根据基音频率确定的平滑系数可以避免语音失真。

14、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，而非限制本申请。

技术特征：

1.一种语音增强方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述对待处理音频信号进行加性噪声抑制处理，确定所述待处理音频信号进行所述加性噪声抑制处理采用的语音估计增益系数之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述预设滤波器包括带通滤波器。

4.根据权利要求1所述的方法，其特征在于，所述提取所述待处理音频信号对应的基音频率，包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述基音频率确定平滑系数，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据所述傅里叶变换域索引确定平滑系数，包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

8.根据权利要求1-7任一项所述的方法，其特征在于，所述根据所述平滑增益系数对所述待处理音频信号进行语音增强，得到目标纯净语音信号，包括：

9.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，处理器用于执行存储器中存储的程序指令，以实现如权利要求1-8任一项所述方法中的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有程序指令，所述程序指令能够被处理器执行以实现如权利要求1-8任一项所述方法中的步骤。

技术总结本申请公开了一种语音增强方法、设备及存储介质，该语音增强方法包括：对待处理音频信号进行加性噪声抑制处理，确定待处理音频信号进行加性噪声抑制处理采用的语音估计增益系数；提取待处理音频信号对应的基音频率，根据基音频率确定平滑系数；按照平滑系数对语音估计增益系数进行平滑，得到平滑增益系数；根据平滑增益系数对待处理音频信号进行语音增强，得到目标纯净语音信号。可以在抑制加性噪声的前提下，有效抑制因为噪声抑制不准确造成的残余噪声，且根据基音频率确定的平滑系数可以避免语音失真。技术研发人员：方瑞东,薛晗,林聚财,黄景标,毛亚朋,黄威震,王国龙,殷俊受保护的技术使用者：浙江大华技术股份有限公司技术研发日：技术公布日：2024/4/29