技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音信号自动增益控制方法、装置、介质及设备与流程 > 正文

语音信号自动增益控制方法、装置、介质及设备与流程

国知局
2024-06-21 11:30:32

本发明涉及信号增益的，尤其涉及一种语音信号自动增益控制方法、装置、介质及设备。

背景技术：

1、在通信系统中，自动增益控制(automatic gain control，英文简称为agc)是一种常见的语音信号处理算法，主要作用是根据输入语音信号的幅度，自动调整控制增益使输出信号的能量达到一个稳定值。

2、现有技术中语音的自动增益控制是采用对时域信号的长短期幅值的平滑化，为保证信号不在短期内剧烈变换以保存语音，增益系数的平滑化使得其变化缓慢。这样，一段高强度语音导致增益值低，接下来的低强度语音很难被及时放大；同样，一段低强度语音导致增益系数高，接下来如果出现高强度语音，增益系数来不及调整，会导致高强度语音进一步增大，这种类似于“隧道”效应使得处理后的语音信号不稳。

3、因此，有必要提供一种语音信号自动增益控制方法以解决现有技术中存在的上述问题。

技术实现思路

1、本发明的目的在于提供一种语音信号自动增益控制方法、装置、介质及设备，用于解决增益系数调整不及时导致的语音信号不稳的问题。

2、第一方面，本发明实施例提供一种语音信号自动增益控制方法，该方法包括以下步骤：将原始语音信号划分为m帧子语音信号，m为正整数；对所述m帧子语音信号进行傅里叶变换，得到m帧频域信号；计算每帧频域信号对应的频谱能量；基于所述每帧频域信号对应的频谱能量，计算所述每帧频域信号对应的目标增益；基于所述目标增益调整所述每帧频域信号，得到调整后的m帧频域信号；将所述调整后的m帧频域信号进行傅里叶逆变换，得到调整后的语音信号。

3、本发明实施例提供的语音信号自动增益控制方法的有益效果在于：通过对原始语音信号进行分帧并将每帧语音信号变换成频域信号，根据每帧频域信号对应的频谱能量计算每帧频域信号对应的目标增益，继而根据目标增益调整每帧频域信号，避免增益系数调整不及时，提高语音信号在增益系数调整时的稳定。

4、在一种可能的实施方式中，所述基于所述每帧频域信号对应的频谱能量，计算所述每帧频域信号对应的目标增益，具体包括：

5、基于所述每帧频域信号对应的频谱能量，计算所述每帧频域信号对应的中间增益；

6、对所述中间增益进行调整，得到所述每帧频域信号对应的目标增益。

7、在一种可能的实施方式中，所述每帧频域信号对应的中间增益满足如下公式：

8、

9、其中，g(n)为第n帧频域信号的中间增益，δmax为预先设定的每帧频域信号的频谱能量最大阈值，σx(n)为第n帧频域信号的频谱能量，n的取值范围从1至m。

10、在一种可能的实施方式中，所述每帧频域信号对应的中间增益满足如下公式：

11、

12、其中，g(n)为第n帧频域信号的中间增益，δmax为预先设定的每帧频域信号的频谱能量最大阈值，σx(n)为第n帧频域信号的频谱能量，n的取值范围从1至m。

13、在一种可能的实施方式中，所述调整后的目标增益满足如下公式：

14、

15、其中，为第n帧频域信号的目标增益，g(n)为第n帧频域信号的中间增益，gmax为预先设定的增益最大阈值，gmin为预先设定的增益最小阈值。

16、在一种可能的实施方式中，所述基于所述目标增益调整所述每帧频域信号，得到调整后的m帧频域信号，具体包括：

17、基于所述目标增益和语音存在概率调整每帧频域信号，得到调整后的m帧频域信号，所述语音存在概率通过ans算法或噪声谱跟踪算法得到。

18、第二方面，本发明实施例还提供一种语音信号自动增益控制装置，该装置包括执行上述第一方面的任意一种可能的设计的方法的模块/单元。这些模块/单元可以通过硬件实现，也可以通过硬件执行相应的软件实现。

19、第三方面，本发明实施例提供一种终端设备，包括处理器和存储器。其中，存储器用于存储一个或多个计算机程序；当存储器存储的一个或多个计算机程序被处理器执行时，使得该终端设备能够实现上述第一方面的任意一种可能的设计的方法。

20、第四方面，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质包括计算机程序，当计算机程序在电子设备上运行时，使得所述电子设备执行上述任一方面的任意一种可能的设计的方法。

21、第五方面，本发明实施例还提供一种包含计算机程序产品，当所述计算机程序产品在终端上运行时，使得所述电子设备执行上述任一方面的任意一种可能的设计的方法。

22、关于上述第二方面至第五方面的有益效果可以参见上述第一方面的描述。

技术特征：

1.一种语音信号自动增益控制方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述基于所述每帧频域信号对应的频谱能量，计算所述每帧频域信号对应的目标增益，具体包括：

3.根据权利要求2所述的方法，其特征在于，所述每帧频域信号对应的中间增益满足如下公式：

4.根据权利要求2所述的方法，其特征在于，所述每帧频域信号对应的中间增益满足如下公式：

5.根据权利要求2至4任一项所述的方法，其特征在于，所述调整后的目标增益满足如下公式：

6.根据权利要求1所述的方法，其特征在于，所述基于所述目标增益调整所述每帧频域信号，得到调整后的m帧频域信号，具体包括：

7.一种语音信号自动增益控制装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述第二计算单元在基于所述每帧频域信号对应的频谱能量，计算所述每帧频域信号对应的目标增益时，具体用于：

9.根据权利要求7所述的装置，其特征在于，所述调整单元在基于所述目标增益调整所述每帧频域信号，得到调整后的m帧频域信号时，具体用于：

10.一种终端设备，其特征在于，包括：处理器及存储器，所述存储器用于存储计算机程序；所述处理器用于执行所述存储器存储的计算机程序，以使所述终端设备执行权利要求1至6中任一项所述的方法。

11.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。

技术总结本发明提供了一种语音信号自动增益控制方法、装置、介质及设备，所述方法包括以下步骤：将原始语音信号划分为M帧子语音信号，M为正整数；对所述M帧子语音信号进行傅里叶变换，得到M帧频域信号；计算每帧频域信号对应的频谱能量；基于所述每帧频域信号对应的频谱能量，计算所述每帧频域信号对应的目标增益；基于所述目标增益调整所述每帧频域信号，得到调整后的M帧频域信号；将所述调整后的M帧频域信号进行傅里叶逆变换，得到调整后的语音信号。本发明解决了增益系数调整不及时导致的语音信号不稳的问题。技术研发人员：周智,仇健乐,于欣,蒋寿美受保护的技术使用者：时擎智能科技（上海）有限公司技术研发日：技术公布日：2024/2/29