技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于麦克风阵列的自适应语音增强方法及其相关装置与流程 > 正文

一种基于麦克风阵列的自适应语音增强方法及其相关装置与流程

国知局
2024-06-21 11:55:49

本发明涉及音频处理领域，尤其涉及一种基于麦克风阵列的自适应语音增强方法、装置、设备及存储介质。

背景技术：

1、随着科技的发展,人们的日常交流、人机交互越来越重视音频信号的质量,而需求带动了麦克风语音增强技术的发展。传统的录音方式比较简单，在便携式终端中，往往采用单麦克风设计，拾音范围小，语音增强效果差。

技术实现思路

1、本发明的主要目的在于解决麦克风的语音增强效果差的技术问题。

2、本发明第一方面提供了一种基于麦克风阵列的自适应语音增强方法，所述基于麦克风阵列的自适应语音增强方法包括：

3、获取多个音频信号；

4、根据所述音频信号确定第一时域数据；

5、将所述第一时域数据变换为第一频域数据；

6、对所述第一频域数据进行滤波，得到前向频域数据以及反向频域数据；

7、将所述前向频域数据，所述反向频域数据各自重叠相加，得到第二频域数据；

8、将所述第二频域数据变换为第二时域数据；

9、根据所述第二时域数据自适应调整每次输出的增益。

10、可选的，在本发明第一方面的第一种实现方式中，所述对所述第一频域数据进行滤波，得到前向频域数据以及反向频域数据的步骤包括：

11、根据预设的前向滤波器以及预设的反向滤波器对所述第一频域数据进行滤波，得到前向频域数据以及反向频域数据。

12、可选的，在本发明第一方面的第二种实现方式中，所述根据预设的前向滤波器以及预设的反向滤波器对所述第一频域数据进行滤波，得到前向频域数据以及反向频域数据的步骤之前，所述方法还包括：

13、生成前向滤波器以及反向滤波器。

14、可选的，在本发明第一方面的第三种实现方式中所述生成所述前向滤波器以及所述反向滤波器的步骤包括：

15、将预设的最小范数滤波器作为前向滤波器；

16、根据所述前向滤波器生成反向滤波器。

17、可选的，在本发明第一方面的第四种实现方式中，所述根据所述前向滤波器生成反向滤波器的步骤包括：

18、对所述前向滤波器的前向滤波器系数执行逆序排列操作，得到反向滤波器系数；

19、根据所述反向滤波器系数，生成反向滤波器。

20、可选的，在本发明第一方面的第五种实现方式中，所述根据所述第二时域数据自适应调整每次输出的增益的步骤包括：

21、检测实时调整的预设增益值；

22、检测到实时调整的所述预设增益值时，将所述第二时域数据的反向数据与所述预设增益值相乘，得到目标数据；

23、将所述第二时域数据的前向数据减去所述目标数据，得到增强后的音频数据；

24、根据所述音频数据自适应的实时调整所述预设增益值，以返回触发检测实时调整的预设增益值的步骤。

25、可选的，在本发明第一方面的第六种实现方式中，所述获取多个音频信号的步骤包括：

26、获取同一方向的多个所述音频信号。

27、本发明第二方面提供了一种基于麦克风阵列的自适应语音增强装置，包括：

28、获取模块，用于获取多个音频信号；

29、确定模块，用于根据所述音频信号确定第一时域数据；

30、变换模块，用于将所述第一时域数据变换为第一频域数据；

31、滤波模块，用于对所述第一频域数据进行滤波，得到前向频域数据以及反向频域数据；

32、计算模块，用于将所述前向频域数据，所述反向频域数据各自重叠相加，得到第二频域数据；

33、反变换模块，用将所述第二频域数据变换为第二时域数据；

34、输出模块，用于根据所述第二时域数据自适应调整每次输出的增益。

35、本发明第三方面提供了一种基于麦克风阵列的自适应语音增强设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述基于麦克风阵列的自适应语音增强设备执行上述的基于麦克风阵列的自适应语音增强方法。

36、本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的基于麦克风阵列的自适应语音增强方法。

37、在本实施例中，获取多个音频信号；根据所述音频信号确定第一时域数据；将所述第一时域数据变换为第一频域数据；对所述第一频域数据进行滤波，得到前向频域数据以及反向频域数据；将所述前向频域数据，所述反向频域数据各自重叠相加，得到第二频域数据；将所述第二频域数据变换为第二时域数据；根据所述第二时域数据自适应调整每次输出的增益。由于基于麦克风阵列的自适应语音增强装置可以获取多个音频信号，增加了拾音范围；基于多个音频信号进行了滤波以及重叠相加，能够有效拾取正前方的声音，排除其他方向环境噪声的干扰；将得到的第二时域信号用于输出增益，能更好利用空域信息，相较于单麦克风而言，采用多麦克风阵列设计，提高了语音增强效果。

技术特征：

1.一种基于麦克风阵列的自适应语音增强方法，其特征在于，所述基于麦克风阵列的自适应语音增强方法包括：

2.根据权利要求1所述的基于麦克风阵列的自适应语音增强方法，其特征在于，所述对所述第一频域数据进行滤波，得到前向频域数据以及反向频域数据的步骤包括：

3.根据权利要求2所述的基于麦克风阵列的自适应语音增强方法，其特征在于，所述根据预设的前向滤波器以及预设的反向滤波器对所述第一频域数据进行滤波，得到前向频域数据以及反向频域数据的步骤之前，所述方法还包括：

4.根据权利要求3所述的基于麦克风阵列的自适应语音增强方法，其特征在于，所述生成所述前向滤波器以及所述反向滤波器的步骤包括：

5.根据权利要求4所述的基于麦克风阵列的自适应语音增强方法，其特征在于，所述根据所述前向滤波器生成反向滤波器的步骤包括：

6.根据权利要求1所述的基于麦克风阵列的自适应语音增强方法，其特征在于，所述根据所述第二时域数据自适应调整每次输出的增益的步骤包括：

7.根据权利要求1-6任一项所述的基于麦克风阵列的自适应语音增强方法，其特征在于，所述获取多个音频信号的步骤包括：

8.一种基于麦克风阵列的自适应语音增强装置，其特征在于，所述基于麦克风阵列的自适应语音增强装置包括：

9.一种基于麦克风阵列的自适应语音增强设备，其特征在于，所述基于麦克风阵列的自适应语音增强设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

10.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于麦克风阵列的自适应语音增强方法。

技术总结本发明涉及音频处理领域，公开了一种基于麦克风阵列的自适应语音增强方法、装置、设备及存储介质。该方法包括：获取多个音频信号；根据音频信号确定第一时域数据；将第一时域数据变换为第一频域数据；对第一频域数据进行滤波，得到前向频域数据以及反向频域数据；将前向频域数据，反向频域数据各自重叠相加，得到第二频域数据；将第二频域数据变换为第二时域数据；根据第二时域数据自适应调整每次输出的增益。本发明加强了语音增强效果。技术研发人员：邓刚,赵宏亮,欧阳梓俊受保护的技术使用者：深圳市长丰影像器材有限公司技术研发日：技术公布日：2024/6/2