技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种定向拾音方法、系统、设备及存储介质与流程 > 正文

一种定向拾音方法、系统、设备及存储介质与流程

国知局
2024-06-21 11:36:45

本发明属于智能语音，尤其涉及一种定向拾音方法、系统、设备及存储介质。

背景技术：

1、三维麦克风阵列波束的形成，需要将多个麦克风置于三维空间，三维空间中不同方位与距离的声源到各麦克风的相位和幅值表现不同，通过对阵列麦克风信号施加特定滤波器，可实现三维方向的定向拾音与噪声抑制。

2、对于三维空间的定向拾音，要求麦克风阵列在三维方向均有布置，每个麦克风在各维度上有一定距离。然而某些设备在某一空间维度无法布置多颗麦克风，如平板设备，由于厚度薄，在厚度方向上无法布置多颗麦克风，导致缺失这一维度方向相位信息的缺失，波束形成无法实现该维度上方向的抑制，也就无法实现该方向的定向拾音。

技术实现思路

1、本发明的目的在于提供一种麦克风定向拾音方法、系统、设备及存储介质，为解决三维空间的定向拾音中由于某一维度无法布置麦克风阵列而导致无法实现该方向的定向拾音的问题。

2、为达到上述目的，本发明提供如下技术方案：

3、第一方面，本发明实施例提供一种定向拾音方法，所述方法包括：

4、获取麦克风采集到的原始语音，对所述原始信号进行处理得到第一语音和第二语音；所述第一语音为麦克风阵列输出的语音信号，包含目标拾音方向及其对侧的语音信号，所述第二语音为定向麦克风采集的语音信号，其中，所述麦克风阵列由若干个全向麦克风组成；

5、对所述第一语音和所述第二语音进行盲源分离处理，得到所述目标拾音方向的目标语音。

6、进一步地，所述对所述第一语音和所述第二语音进行盲源分离处理，包括：

7、基于所述第一语音和所述第二语音计算对应的控制因子；

8、基于所述控制因子，对目标拾音方向与对侧的语音信号进行初步分离；

9、将所述控制因子映射为掩膜值，对所述语音信号进一步分离，得到目标拾音方向的目标语音。

10、进一步地，所述基于所述第一语音和所述第二语音计算对应的控制因子，包括：

11、获取包括所述第一语音x1、所述第二语音x2、任一全向麦克风采集的原始信号x3的三路语音信号；

12、分别对所述三路语音信号作短时傅里叶变换后，计算三路频域信号的能量；

13、根据以下公式计算能量比值系数r：

14、

15、其中，e1为所述第一语音x1对应的频域信号的能量，e2为所述第二语音x2对应的频域信号的能量，e3为所述全向麦克风采集的原始信号x3对应的频域信号的能量；

16、根据所述能量比值系数r分别计算所述第一语音的控制因子β1和所述第二语音的控制因子β2，计算公式可表示为：

17、

18、β2＝1-β1

19、其中，c为0到1之间的任意值；

20、进一步地，所述将所述控制因子映射为掩膜值，还包括：

21、计算l帧三路频域信号频率为f的能量比值：

22、

23、其中，e1(f)为所述第一语音x1对应的频率f的信号能量，e2(f)为所述第二语音x2对应的频率f的信号能量，e3(f)为所述全向麦克风采集的第一路原始信号x3对应的频率f的信号能量；

24、结合所述控制因子计算掩膜值m(f,l)：

25、

26、其中，l为各语音信号对应的频域信号的帧数，f为所述语音信号的频率，β1为所述第一语音的控制因子，r(f,l)为所述语音信号的帧数为l、频率为f时的能量比值系数，α为0到1之间的任意常数。

27、进一步地，所述对所述原始信号处理得到第一语音包括：

28、利用波束形成算法对麦克风阵列采集的语音信号进行处理，得到所述目标拾音方向及其对侧混合的第一信号。

29、第二方面，本发明实施例还提供一种定向拾音系统，采用如上述任一所述的定向拾音方法，所述系统包括：

30、拾音设备，用于采集语音信号；所述拾音设备包含麦克风阵列和定向麦克风；所述麦克风阵列包括若干个全向麦克风；

31、阵列处理模块，用于对麦克风阵列采集的语音信号进行处理，得到目标拾音方向及其对侧混合的语音信号；

32、盲源分离模块，用于对所述麦克风阵列输出的语音信号和所述定向麦克风采集的语音信号进行盲源分离，得到所述目标拾音方向的目标语音。

33、进一步地，所述全向麦克风放置于垂直于所述目标拾音方向的平面内；

34、所述定向麦克风开口方向被配置为与目标拾音方向相反。

35、进一步地，所述系统还包括盲源分离控制参数模块，用于计算麦克风阵列采集的语音信号和定向麦克风采集的语音信号对应的控制因子。

36、第三方面，本发明实施例还提供一种电子设备，所述设备包括：

37、一个或多个处理器；

38、存储器，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得一个或多个处理器实现如上述任一所述的方法。

39、第四方面，本发明实施例还提供一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如上述任一所述的方法。

40、本发明的有益效果在于：本发明实施例提供的一种定向拾音方法，通过结合全向麦克风阵列及定向麦克风，能够解决现有技术中三维空间的定向拾音中由于某一维度无法布置麦克风阵列而导致无法实现该方向的定向拾音的问题，可以在某维度不设置麦克风阵列，实现该维度上的噪声抑制，提高在目标拾音方向所在的维度上的噪声抑制能力，提升定向拾音性能。同时，将了麦克风阵列采集的语音信号和定向麦克风采集的语音信号共同进行盲源分离，并配合相关的控制参数，有效提升盲源分离区分度。

41、上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，并可依照说明书的内容予以实施，以下以本发明的较佳实施例并配合附图详细说明如后。

技术特征：

1.一种定向拾音方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述第一语音和所述第二语音进行盲源分离处理，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一语音和所述第二语音计算对应的控制因子，包括：

4.根据权利要求2所述的方法，其特征在于，所述将所述控制因子映射为掩膜值，还包括：

5.根据权利要求1所述的方法，所述对所述原始信号处理得到第一语音包括：

6.一种定向拾音系统，采用如权利要求1至5所述的定向拾音方法，其特征在于，所述系统包括：

7.根据权利要求6所述的系统，其特征在于，所述全向麦克风放置于垂直于所述目标拾音方向的平面内；

8.根据权利要求6所述的系统，其特征在于，所述系统还包括盲源分离控制参数模块，用于计算麦克风阵列采集的语音信号和定向麦克风采集的语音信号对应的控制因子。

9.一种电子设备，其特征在于，所述设备包括：

10.一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1至5中任一所述的方法。

技术总结本发明属于智能语音技术领域，尤其涉及一种定向拾音方法、系统、设备及存储介质，所述方法包括：获取麦克风采集到的原始语音，对所述原始信号进行处理得到第一语音和第二语音；所述第一语音为麦克风阵列采集的目标拾音方向及对侧的语音信号，所述第二语音为定向麦克风采集的语音信号，其中，所述麦克风阵列由若干个全向麦克风组成；对所述第一语音和所述第二语音进行盲源分离处理，得到所述目标拾音方向的目标语音。采用本发明的方法，能够解决现有技术中三维空间的定向拾音中由于某一维度无法布置麦克风阵列而导致无法实现该方向的定向拾音的问题，可以在某维度不设置麦克风阵列，实现该维度上的噪声抑制，提升目标定向拾音性能。技术研发人员：郭鑫,邵雅婷受保护的技术使用者：思必驰科技股份有限公司技术研发日：技术公布日：2024/3/17