技术新讯 > 测量装置的制造及其应用技术 > 一种基于双级搜索MVDR的远场多声源快速定位方法  >  正文

一种基于双级搜索MVDR的远场多声源快速定位方法

  • 国知局
  • 2024-08-05 12:00:38

本发明涉及音频识别、声源定位,特别是一种基于双级搜索mvdr的远场多声源快速定位方法。

背景技术:

1、随着硬件计算能力的提升和算法精准度的进步,声源定位技术在解决复杂环境中的定位问题方面变得日益得心应手,已经渗透到从消费级应用、工业应用到军用的各个层面,从空中侦察、海洋探测到工业故障诊断,再到智能家居系统、智能穿戴设备和远程视频会议系统,都有声源定位技术的参与。然而由于音频信号属于宽带信号,传统的窄带信号定位方法并不适用。

2、解决宽带非相干音频信号定位的常规方法是将宽带声源在频域内分解为多个窄带分量,对每个子带直接进行窄带处理,通过遍历大量的方位角、俯仰角,得到每个频率点所对应子带的空间谱密度矩阵。还有研究使用了广义互相关法,忽略频域上的限制,直接对时域信号进行计算,对于环境噪声具有一定鲁棒性。然而,当声源位于阵列范围之外的较远场地时,该方法的定位精度会大大降低,且对于混响环境,该方法的性能无法保持。可见,对宽带音频信号的定位,已有的处理方法通常面临如下问题:(1)基于频域分解的传统远场定位方法计算复杂度较高,单次定位时间较长;(2)基于广义互相关的方法不适用于距离阵列中心较远的声源定位,而实际声源通常无法确定距离,因此效果不稳定。

技术实现思路

1、本发明的目的在于提供一种定位精度高、鲁棒性强、计算复杂度低、实现成本低的基于双级搜索mvdr的远场多声源快速定位方法。

2、实现本发明目的的技术解决方案为:一种基于双级搜索mvdr的远场多声源快速定位方法,包括以下步骤:

3、步骤1、使用声源识别定位系统获取单声道音频数据,使用短时傅里叶变换对单声道音频数据进行低通滤波;

4、步骤2、对单声道音频数据进行静态mfcc特征提取、一阶差分mfcc特征提取和过零点特征提取,并对两种特征进行融合;

5、步骤3、预训练基于bp网络的分类矩阵组,将融合特征送入训练好的基于bp网络的分类矩阵组,输出声源类别,将音频数据fft结果和预置声源类别对应频率区间进行对比,确定用于mvdr计算的频率;

6、步骤4、使用六阵元均匀圆阵列的所有麦克风进行同步数据采集,计算声音数据协方差矩阵,执行双级搜索mvdr快速算法,实现俯仰角、方位角估计。

7、本发明与现有技术相比,其显著优点为:(1)利用声源识别模块输出信息决定用于定位算法的频率,避免了多次fft计算,对混响环境和范围外单频噪声干扰具有一定鲁棒性;(2)使用双级搜索mvdr方法作为定位算法,减少了多声源定位下鬼影出现概率;(3)计算量低,易于实现,工作稳定,可靠性高。

技术特征:

1.一种基于双级搜索mvdr的远场多声源快速定位方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于双级搜索mvdr的远场多声源快速定位方法,其特征在于,步骤1中的声源识别定位系统,包括数据处理模块、麦克风阵列模块和多声道adc模块;

3.根据权利要求2所述的基于双级搜索mvdr的远场多声源快速定位方法,其特征在于,所述麦克风阵列模块,采用六阵元均匀圆麦克风阵列。

4.根据权利要求3所述的基于双级搜索mvdr的远场多声源快速定位方法,其特征在于,步骤1中,使用声源识别定位系统获取单声道音频数据,使用短时傅里叶变换对单声道音频数据进行低通滤波,具体如下:

5.根据权利要求3所述的基于双级搜索mvdr的远场多声源快速定位方法,其特征在于,步骤2中,对单声道音频数据进行静态mfcc特征提取、一阶差分mfcc特征提取和过零点特征提取,并对两种特征进行融合,具体如下:

6.根据权利要求1所述的基于双级搜索mvdr的远场多声源快速定位方法,其特征在于,步骤3所述的预训练基于bp网络的分类矩阵组,将融合特征送入训练好的基于bp网络的分类矩阵组,输出声源类别,将音频数据fft结果和预置声源类别对应频率区间进行对比,确定用于mvdr计算的频率,具体如下:

7.根据权利要求1所述的基于双级搜索mvdr的远场多声源快速定位方法,其特征在于,步骤4所述的使用六阵元均匀圆阵列的所有麦克风进行同步数据采集,计算声音数据协方差矩阵,执行双级搜索mvdr快速算法,实现俯仰角、方位角定向,具体如下:

8.根据权利要求1所述的基于双级搜索mvdr的远场多声源快速定位方法,其特征在于,该方法用于实现适用于低算力主控的声源识别定位系统,所述方法包括声源识别模块和声源定位模块,其中:

技术总结本发明公开了一种基于双级搜索MVDR的远场多声源快速定位方法,该方法为:使用声源识别定位系统获取单声道音频数据,并对单声道音频数据进行低通滤波;对单声道音频数据进行静态MFCC特征提取和过零点特征提取,并对两种特征进行融合;预训练基于BP网络的分类矩阵组,将融合特征送入训练好的基于BP网络的分类矩阵组进行识别,将音频数据FFT结果和预置声源类别对应频率区间进行对比,确定用于MVDR计算的频率;使用六阵元均匀圆阵列的所有麦克风进行同步数据采集,计算声音数据协方差矩阵,执行双级搜索MVDR快速算法,实现俯仰角、方位角估计。本发明可以进行多声源的快速识别和定位,具有精确度高、计算量低、工作稳定、可靠性高的优点。技术研发人员:张拓,朱建良,薄煜明,王军,吴盘龙,刘宗凯,张贤椿,王超尘受保护的技术使用者:南京理工大学技术研发日:技术公布日:2024/8/1

本文地址:https://www.jishuxx.com/zhuanli/20240802/260605.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。