技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种识别可靠性高的声音识别方法 > 正文

一种识别可靠性高的声音识别方法

国知局
2024-06-21 11:38:24

本发明涉及声音识别，具体涉及一种识别可靠性高的声音识别方法。

背景技术：

1、声源识别技术是利用传声器拾取语音信号，并用数字信号处理技术对其进行分析和处理，继而确定和跟踪声源。其在声源定位技术以及声源去噪技术领域具有广泛地应用，因为声源定位技术需要先对声源进行准确识别之后然后根据识别到的声源进行定位，若声源识别不准确将导致声音定位不准确。

2、在中国申请号为201510359707.6，公布日为2015.10.21的专利文献公开了一种基于声源阵列的定位方法，s1，采用五元麦克风阵列采集现场声音，对五元麦克风阵列中每个麦克风采集的声音信号进行预处理得到音频信号；s2，根据各麦克风之间的音频信号到达时间延迟和麦克风阵列的位置信息对音频信号进行声源的定位，计算出俯仰角、方位角和目标距离；s3，根据计算出的俯仰角、方位角和目标距离对定位跟踪装置进行移动和转向，到达声源位置。

3、该方法中仅仅通过声源进行自相关函数进行然后得到频谱，然后在频谱中去掉上一时刻的该声源的频谱，其并不能对实现对不同的设备获得的声源是否来自同一个频率进行确认，从而容易出现不同设备采集不同的声源然后进行识别，这样无法实现声源识别的可靠性。

技术实现思路

1、本发明提供一种识别可靠性高的声音识别方法，识别不同声源采集模块采集同一个时刻声音频谱的相关性；判断出不同声源采集模块采集的是否来自同一声源，使得识别可靠性高。

2、为达到上述目的，本发明的技术方案是：一种识别可靠性高的声音识别方法，包括以下步骤：

3、s1、在目标点上预设三个安装点，安装点位于声源的覆盖范围内；三个安装点在同一水平线上；在一安装点上安装第一声源采集模块，在另一安装点上安装第二声源采集模块，在又一安装点上安装第三声源采集模块。

4、s2、第一声源采集模块、第二声源采集模块和第三声源采集模块分别对声源的声音进行采集；并获取第一声源采集模块、第二声源采集模块和第三声源采集模块采集到的声音的频谱。

5、获取第一声源采集模块采集到声音的频谱；具体为，预设参考电压；将第一声源采集模块采集的声音信号输入到信号放大器中，然后将放大后的声音信号输入到模数转换器中；模数转换器将声压转换后的电信号的电压与参考电压进行比较，然后输出电平信号，通过电平信号得到声音的的频谱。

6、s3、设置不同噪声的频谱之间的相关系数阈值k。

7、s4、通过公式

8、

9、公式计算出第一声源采集模块采集的声音的频谱与第二声源采集模块采集的声音的频谱之间的第一相关系数r1、第二声源采集模块采集的声音的频谱与第三声源采集模块采集的声音的频谱之间的第二相关系数r2、第一声源采集模块采集的声音的频谱与第三声源采集模块采集的声音的频谱之间的第三相关系数r3；x1和x2为任一声源采集模块采集的声音的频谱，r为相关系数，ψ12为频域加权函数；τ为时间。

10、s5、判断第一相关系数r1、第二相关系数r2和第三相关系数r3是否都大于相关系数阈值k；若是，则进行s7；若否，则进行s6。

11、s6、判断第一声源采集模块采集的声音、第二声源采集模块采集的声音、第三声源采集模块采集的声音为不同声源；

12、s7、判断第一声源采集模块采集的声音、第二声源采集模块采集的声音、第三声源采集模块采集的声音为同一声源。

13、以上方法，通过第一声源采集模块采集到的声音的频谱与第二声源采集模块采集到的声音的频谱进行对比，判断第一声源采集模块采集到的声音和第二声源采集模块采集到的声音是否来自同一声源；通过第二声源采集模块采集到的声音的频谱与第三声源采集模块采集到的声音的频谱进行对比，判断第二声源采集模块采集到的声音和第三声源采集模块采集到的声音是否来自同一声源；通过第一声源采集模块采集到的声音的频谱与第三声源采集模块采集到的声音的频谱进行对比，判断第一声源采集模块采集到的声音和第三声源采集模块采集到的声音是否来自同一声源；这样能检测到目标点是否被多个声源覆盖。

14、通过第一声源采集模块直接生成声音的频谱，方法简单。将第一声源采集模块采集的声音信号转换为电压然后在于预设参考电压进行比较之后输出电平信号转换为频谱信号，这样做应该是为了通过电压进行比较确定生成声音频谱信号的可靠性。

15、进一步的，第一声源采集模块、第二声源采集模块和第三声源采集模块为mems传声器。以上方法，通过mems传声器对声音进行采集，可靠性高。

技术特征：

1.一种识别可靠性高的声音识别方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种识别可靠性高的声音识别方法，其特征在于：第一声源采集模块、第二声源采集模块和第三声源采集模块为mems传声器。

技术总结本发明提供一种识别可靠性高的声音识别方法，对第一声源采集模块、第二声源采集模块和第三声源采集模块采集到的声音的频谱进行相关性对比，判断第一声源采集模块采集的声音、第二声源采集模块采集的声音、第三声源采集模块采集采集的声音是否为同一声源；检测目标点是否被多个声源覆盖。技术研发人员：王蕊,吴子鹏,邵瀚弘,钟晓雄受保护的技术使用者：广州城市理工学院技术研发日：技术公布日：2024/3/24