用于生态音频信息的滤波增强方法与流程
- 国知局
- 2024-06-21 11:37:46
本技术涉及语音处理,具体涉及用于生态音频信息的滤波增强方法。
背景技术:
1、随着社会的发展,人们对生态环境的保护意识逐渐增强,人们开始意识到许多野生鸟类以及它们的栖息地不加以进行保护,可能会导致越来越多的物种灭绝,所以人们不断加强对鸟类的监控保护。目前,大多采用生态系统ai声纹监测技术,通过在野外环境中布置的声纹感知设备对鸟类音频信息进行监测,通过鸟类音频信息实现对鸟类的监控保护。
2、由于声纹感知设备设置的位置不一,鸟类的活动范围较大,在采集音频数据的过程中鸟类音频信息较弱,导致鸟类音频信息难以分辨,通常需要采用卡尔曼滤波、维纳滤波等滤波增强方法,提高鸟鸣在音频中的辨识度。
3、另外,能够表现鸟类的音频数据除了鸟鸣以外,实际上还有环境噪声的相关音频信息,这些环境噪声的相关音频信息通常会影响鸟鸣在音频中的辨识度,在对音频数据去噪的过程中需要将其当做噪声进行剔除。但是,传统的滤波增强算法对鸟类音频信息的滤波增强效果较差,进而对鸟类鸣叫的检测产生误判。比如,传统的维纳滤波算法中平滑系数,缺乏分析环境噪声对音频的影响,平滑系数的准确性较低,导致鸟类音频信息的滤波增强效果较差。
技术实现思路
1、本技术提供用于生态音频信息的滤波增强方法,以解决鸟类音频信息的滤波增强效果较差的问题,所采用的技术方案具体如下:
2、本技术一个实施例提供了用于生态音频信息的滤波增强方法,该方法包括以下步骤:
3、获取鸟类音频信号数据;
4、根据鸟类音频信号数据获取每个时序区间的频域波形图,根据每个时序区间的频域波形图获取每个时序区间的频域波形图内所有的频率分量波峰点及震荡拖尾波峰点;根据所述频率分量波峰点及震荡拖尾波峰点获取每个时序区间的频域波形图内每个频率分量波峰点的震荡拖尾效应特征序列以及每个时序区间的频域波形图内每个频率分量波峰点的带宽;根据每个时序区间的频域波形图内每个频率分量波峰点的震荡拖尾效应特征序列以及每个时序区间的频域波形图内每个频率分量波峰点的带宽获取鸟类音频信号数据的噪声受扰指数;
5、根据鸟类音频信号数据获取所有的鸟鸣存在时序区间以及生态环境音频时序区间;根据鸟鸣存在时序区间以及生态环境音频时序区间获取鸟类音频信号数据的风声干扰调整系数;根据鸟类音频信号数据的噪声受扰指数及风声干扰调整系数获取维纳滤波平滑调整系数;
6、根据维纳滤波平滑调整系数获取维纳滤波平滑系数,利用维纳滤波算法基于维纳滤波平滑系数获取滤波增强后的鸟类音频信号数据。
7、优选的,所述根据鸟类音频信号数据获取每个时序区间的频域波形图,根据每个时序区间的频域波形图获取每个时序区间的频域波形图内所有的频率分量波峰点及震荡拖尾波峰点的方法为:
8、将鸟类音频信号数据的采集时间中每个第一预设参数的区间作为一个时序区间;
9、将每个时序区间内的鸟类音频信号数据作为傅里叶变换的输入,利用傅里叶变换得到每个时序区间的频域数据;利用matlab软件对每个时序区间的频域数据进行绘图得到每个时序区间的频域波形图,所述频域波形图的横轴为频率,纵轴为频域能量;
10、对于每个时序区间的频域波形图,将频域波形图中所有的波峰点的频域能量作为大津阈值法的输入,利用大津阈值法得到划分阈值;将频域波形图中频域能量大于等于划分阈值的每个波峰点作为一个频率分量波峰点,将频域波形图中频域能量小于划分阈值的每个波峰点作为一个震荡拖尾波峰点。
11、优选的,所述根据所述频率分量波峰点及震荡拖尾波峰点获取每个时序区间的频域波形图内每个频率分量波峰点的震荡拖尾效应特征序列以及每个时序区间的频域波形图内每个频率分量波峰点的带宽的方法为:
12、将每个时序区间的频域波形图中每个频率分量波峰点作为目标频率分量波峰点,将目标频率分量波峰点与下一个频率分量波峰点之间的所有震荡拖尾波峰点按照频率升序的顺序组成的序列作为目标频率分量波峰点的震荡拖尾效应特征序列;
13、对于每个时序区间的频域波形图,将频域波形图中所有频率分量波峰点的最小频域能量的第二预设参数倍的频域能量作为带宽构建能量,将带宽构建能量所在横向直线穿过每个频率分量波峰点对应的波形的宽度作为频域波形图内每个频率分量波峰点的带宽。
14、优选的,所述根据每个时序区间的频域波形图内每个频率分量波峰点的震荡拖尾效应特征序列以及每个时序区间的频域波形图内每个频率分量波峰点的带宽获取鸟类音频信号数据的噪声受扰指数的方法为:
15、对于每个时序区间的频域波形图,将频域波形图中每个频率分量波峰点的频域能量与每个频率分量波峰点的震荡拖尾效应特征序列内所有震荡拖尾波峰点的频域能量均值的差值作为分子;计算频域波形图中每个频率分量波峰点的频域能量与所有频率分量波峰点的频域能量均值之差的绝对值,将所述绝对值与第三预设参数的和作为分母;将分子与分母之比的绝对值在频域波形图上累加和的均值作为时序区间的频谱能量差异指数;
16、根据每个时序区间的频谱能量差异指数获取每个时序区间的音频受噪因子;
17、将所述频谱能量差异指数与音频受噪因子的和在所有时序区间上累加和的均值作为鸟类音频信号数据的噪声受扰指数。
18、优选的,所述根据每个时序区间的频谱能量差异指数获取每个时序区间的音频受噪因子的方法为:
19、对于每个时序区间的频域波形图,将时序区间的频谱能量差异指数作为分子;
20、计算频域波形图中每个频率分量波峰点的带宽与所有频率分量波峰点的带宽均值之差的绝对值,计算所述绝对值在频域波形图上的累加和,将所述累加和与频域波形图中基频频率的频域能量的乘积作为分母;
21、将分子与分母的比值作为时序区间的音频受噪因子。
22、优选的,所述根据鸟类音频信号数据获取所有的鸟鸣存在时序区间以及生态环境音频时序区间的方法为:
23、将鸟类音频信号数据中所有音频信号的幅值作为大津阈值法的输入,利用大津阈值法得到鸟鸣音频划分阈值;
24、计算每个时序区间内鸟类音频信号数据中所有音频信号的幅值均值,将所述幅值均值大于等于鸟鸣音频划分阈值的每个时序区间作为一个鸟鸣存在时序区间,将所述幅值均值小于鸟鸣音频划分阈值的每个时序区间作为一个生态环境音频时序区间。
25、优选的,所述根据鸟鸣存在时序区间以及生态环境音频时序区间获取鸟类音频信号数据的风声干扰调整系数的方法为:
26、将每个生态环境音频时序区间作为目标生态环境音频时序区间,当目标生态环境音频时序区间对应的音频受噪因子小于等于上一个时序区间的音频受噪因子时,将目标生态环境音频时序区间的频域波形图中频率分量波峰点总数作为目标生态环境音频时序区间的鸟类行为音频权重因子;当目标生态环境音频时序区间对应的音频受噪因子大于上一个时序区间的音频受噪因子时,计算目标生态环境音频时序区间对应的音频受噪因子与上一个时序区间的音频受噪因子的差值,将所述频率分量波峰点总数与差值的和作为目标生态环境音频时序区间的起风音频权重因子;
27、根据目标生态环境音频时序区间的起风音频权重因子获取目标生态环境音频时序区间的风声干扰程度指数;
28、将所有生态环境音频时序区间对应的风声干扰程度指数的均值作为鸟类音频信号数据的风声干扰调整系数。
29、优选的,所述根据目标生态环境音频时序区间的起风音频权重因子获取目标生态环境音频时序区间的风声干扰程度指数的方法为:
30、计算每个生态环境音频时序区间的内鸟类音频信号数据中所有音频信号的幅值均值,计算目标生态环境音频时序区间对应的幅值均值与每个生态环境音频时序区间对应的幅值均值之差的绝对值,将以自然常数为底数,以所述绝对值在生态环境音频时序区间总数上的累加和为指数的映射结果作为第一求和因子;
31、将目标生态环境音频时序区间的起风音频权重因子作为分子;计算目标生态环境音频时序区间的最大振幅点与每个鸟鸣存在时序区间的最大振幅点之间的度量距离,将所述度量距离在鸟鸣存在时序区间总数上的累加和作为分母;
32、将分子和分母的比值与第一求和因子的和作为目标生态环境音频时序区间的风声干扰程度指数。
33、优选的,所述根据鸟类音频信号数据的噪声受扰指数及风声干扰调整系数获取维纳滤波平滑调整系数的方法为:
34、计算鸟类音频信号数据的噪声受扰指数与风声干扰调整系数的乘积,将所述乘积作为维纳滤波平滑调整系数。
35、优选的,所述根据维纳滤波平滑调整系数获取维纳滤波平滑系数,利用维纳滤波算法基于维纳滤波平滑系数获取滤波增强后的鸟类音频信号数据的方法为:
36、计算维纳滤波平滑调整系数与第四预设参数的和,将所述和与预设平滑系数的乘积作为维纳滤波平滑系数;
37、将鸟类音频信号数据、维纳滤波平滑系数分别作为维纳滤波算法的输入,利用维纳滤波算法获取滤波增强后的鸟类音频信号数据。
38、本技术的有益效果是:通过野外音频数据受噪声干扰的频域特征以及分析风声干扰的行为活动声音,构建音频数据的噪声受扰指数以及风声干扰调整系数,进而构建维纳滤波平滑调整系数,改进维纳滤波算法中的平滑系数,使得维纳滤波算法可以自适应地根据野外音频的噪声情况以及风声干扰音频的存在情况进行平滑系数地调整,在保留鸟类行为音频的基础上去除更多的噪声,获得更为精确的野外鸟类音频,进而为后续的野外鸟类自动监测提供更为准确的数据支持。因此,本技术通过自适应维纳滤波平滑系数,提高了对鸟类音频信号数据的滤波增强效果。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22535.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表