用于野外鸟类声音数据的智能降噪方法与流程
- 国知局
- 2024-06-21 11:37:36
本技术涉及语音处理,具体涉及用于野外鸟类声音数据的智能降噪方法。
背景技术:
1、随着社会的发展,人们对生态环境的保护意识逐渐增强,人们开始意识到许多野生鸟类以及它们的栖息地不加以进行保护,可能会导致越来越多的物种灭绝,所以人们逐渐开始借助科技的力量对野生鸟类的栖息环境、行为等各方面进行监测控制,结合先进的野生鸟类管理方法,对野生鸟类进行对应的监测保护。目前,大多采用生态系统ai声纹监测技术来监测野外鸟类行为,通过探索鸟类的生命活动来实现对鸟类的监测保护。
2、然而,在通过声音监测野外鸟类行为的过程中,鸟类栖息的环境也存在很多鸟鸣以外的声音,例如风声、水声等,这些声音对于监测对象而言属于噪声,若不及时进行降噪,则会对之后的鸟类监测产生影响。
3、传统技术中,通常会对采集到的鸟鸣音频数据利用vmd变分模态分解算法对音频进行分解,再利用维纳滤波进行去噪,然而vmd变分模态分解过程中的惩罚系数通常是先验值,而野外音频数据中包含的成分较多,且不同时段不同区域的音频特征不尽相同,利用先验惩罚系数进行模态分解容易导致过分解或分解不足,进而造成对鸟鸣音频数据去噪效果较差,无法准确地对野外鸟类行为进行监控。
技术实现思路
1、本技术提供用于野外鸟类声音数据的智能降噪方法,以解决鸟鸣音频数据去噪效果较差,无法准确地对野外鸟类行为进行监控的问题,所采用的技术方案具体如下:
2、本技术一个实施例提供了用于野外鸟类声音数据的智能降噪方法,该方法包括以下步骤:
3、获取鸟类音频信号数据;
4、根据鸟类音频信号数据获取每个时序区间的时域波形图,根据每个时序区间的时域波形图分别获取每个时序区间的时域波形图中每个上包络、每个下包络的包络带宽;根据每个时序区间的时域波形图中每个上包络、每个下包络的包络带宽获取每个时序区间的音频混叠突出指数;根据所有时序区间的音频混叠突出指数分别获取低混叠效应簇、高混叠效应簇的数据总数;
5、根据每个时序区间的时域波形图中波峰点的振幅特征获取每个时序区间的鸟鸣存在置信度;根据低混叠效应簇、高混叠效应簇的数据总数及所有时序区间的鸟鸣存在置信度获取模态分量惩罚调节系数;
6、根据模态分量惩罚调节系数获取下一次vmd信号分解时的惩罚系数,利用vmd变分模态分解算法基于所述惩罚系数获取去噪后的鸟类音频信号数据。
7、优选的,所述根据鸟类音频信号数据获取每个时序区间的时域波形图,根据每个时序区间的时域波形图分别获取每个时序区间的时域波形图中每个上包络、每个下包络的包络带宽的方法为:
8、将鸟类音频信号数据的采集时间中每个第一预设参数大小的区间作为一个时序区间;利用matlab软件对每个时序区间中的鸟类音频信号数据进行绘图得到每个时序区间的时域波形图,所述时域波形图的横轴为时间,纵轴为振幅;
9、对于每个时序区间,将时序区间的时域波形图中0振幅位置的横线作为0振幅分界线,通过0振幅分界线将时序区间的时域波形图进行分割得到时序区间的时域波形图中所有上包络与下包络;
10、将所述每个上包络、每个下包络与0振幅分界线的两个交点分别作为所述每个上包络、每个下包络的两个包络始末点,将所述每个上包络、每个下包络的两个包络始末点之间的长度分别作为时序区间的时域波形图中每个上包络、每个下包络的包络带宽。
11、优选的,所述根据每个时序区间的时域波形图中每个上包络、每个下包络的包络带宽获取每个时序区间的音频混叠突出指数的方法为:
12、根据每个时序区间的时域波形图获取每个时序区间的混叠波峰特征因子;
13、将每个时序区间作为第一目标时序区间,计算第一目标时序区间的混叠波峰特征因子与每个时序区间的混叠波峰特征因子之比的相反数,计算所述相反数与第二预设参数之和的绝对值在时序区间总数上累加和的均值,将以自然常数为底数,以所述均值为指数的映射结果作为第一乘积因子;
14、计算第一目标时序区间中所有上包络和下包络的包络带宽均值,将所述包络带宽均值与第一乘积因子的乘积作为第一目标时序区间的音频混叠突出指数。
15、优选的,所述根据每个时序区间的时域波形图获取每个时序区间的混叠波峰特征因子的方法为:
16、对于每个时序区间,计算时序区间的时域波形图中每个波峰点振幅与上一个波峰点振幅之差的绝对值,将所述绝对值在时序区间的时域波形图上的累加和作为分子;
17、将时序区间的时域波形图中每个波峰点对应的时间与上一个波峰点对应的时间之差的绝对值在所述时域波形图上的累加和作为第一求和因子,将第一求和因子与第三预设参数的和作为分母;
18、将分子与分母的比值作为时序区间的混叠波峰特征因子。
19、优选的,所述根据所有时序区间的音频混叠突出指数分别获取低混叠效应簇、高混叠效应簇的数据总数的方法为:
20、将所有时序区间的音频混叠突出指数组成的集合作为k-means聚类算法的输入,利用k-means聚类算法得到所有时序区间的音频混叠突出指数的聚类结果,所述聚类结果包含两个聚类簇;
21、计算所述聚类结果中每个聚类簇的音频混叠突出指数均值,将所述音频混叠突出指数均值的最小值对应的聚类簇作为低混叠效应簇,将所述音频混叠突出指数均值的最大值对应的聚类簇作为高混叠效应簇;
22、通过统计低混叠效应簇、高混叠效应簇中数据的数目分别得到低混叠效应簇、高混叠效应簇的数据总数。
23、优选的,所述根据每个时序区间的时域波形图中波峰点的振幅特征获取每个时序区间的鸟鸣存在置信度的方法为:
24、对于每个时序区间,将时序区间的时域波形图中所有波峰点振幅作为大津阈值法的输入,利用大津阈值法得到波峰点振幅分割阈值,将波峰点振幅大于等于波峰点振幅分割阈值的每个波峰点作为一个凸显波峰点,将波峰点振幅小于波峰点振幅分割阈值的每个波峰点作为一个普通波峰点;
25、根据每个时序区间的时域波形图中波峰点以及凸显波峰点获取每个时序区间的鸟鸣表征指数;
26、将每个时序区间的时域波形图中所有波峰点振幅按照时间升序的顺序组成的序列作为每个时序区间的波峰振幅数据序列;
27、计算每个时序区间的波峰振幅数据序列与上一个时序区间的波峰振幅数据序列之间的相似性度量结果,将所述相似性度量结果在时序区间总数上的累加和作为分子;
28、计算每个时序区间的鸟鸣表征指数与上一个时序区间的鸟鸣表征指数之差的绝对值,将所述绝对值在时序区间总数上累加和的均值与第三预设参数的和作为分母;
29、将分子与分母的比值作为每个时序区间的鸟鸣存在置信度。
30、优选的,所述根据每个时序区间的时域波形图中波峰点以及凸显波峰点获取每个时序区间的鸟鸣表征指数的方法为:
31、对于每个时序区间,计算时序区间的时域波形图中凸显波峰点数目与波峰点数目的比值,将以自然常数为底数,以所述比值为指数的映射结果作为第二乘积因子;
32、将时序区间的时域波形图中最大振幅作为分子;计算时序区间的时域波形图中所有凸显波峰点对应的时间的最大值和最小值的差值,将所述差值与第三预设参数的和作为分母;
33、将分子和分母的比值与第二乘积因子的乘积作为时序区间的鸟鸣表征指数。
34、优选的,所述根据低混叠效应簇、高混叠效应簇的数据总数及所有时序区间的鸟鸣存在置信度获取模态分量惩罚调节系数的方法为:
35、计算所有时序区间的鸟鸣存在置信度均值与第二预设参数的和,计算低混叠效应簇的数据总数与高混叠效应簇的数据总数之间的比值;将所述和与比值的乘积作为模态分量惩罚调节系数。
36、优选的,所述根据模态分量惩罚调节系数获取下一次vmd信号分解时的惩罚系数的方法为:
37、计算模态分量惩罚调节系数与第二预设参数的和,将所述和与预设初始惩罚系数的乘积作为下一次信号分解时的惩罚系数。
38、优选的,所述利用vmd变分模态分解算法基于所述惩罚系数获取去噪后的鸟类音频信号数据的方法为:
39、将鸟类音频信号数据作为vmd变分模态分解算法的输入,利用vmd变分模态分解算法基于下一次信号分解时的惩罚系数得到鸟类音频信号数据的模态分量;
40、将鸟类音频信号数据的模态分量作为维纳滤波算法的输入,利用维纳滤波算法获取去噪后鸟类音频信号数据的模态分量;
41、通过对去噪后鸟类音频信号数据的模态分量进行信号重构,得到去噪后的鸟类音频信号数据。
42、本技术的有益效果是:本技术通过野外音频数据中的声源来源多时产生混叠效应的时域特征以及鸟类存在鸣叫时的音频时域特征,构建音频混叠突出指数以及鸟鸣存在置信度,进而构建模态分量惩罚调节系数,进而改进vmd变分模态分解算法中的惩罚系数,解决了传统vmd变分模态分解算法中惩罚系数为先验设置而不能较好地区分当前模态分解状态的问题,同时解决了在对野外音频数据进行模态分解的过程中分解不准确、需要消耗更多时间和计算的缺点,进而提升在对野外鸟类的监测过程中对于采集到的鸟类音频信号数据的去噪效果。因此,本技术通过改进vmd变分模态分解算法中的惩罚系数,提高了对鸟类音频信号数据的去噪效果,更加准确地对野外鸟类行为进行监控。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22522.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表