基于音频信号处理的鸟类鸣声识别方法与流程
- 国知局
- 2024-06-21 11:58:33
本发明涉及语音处理,具体涉及基于音频信号处理的鸟类鸣声识别方法。
背景技术:
1、鸟鸣信号是一种高频信号,鸟鸣声通常能够传播到较远的距离外,且不同种鸟类的鸟鸣声之间具有一定的可区分性,因此现阶段常通过采集鸟鸣信号进行鸟类识别。得益于对大量数据优异的学习能力、特征提取能力,基于深度学习技术的各种识别模型在鸟鸣识别中广泛应用。
2、基于深度学习的鸟类鸣声识别模型在学习鸟鸣信号中的特征时,通常是对鸟鸣信号的特征图像进行学习,例如,鸟鸣信号的时域波形图、鸟鸣信号的频谱图、梅尔语谱图等等,然而,采集鸟鸣信号通常在室外,会受到许多环境噪声的干扰,例如交通声、风声、人声等。这些噪声会掩盖鸟类的声音特征,使识别变得困难。对鸟鸣信号进行去噪可以有效地降低环境噪声的影响,提高鸟鸣信号的清晰度,自适应滤波算法lms因算法简单且具有较好的稳定性被广泛应用,但自适应滤波算法lms需要通过不断迭代和更新滤波器系数逼近最优解,收敛速度较慢,且若步长参数选择不当,可能会导致算法无法收敛或收敛到错误的解,导致鸟鸣信号去噪效果差,进而鸟类鸣声识别准确率低。
技术实现思路
1、为了解决上述技术问题,本发明提供基于音频信号处理的鸟类鸣声识别方法,以解决现有的问题。
2、本发明的基于音频信号处理的鸟类鸣声识别方法采用如下技术方案:
3、本发明一个实施例提供了基于音频信号处理的鸟类鸣声识别方法,该方法包括以下步骤:
4、采集鸟鸣信号;
5、将鸟鸣信号的频谱图进行连通域提取得到各连通域;根据各连通域内的能量分布得到各连通域的受扰相对投影差值;根据各连通域内鸟鸣信号频率的相似性得到各连通域的频带信息差异系数;结合受扰相对投影差值及频带信息差异系数得到各连通域的相对信息依赖指数;根据鸟鸣信号中声门开启和声门闭合时间的差异得到鸟鸣信号各周期的声门开关时段突变值;根据鸟鸣信号高频区间内频谱的衰减程度得到鸟鸣信号各周期的谱线激励突兀指数;结合声门开关时段突变值及谱线激励突兀指数得到鸟鸣信号各周期的声门激励特征互信息指数;结合相对信息依赖指数及声门激励特征互信息指数得到鸟鸣信号各周期的收敛步长;根据鸟鸣信号各周期的收敛步长得到鸟鸣信号各周期的收敛因子;结合收敛因子、自适应滤波算法及神经网络模型完成鸟类鸣声识别。
6、优选的,所述根据各连通域内的能量分布得到各连通域的受扰相对投影差值,包括:
7、将鸟鸣信号频谱图中各连通域内的所有数据点按照频谱图中的位置信息构建能量矩阵,所述能量矩阵中的各元素为连通域内各数据点的能量值,利用radon变换获取能量矩阵在各投影角度下的投影值,将投影值最大值对应的角度作为各连通域的相对能量角度,将连通域内所有数据点在相对能量角度下的投影值组成的向量作为各连通域的相对趋势向量;
8、针对各连通域,计算相对趋势向量中所有元素的均值,计算连通域内各数据点的能量值与所述均值的差值绝对值,将各连通域内所有数据点的所述差值绝对值的均值作为各连通域的受扰相对投影差值。
9、优选的,所述根据各连通域内鸟鸣信号频率的相似性得到各连通域的频带信息差异系数,包括:
10、将鸟鸣信号频谱图中的频率均匀划分为预设数值个频带区域,利用sift算法计算各连通域内任意两频带区域间的相似度,将连通域内所有频带区域间的相似度中各个不相等的相似度作为一个相似度等级,将各连通域内所有相似度等级升序排列作为各连通域的频带平缓评估序列;
11、针对鸟鸣信号频谱图中的各连通域,计算各连通域与其他连通域之间的相对趋势向量的位方差,计算各连通域与其他连通域的频带平缓评估序列的dtw距离,计算所述dtw距离与所述位方差的乘积,将各连通域与所有其他连通域之间计算得到的所述乘积的均值作为各连通域的频带信息差异系数。
12、优选的,所述结合受扰相对投影差值及频带信息差异系数得到各连通域的相对信息依赖指数,包括:
13、计算鸟鸣信号频谱图中各连通域的受扰相对投影差值与所有连通域的受扰相对投影差值的均值的差值,将所述差值作为以自然常数为底数的指数函数的指数,记为第一指数函数,将各连通域的频带信息差异系数作为以自然常数为底数的指数函数的指数,记为第二指数函数,将所述第一指数函数与所述第二指数函数的和值的倒数作为各连通域的相对信息依赖指数。
14、优选的,所述根据鸟鸣信号中声门开启和声门闭合时间的差异得到鸟鸣信号各周期的声门开关时段突变值,包括:
15、利用vad端点检测算法获取鸟鸣信号的各有声信号区间,将有声信号区间的最小长度值作为时延,计算各帧鸟鸣信号在所述时延下的自相关函数,获取所述自相关函数峰值的位置及宽度,将各帧鸟鸣信号自相关函数峰值的宽度作为声门打开时段,将自相关函数峰值的右侧边界与最近邻自相关函数极小值间的时间间隔作为声门关闭时段;
16、鸟鸣信号各周期的声门开关时段突变值的表达式为:
17、
18、式中,是鸟鸣信号第t个周期的声门开关时段突变值,、、分别是鸟鸣信号第t-1个、第t个、第t+1个周期内声门打开时段的时长、、、分别是鸟鸣信号第t-1个、第t个、第t+1个周期内声门关闭时段的时长。
19、优选的,所述根据鸟鸣信号高频区间内频谱的衰减程度得到鸟鸣信号各周期的谱线激励突兀指数,包括:
20、计算鸟鸣信号各周期所有帧鸟鸣信号的所述声门打开时段的均值,记为第一均值,计算鸟鸣信号各周期所有帧鸟鸣信号的所述声门关闭时段的均值,记为第二均值,将所述第一均值与所述第二均值作为鸟鸣信号各周期的声门开关序数对,分别将所述第一均值、所述第二均值与对应周期长度的比值作为横、纵坐标,将所述横、纵坐标确定的坐标点作为各周期的映射点,将鸟鸣信号所有周期的所述映射点利用聚类算法得到各聚类簇;
21、利用python中的函数包获取各周期内各帧鸟鸣信号的滚降系数,将时间作为横轴,将滚降系数作为纵轴,将各帧鸟鸣信号的滚降系数进行曲线拟合作为鸟鸣信号各周期的谱线拟合曲线;
22、鸟鸣信号各周期的谱线激励突兀指数的表达式为:
23、
24、式中,是鸟鸣信号第t个周期的谱线激励突兀指数,是鸟鸣信号第t个周期的映射点所在聚类簇内映射点的数量,是鸟鸣信号第t个周期的映射点所在聚类簇内所有映射点间欧式距离的均值,、分别是鸟鸣信号第t个周期、第h个周期的谱线拟合曲线,是谱线拟合曲线、之间的dtw距离。
25、优选的,所述结合声门开关时段突变值及谱线激励突兀指数得到鸟鸣信号各周期的声门激励特征互信息指数,包括:
26、针对鸟鸣信号的各周期,获取对应频谱图中振幅极大值点的数量,计算所有所述振幅极大值的均值,计算谱线激励突兀指数、所述数量及所述均值的乘积,将所述乘积与声门开关时段突变值的比值作为鸟鸣信号各周期的声门激励特征互信息指数。
27、优选的,所述结合相对信息依赖指数及声门激励特征互信息指数得到鸟鸣信号各周期的收敛步长,包括:
28、针对鸟鸣信号的各周期,计算鸟鸣信号各周期内所有连通域的相对信息依赖指数的和值的归一化值,将所述归一化值、声门激励特征互信息指数的归一化值及1的和值作为鸟鸣信号各周期的收敛步长。
29、优选的,所述根据鸟鸣信号各周期的收敛步长得到鸟鸣信号各周期的收敛因子,表达式为:
30、
31、式中,是鸟鸣信号第t个周期的收敛因子,、b分别是预设收敛速度因子、预设滤波调参因子,是将鸟鸣信号第t个周期信号作为自适应滤波算法输入时的误差函数,是鸟鸣信号第t个周期的收敛步长。
32、优选的,所述结合收敛因子、自适应滤波算法及神经网络模型完成鸟类鸣声识别,包括:
33、将各周期鸟鸣信号的振幅按照时间升序排列作为各周期的信号序列,将鸟鸣信号各周期的收敛因子作为自适应滤波算法lms的改进参数,将各周期的信号序列作为自适应滤波算法lms的输入,得到各周期的优化信号,将所述优化信号作为神经网络模型的输入,输出为鸟类鸣声识别结果。
34、本发明至少具有如下有益效果:
35、本技术提出基于音频信号处理的鸟类鸣声识别方法,通过分析野外鸟鸣信号频谱图中各频带之间的独立性,以及各个连通域之间图像信息依赖的程度构建相对信息依赖指数,其有益效果在于能够降低频谱图中连通域内任何一个频率上存在噪声成分对鸟鸣信号频率之间原有变化趋势的影响;其次通过每个周期鸟鸣信号对应时间段内声门激励状态的变化程度构建每个周期的声门激励特征互信息指数;基于每个周期的声门激励特征互信息指数以及每个周期鸟鸣信号频谱图内连通域的相对信息依赖指数自适应的确定每个周期滤波时的收敛因子,其有益效果在于解决传统lms算法的步长因子固定,使得收敛速度和稳态误差两方面性能难以平衡,算法的滤波性能较差,造成野外鸟鸣信号识别准确率的问题。本技术具有鸟鸣信号去噪效果自然、清晰,鸟类鸣声识别准确率高的有益效果。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24825.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。