技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法  >  正文

一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法

  • 国知局
  • 2024-06-21 11:44:15

本发明属于水下目标分类,具体地说是一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法。

背景技术:

1、由于声呐的广泛应用,人们对水下目标的声音分类产生了较大的兴趣,特别是通过船舶在水下螺旋桨的声音来判断船舶的类型,因为通过声音分析船舶其一能够快捷识别出来往船只的类型,有助于提高港口对来往船只的管理效率,其二有助于改进船舶的设计,使其更安静或更高效,从而改善对海洋生态环境的影响;例如通过使用智能设备用来给海域中判别经过的船舶,可以极大的提高海洋工作人员的效率;因此,开发高精度的水下目标识别技术显得十分重要;从目前技术发展现状看,基于深度学习的水下目标识别是一种主流的水下目标识别方法,但仍存在两大主要挑战:一、水下目标类型复杂,不同原始船舶水下噪声信号原始特征区分度较低,同时海洋在不同季节因为洋流和季风等影响导致环境噪声影响较强,给后续分类标签任务造成困难;二、多数水下目标分类相关的神经网络参数规模较大,运算复杂,不适用于终端部署。

2、为此,本领域技术人员提出了一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法来解决背景技术提出的问题。

技术实现思路

1、为了解决上述技术问题,本发明提供一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,以解决现有技术中存在的问题。

2、一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,包括以下步骤:

3、s1、音频预处理:将多通道水下目标信号转化为固定通道数量并进行采样和标准化长度处理,得到处理过的音频数据;

4、s2、特征提取:对步骤s1输出的音频数据进行梅尔滤波并进行倒谱变换,输出mfcc特征向量;对s1输出的音频数据进行gammatone滤波,输出gfcc特征向量,然后对mfcc特征向量和gfcc特征向量进行处理,最后建立特征数据集并加载;

5、s3、构建4个不同卷积核大小的多尺度卷积层,批归一化层和卷积层:将s2提取的水下目标特征数据集输入多尺度卷积层进行特征提取,然后将提取后的特征数据进行处理;

6、s4、构建convnextv2层-卷积层模块,最大池化层:对s3提取的数据输入的convnextv2层-卷积层进行更复杂,更抽象的特征提取;构建最大池化层将提取的特征数据进行特征降维,并输出至下一层;

7、s5、构建多尺度注意力卷积模块,最大池化层、平均池化层和全连接层模块将s4输出的特征数据进行处理;

8、s6、训练阶段:将s5的输出结合标签信息进行训练,经过迭代达到最大次数后完成对多尺度卷积神经网络分类器结构和参数的优化训练;

9、s7、测试阶段:利用训练好的多尺度卷积神经网络分类器对测试样本数据集中的水声特征进行分类,得到测试分类结果。

10、优选的,目标信号包括水下目标声音,其包括渔船、拖网船、贻贝船、拖船、挖泥船,摩托艇、引航船、帆船、客运渡船、远洋班轮、滚装船和海洋环境噪声等。

11、优选的,所述音频预处理的具体描述如下:

12、s11、将原始水下目标信号转化为单通道信号;

13、s12、设置音频采样率为22050;

14、s13、标准化音频长度,截取所有音频信号时长均为1s,并对多余的部分进行填充。

15、优选的,在步骤s2中,所述对mfcc特征向量和gfcc特征向量进行处理具体描述如下:将获得的mfcc特征向量和gfcc特征向量分别计算二阶差分并拼接,对拼接过的mfcc特征向量和gfcc特征向量归一化处理;将处理过的mfcc特征向量和gfcc特征向量沿第1维度拼接。

16、优选的,mfcc使用线性的梅尔尺度滤波器组,提取过程包括:

17、1)数据预处理;

18、2)对信号进行快速傅里叶变换;

19、3)创建一组均匀覆盖频谱范围的三角形梅尔滤波器,计算每个滤波器与频谱的交叠区域,得到一系列能量值;

20、4)对梅尔频谱图进行对数转换,生成梅尔对数功率频谱图;

21、5)对取对数后的滤波器组能量值应用离散余弦变换(dct)后就可得到mfcc特征。

22、优选的,在步骤s3中,所述提取后的特征数据进行处理步骤为:将提取后的特征数据合并,将合并后的特征数据进行批归一化;经过批归一化之后进入卷积层进行特征降维,输出至下一层。

23、优选的,所述步骤s4具体描述如下:通过构建convnextv2层-卷积层模块,对s3提取的数据进行三次堆叠进行更复杂,更抽象的特征提取,并构建最大池化层进行特征降维。

24、优选的,所述步骤s5具体描述如下:构建多尺度注意力卷积模块,最大池化层、平均池化层和全连接层模块:将s4输出的特征数据进行关键特征选择,降维,非线性变化处理。

25、优选的,所述步骤s6中的多尺度卷积神经网络分类器结构和参数优化的训练次数在300次。

26、优选的,所述训练经网络分类器的损失函数定义为训练次数在300次时,得到的损失率与准确率逐渐趋于收敛。

27、与现有技术相比,本发明具有如下有益效果:

28、本发明通过将每类不同的水下目标信号实行mfcc特征和gfcc特征提取,对提取完的mfcc特征和gfcc特征分别进行二阶差分处理,然后分别拼接原来的特征数据和每次差分的特征数据;对处理后的mfcc特征和gfcc特征沿第1维度拼接,建立训练集和数据集并加载;构建多尺度卷积注意力神经网络模型,训练多尺度卷积注意力神经网络分类模型,完成分类识别;从水下目标声音中提取处理过的mfcc特征和gfcc特征,用于训练多尺度卷积注意力神经网络从而进行分类,对比于使用传统训练分类框架的水下目标声音分类方法,本发明所提方法准确率更高、消耗计算资源更少。

技术特征:

1.一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,其特征在于:包括以下步骤:

2.如权利要求1所述一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,其特征在于:在步骤s2中,所述对mfcc特征向量和gfcc特征向量进行处理具体描述如下:将获得的mfcc特征向量和gfcc特征向量分别计算二阶差分并拼接,对拼接过的mfcc特征向量和gfcc特征向量归一化处理;将处理过的mfcc特征向量和gfcc特征向量沿第1维度拼接。

3.如权利要求1所述一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,其特征在于:在步骤s3中,所述提取后的特征数据进行处理步骤为:将提取后的特征数据合并,将合并后的特征数据进行批归一化;经过批归一化之后进入卷积层进行特征降维,输出至下一层。

4.如权利要求1所述一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,其特征在于:所述步骤s4具体描述如下:通过构建convnextv2层-卷积层模块,对s3提取的数据进行三次堆叠进行更复杂,更抽象的特征提取,并构建最大池化层进行特征降维。

5.如权利要求1所述一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,其特征在于:所述步骤s5具体描述如下:构建多尺度注意力卷积模块,最大池化层、平均池化层和全连接层模块:将s4输出的特征数据进行关键特征选择,降维,非线性变化处理。

6.如权利要求1所述一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,其特征在于:所述步骤s6中的多尺度卷积神经网络分类器结构和参数优化的训练次数在300次。

7.如权利要求6所述一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,其特征在于:所述训练经网络分类器的损失函数定义为训练次数在300次时,得到的损失率与准确率逐渐趋于收敛。

技术总结本发明属于水下目标分类技术领域,提供了一种基于轻量化多尺度卷积注意力神经网络的水下目标声音自动分类方法,包括以下步骤:S1,将原始水下目标信号转化为单通道数量并进行采样和标准化长度处理;S2,对水下目标信号进行MFCC特征和GFCC特征提取,并分别对MFCC特征和GFCC特征二阶差分和拼接;将处理过MFCC特征和GFCC特征沿第一维度拼接后划分训练集和测试集;S3,构建轻量化多尺度卷积注意力神经网络模型,通过训练集优化轻量化多尺度卷积注意力神经网络神经元参数;再将训练好的神经网络用于水下目标测试集分类;对比于使用传统的训练分类框架水下目标分类方法,本发明所提方法准确率更高、适用性更广、消耗计算资源更少。技术研发人员:杨俊杰,张镇宇,谢峰,古宇宏,丁家辉,李彦杨,徐梧高,钟浩华,杨超受保护的技术使用者:广东工业大学技术研发日:技术公布日:2024/4/17

本文地址:https://www.jishuxx.com/zhuanli/20240618/23230.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。