一种猪舍音频降噪方法、装置、设备及介质与流程
- 国知局
- 2024-06-21 11:56:22
本发明涉及深度学习,特别涉及一种猪舍音频降噪方法、装置、设备及介质。
背景技术:
1、目前在规模化养殖环境下,封闭式猪舍需要时刻进行单元通风来维持猪舍温度和空气质量。单元内风机在运行时产生的噪声较大,这对于一些智能声音监控设备的声音采集质量影响较大,严重影响了后续的声音监测任务。
2、传统的降噪方法可能涉及使用特定的降噪设备或传感器,这些设备不仅成本较高,而且难以适应不同环境下的噪声特征,限制了其在猪舍中的实际应用。因此,需要一种更有效、成本更低且适应性更强的方法来解决猪舍环境中的噪声问题。
3、综上,如何实现对包含不同环境下的噪声的猪舍音频进行合理降噪,无需布置多个降噪设备或传感器,减少成本是本领域有待解决的技术问题。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种猪舍音频降噪方法、装置、设备及介质,能够对包含不同环境下的噪声的猪舍音频进行合理降噪,无需布置多个降噪设备或传感器,减少成本。其具体方案如下:
2、第一方面,本技术公开了一种猪舍音频降噪方法,包括:
3、获取猪舍安静环境下的猪群声音以及猪舍未装猪群时的猪舍设备噪音;
4、将所述猪群声音和所述猪舍设备噪音按照预设信噪比例进行音频叠加以得到用于训练初始猪舍音频降噪模型的训练数据;
5、利用所述训练数据对所述初始猪舍音频降噪模型的编码器、双路径transformer掩蔽模块以及解码器进行训练,以得到用于对猪舍音频进行降噪的目标猪舍音频降噪模型;
6、将待降噪猪舍音频输入至所述目标猪舍音频降噪模型,通过所述目标猪舍音频降噪模型中的目标编码器对待降噪猪舍音频进行编码来提取和解耦高维待降噪猪舍音频信息,然后将所述高维待降噪猪舍音频信息送入所述目标猪舍音频降噪模型中的目标双路径transformer掩蔽模块,以利用目标双路径transformer掩蔽模块估计所述待降噪猪舍音频信息中目标猪群声音的目标掩蔽,将所述目标掩蔽与所述高维待降噪猪舍音频信息进行元素相乘后得到待解码目标猪群声音信号,将所述待解码目标猪群声音信号送入所述目标猪舍音频降噪模型中的目标解码器去解码,以重构并输出降噪后的目标猪群声音,实现猪舍音频降噪。
7、可选的,所述获取猪舍安静环境下的猪群声音以及猪舍未装猪群时的猪舍设备噪音,包括:
8、控制猪舍设备安静,以得到猪舍安静环境,并利用预设声音采集器采集所述猪舍安静环境下的猪群声音;其中,所述猪群声音包括:猪尖叫声、猪咳嗽声、猪喷嚏声;
9、通过所述预设声音采集器采集猪舍在未装猪群时的猪舍设备噪音;其中,所述猪舍设备噪音包括:风机声音、电机声音。
10、可选的,所述利用所述训练数据对所述初始猪舍音频降噪模型的编码器、双路径transformer掩蔽模块以及解码器进行训练,以得到用于对猪舍音频进行降噪的目标猪舍音频降噪模型之前,还包括:
11、基于stft操作层、四层卷积层、归一化层、激活函数构建初始猪舍音频降噪模型的编码器;
12、基于两组双路径transformer构建初始猪舍音频降噪模型的双路径transformer掩蔽模块;
13、基于四层卷积层和istft操作层构建初始猪舍音频降噪模型的解码器。
14、可选的,所述基于两组双路径transformer构建初始猪舍音频降噪模型的双路径transformer掩蔽模块,包括:
15、通过对两个transformer进行级联,以得到单组双路径transformer;
16、基于两个所述单组双路径transformer得到的所述两组双路径transformer构建初始猪舍音频降噪模型的双路径transformer掩蔽模块。
17、可选的,所述利用所述训练数据对所述初始猪舍音频降噪模型的编码器、双路径transformer掩蔽模块以及解码器进行训练,以得到用于对猪舍音频进行降噪的目标猪舍音频降噪模型,包括:
18、将所述训练数据输入至所述初始猪舍音频降噪模型,以便所述初始猪舍音频降噪模型中所述编码器的所述stft操作层对所述训练数据进行短时傅里叶变换,以得到所述训练数据的声音复数谱;将所述声音复数谱依次输入至所述编码器中的四层卷积层,以获取高维声音复数谱;将所述高维声音复数谱输入所述双路径transformer掩蔽模块,以通过交换特征维度捕捉时间维度和频率维度上的猪群声音特征,并通过所述双路径transformer掩蔽模块的激活函数输出猪群声音的掩蔽,然后将估计出的所述掩蔽与所述训练数据的高维声音复数谱进行元素相乘,以得到猪群声音训练信号,将所述猪群声音训练信号输入解码器的四层卷积层进行信号解码,以通过所述istft操作层重构出猪群声音,完成对所述初始猪舍音频降噪模型的训练,以得到包含目标编码器、目标双路径transformer掩蔽模块、目标解码器的目标猪舍音频降噪模型。
19、可选的,所述猪舍音频降噪方法,还包括:
20、通过包含均方误差损失函数和平均绝对误差损失函数的组合损失函数对所述初始猪舍音频降噪模型的迭代训练过程进行训练指导,直至满足预设训练停止条件为止,以获取所述目标猪舍音频降噪模型。
21、可选的,所述猪舍音频降噪方法,还包括:将目标猪舍音频降噪模型部署在声音采集设备的芯片或ai服务器端,以得到猪舍音频降噪设备。
22、第二方面,本技术公开了一种猪舍音频降噪装置,包括:
23、数据采集模块,用于获取猪舍安静环境下的猪群声音以及猪舍未装猪群时的猪舍设备噪音;
24、音频叠加模块,用于将所述猪群声音和所述猪舍设备噪音按照预设信噪比例进行音频叠加以得到用于训练初始猪舍音频降噪模型的训练数据;
25、模型训练模块,用于利用所述训练数据对所述初始猪舍音频降噪模型的编码器、双路径transformer掩蔽模块以及解码器进行训练,以得到用于对猪舍音频进行降噪的目标猪舍音频降噪模型;
26、音频降噪模块,用于将待降噪猪舍音频输入至所述目标猪舍音频降噪模型,通过所述目标猪舍音频降噪模型中的目标编码器对待降噪猪舍音频进行编码来提取和解耦高维待降噪猪舍音频信息,然后将所述高维待降噪猪舍音频信息送入所述目标猪舍音频降噪模型中的目标双路径transformer掩蔽模块,以利用所述目标双路径transformer掩蔽模块估计所述待降噪猪舍音频信息中目标猪群声音的目标掩蔽,将所述目标掩蔽与所述高维待降噪猪舍音频信息进行元素相乘后得到待解码目标猪群声音信号,将所述待解码目标猪群声音信号送入所述目标猪舍音频降噪模型中的目标解码器去解码,以重构并输出降噪后的目标猪群声音,实现猪舍音频降噪。
27、第三方面,本技术公开了一种电子设备,包括:
28、存储器,用于保存计算机程序;
29、处理器,用于执行所述计算机程序,以实现前述公开的猪舍音频降噪方法的步骤。
30、第四方面,本技术公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的猪舍音频降噪方法的步骤。
31、可见,本技术公开了一种猪舍音频降噪方法,包括:获取猪舍安静环境下的猪群声音以及猪舍未装猪群时的猪舍设备噪音;将所述猪群声音和所述猪舍设备噪音按照预设信噪比例进行音频叠加以得到用于训练初始猪舍音频降噪模型的训练数据;利用所述训练数据对所述初始猪舍音频降噪模型的编码器、双路径transformer掩蔽模块以及解码器进行训练,以得到用于对猪舍音频进行降噪的目标猪舍音频降噪模型;将待降噪猪舍音频输入至所述目标猪舍音频降噪模型,通过所述目标猪舍音频降噪模型中的目标编码器对待降噪猪舍音频进行编码来提取和解耦高维待降噪猪舍音频信息,然后将所述高维待降噪猪舍音频信息送入所述目标猪舍音频降噪模型中的目标双路径transformer掩蔽模块,以利用目标双路径transformer掩蔽模块估计所述待降噪猪舍音频信息中目标猪群声音的目标掩蔽,将所述目标掩蔽与所述高维待降噪猪舍音频信息进行元素相乘后得到待解码目标猪群声音信号,将所述待解码目标猪群声音信号送入所述目标猪舍音频降噪模型中的目标解码器去解码,以重构并输出降噪后的目标猪群声音,实现猪舍音频降噪。由此可见,将获取的猪群声音和猪舍设备噪音按照预设信噪比例进行音频叠加,通过人工调整信噪比例的方式来模拟不同环境下的包含猪舍噪音的训练数据,然后利用该训练数据对初始猪舍音频降噪模型中的编码器、双路径transformer掩蔽模块以及解码器进行训练,以得到能够识别并去除不同环境下猪舍噪音,以实现猪舍音频降噪的目标猪舍音频降噪模型;然后将待降噪猪舍音频输入至目标猪舍音频降噪模型,通过该模型中目标编码器首先对音频进行编码,来提取并解耦高维音频信息,然后将该高维音频信息送入目标双路径transformer掩蔽模块,以估计出高维音频信息中目标猪群声音的目标隐蔽,最后将该目标隐蔽与高维音频信息进行元素相乘,得到待解码目标猪群声音信号,最后将待解码目标猪群声音信号送入目标解码器去解码,以重构并输出降噪后的目标猪群声音,实现猪舍音频降噪。通过对大量猪舍环境下的音频数据进行学习和训练,以实现更有效、自适应的噪声降低,克服了猪舍环境复杂性、实现高效实时的处理等挑战,以有效地降低噪声干扰,提高猪舍录音设备的语音信号质量。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24593.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表