一种飞机模拟器声音降噪方法、系统、设备及介质
- 国知局
- 2024-06-21 11:49:22
本发明涉及音频降噪领域,特别是涉及一种飞机模拟器声音降噪方法、系统、设备及介质。
背景技术:
1、现有的一种基于短时傅里叶变换的声音静噪方法,其方法包括设置频点进行采集,采集数据进行解调和滤波处理,选择分段长度并做短时傅里叶变换得到功率谱密度,将得到的数据与阈值进行比较,将处理结果送入上位机播放,能够更高效、更可靠和更高质量的实现声音静噪。该方法为利用短时傅里叶变化进行降噪的典型方法,求得数据的功率谱密度,更好地反映出声音信息的频率信息,从而更准确的区分有用信息和噪声,但其使用时对于不同长度,声调,音色,噪杂度的音频信号,其分段长度,阈值,滤波方式,kaiser窗,窗长度,fft长度以及跳跃长度等参数均有所不同,且差异巨大,需要通过人耳多次主观听取从而调整参数大小,效率低,在使用该方法时花费时间与精力长,十分繁琐。
2、除上述方法外,目前在处理降噪问题时,存在多种模型降噪算法,其大部分利用cnn神经网络来学习输入噪声音频和对应的干净音频之间的映射关系,模型算法的实现需要大量的成对存在的干净噪声音频信号与包含噪声的音频信号模型数据进行训练。通常,该网络由多个卷积层和池化层组成,用于提取音频的时域和频域特征。在训练过程中,网络通过对比同一频段的含噪音频与干净音频之间的信噪比、语音失真度、声道畸变等评估指标来进行含噪音频分解重构,使重构后的音频信号最大程度拟合于干净音频,以此进行模型的训练。大量模型训练完毕后,便可以用于降噪新的含噪音频。该方法首先来说需要大量处理同一频段的含噪音频与干净音频数据来供神经网络学习训练,在降噪任务中,获取成对的含噪音频与干净音频数据特别困难,通过得到干净音频,后期加噪的方式得到的音频数据对模型的训练效果也是十分有限,所以该方法的降噪效果很难保证。其次当训练数据有限时,深度学习模型容易过拟合,一旦对环境和数据进行替换,结果便会表现不佳。最后深度学习模型通常需要大量的计算资源进行训练和推理,对于降噪算法模型的建立则需要更多的计算资源,成本极高。因此,需要一种低成本且高效的降噪方法。
技术实现思路
1、本发明的目的是提供一种飞机模拟器声音降噪方法、系统、设备及介质,可实现低成本且高效的声音降噪。
2、为实现上述目的,本发明提供了如下方案。
3、一种飞机模拟器声音降噪方法,包括:获取飞机模拟器声音系统的声音数据;对所述声音数据进行分类,得到分类音频数据;将所述分类音频数据进行短时傅里叶变换处理,得到频谱帧;对所述频谱帧利用神经网络进行降噪处理,得到处理后的频谱帧;所述神经网络包括循环神经网络和深度q网络;对所述处理后的频谱帧进行逆短时傅里叶变换,得到降噪后的音频。
4、可选地,对所述声音数据进行分类,得到分类音频数据,具体包括:按照录音设备对声音数据进行分类,得到初始分类结果;对所述初始分类结果进行特征提取,得到特征数据;对所述特征数据进行标准化和归一化处理,得到标准音频信号;对所述标准音频信号进行主成分分析,得到分类音频数据。
5、可选地,对所述频谱帧利用神经网络进行降噪处理,得到处理后的频谱帧,具体包括:将所述频谱帧输入所述循环神经网络进行时序特征分析,得到音频数据的时序特征;将所述音频数据的时序特征输入所述深度q网络进行降噪处理,得到处理后的频谱帧。
6、本发明还提供一种飞机模拟器声音降噪系统,包括:获取模块,用于获取飞机模拟器声音系统的声音数据;分类模块,用于对所述声音数据进行分类,得到分类音频数据;短时傅里叶变换模块,用于将所述分类音频数据进行短时傅里叶变换处理,得到频谱帧;降噪模块,用于对所述频谱帧利用神经网络进行降噪处理,得到处理后的频谱帧;所述神经网络包括循环神经网络和深度q网络;逆短时傅里叶变换模块,用于对所述处理后的频谱帧进行逆短时傅里叶变换,得到降噪后的音频。
7、可选地,分类模块具体包括:分类单元,用于按照录音设备对声音数据进行分类,得到初始分类结果;特征提取单元,用于对所述初始分类结果进行特征提取,得到特征数据;标准化和归一化处理单元,用于对所述特征数据进行标准化和归一化处理,得到标准音频信号;主成分分析单元,用于对所述标准音频信号进行主成分分析,得到分类音频数据。
8、可选地,降噪模块具体包括:时序特征分析单元,用于将所述频谱帧输入所述循环神经网络进行时序特征分析,得到音频数据的时序特征;降噪单元,用于将所述音频数据的时序特征输入所述深度q网络进行降噪处理,得到处理后的频谱帧。
9、本发明还提供一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现所述的方法。
10、本发明还提供一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述的方法。
11、根据本发明提供的具体实施例,本发明公开了以下技术效果。
12、本发明对所述声音数据进行分类,得到分类音频数据;将所述分类音频数据进行短时傅里叶变换处理,得到频谱帧;对所述频谱帧利用神经网络进行降噪处理,得到处理后的频谱帧;所述神经网络包括循环神经网络和深度q网络;对所述处理后的频谱帧进行逆短时傅里叶变换,得到降噪后的音频。将短时傅里叶变换和神经网络结合对声音进行降噪处理,从而实现低成本且高效的声音降噪。
技术特征:1.一种飞机模拟器声音降噪方法,其特征在于,包括:
2.根据权利要求1所述的飞机模拟器声音降噪方法,其特征在于,对所述声音数据进行分类,得到分类音频数据,具体包括:
3.根据权利要求1所述的飞机模拟器声音降噪方法,其特征在于,对所述频谱帧利用神经网络进行降噪处理,得到处理后的频谱帧,具体包括:
4.一种飞机模拟器声音降噪系统,其特征在于,包括:
5.根据权利要求4所述的飞机模拟器声音降噪系统,其特征在于,分类模块具体包括:
6.根据权利要求4所述的飞机模拟器声音降噪系统,其特征在于,降噪模块具体包括:
7.一种电子设备,其特征在于,包括:
8.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至3中任意一项所述的方法。
技术总结本发明公开一种飞机模拟器声音降噪方法、系统、设备及介质,涉及音频降噪领域,方法包括获取飞机模拟器声音系统的声音数据;对所述声音数据进行分类,得到分类音频数据;将所述分类音频数据进行短时傅里叶变换处理,得到频谱帧;对所述频谱帧利用神经网络进行降噪处理,得到处理后的频谱帧;所述神经网络包括循环神经网络和深度Q网络;对所述处理后的频谱帧进行逆短时傅里叶变换,得到降噪后的音频。本发明能实现低成本且高效的声音降噪。技术研发人员:王黎静,李润豪,王小龙,赵彦锃,徐海鑫,蔡天旸,邹雨楠,章骏,邹佳莹受保护的技术使用者:北京航空航天大学技术研发日:技术公布日:2024/5/6本文地址:https://www.jishuxx.com/zhuanli/20240618/23763.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表