音频处理方法和电子设备与流程
- 国知局
- 2024-06-21 11:42:43
本发明涉及音频处理,尤其涉及一种音频处理方法和电子设备。
背景技术:
1、在现有技术中,通常使用训练后的音频处理模型(例如,卷积神经网络(convolutional neural networks,cnn)、循环神经网络(recurrent neural network,rnn)、长短期记忆网络(long short term memory,lstm)等模型)对音频信号进行处理以实现不同功能(例如,音频识别、噪声抑制、语音增强等功能)。其中,为了提高音频处理模型的鲁棒性,需要使用大量的音频训练数据进行训练,以得到音频处理模型。因此,如何获取音频训练数据成为了亟待解决的问题。
2、目前,为了获得不同场景下(例如,商场、楼宇、街道等场景)的音频训练数据,通常模拟不同场景来搭建专用的测试环境(例如,搭建录音室、录音房等),以在测试环境中模拟并采集所需的音频训练数据。然而,现有技术中搭建不同场景的测试环境来获取音频训练数据的方式局限性较大,且适用性较低。
技术实现思路
1、有鉴于此,本发明实施例提供一种音频处理方法和电子设备,可以根据初始音频信号生成训练音频数据,具有较高的适用性。
2、第一方面,本发明实施例提供了一种音频处理方法,所述方法包括:
3、获取多个初始音频信号;
4、对至少一个所述初始音频信号进行预定处理生成增强音频数据集,所述预定处理包括音频融合处理,和/或,混音处理;
5、对所述增强音频数据集中的音频信号与预设音频信号进行混响处理以生成训练音频数据。
6、第二方面,本发明实施例提供了一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。
7、第三方面,本发明实施例提供了一种电子设备,所述电子设备包括:
8、存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。
9、本发明实施例通过获取多个初始音频信号,然后对至少一个初始音频信号进行预定处理生成增强音频数据集,预定处理包括音频融合处理,和/或,混音处理。进而对增强音频数据集中的音频信号与预设音频信号进行混响处理以生成训练音频数据。由此,可以根据初始音频信号生成训练音频数据,具有较高的适用性。
技术特征:1.一种音频处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述增强音频数据集包括第一增强音频,所述对至少一个所述初始音频信号进行预定处理生成增强音频数据集包括:
3.根据权利要求1所述的方法,其特征在于,所述增强音频数据集包括第二增强音频,所述对至少一个所述初始音频信号进行预定处理生成增强音频数据集包括:
4.根据权利要求3所述的方法,其特征在于,所述增强音频数据包括第三增强音频,所述对至少一个所述初始音频信号进行预定处理生成增强音频数据集还包括:
5.根据权利要求1所述的方法,其特征在于,多个所述初始音频信号包括房间冲激响应和预设噪声信号,所述增强音频数据集包括第四增强音频,所述方法还包括:
6.根据权利要求1所述的方法,其特征在于,所述对所述增强音频数据集中的音频信号与预设音频信号进行混响处理以生成训练音频数据包括:
7.根据权利要求1所述的方法,其特征在于,所述对所述增强音频数据集中的音频信号与预设音频信号进行混响处理以生成训练音频数据包括:
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
9.一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-8中任一项所述的方法。
10.一种电子设备,其特征在于,所述电子设备包括:
技术总结本发明实施例公开了一种音频处理方法和电子设备,通过获取多个初始音频信号,然后对至少一个初始音频信号进行预定处理生成增强音频数据集,预定处理包括音频融合处理,和/或,混音处理。进而对增强音频数据集中的音频信号与预设音频信号进行混响处理以生成训练音频数据。由此,可以根据初始音频信号生成训练音频数据,具有较高的适用性。技术研发人员:赵伟康,廖廷康,李志飞受保护的技术使用者:出门问问创新科技有限公司技术研发日:技术公布日:2024/4/17本文地址:https://www.jishuxx.com/zhuanli/20240618/23076.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表