基于神经网络的WAV音频修复方法、设备及存储介质与流程
- 国知局
- 2024-06-21 11:33:10
本发明涉及音频修复领域,尤其涉及一种基于神经网络的wav音频修复方法、设备及存储介质。
背景技术:
1、随着多媒体技术的不断进步,人们对于音视频的要求越来越高,文件也越来越大。文件越大在数据传输过程中更加容易出现损坏。
2、当前音视频播放器按照标准流程播放wav音频文件的时候,如果wav头部信息损坏,wav音频文件就无法打开。而如果中间一部分丢失或损坏,就会导致后面一大段音频出现很多,虽然wav音频数据可以播放但是听起来全是噪音。目前常见的修复方式仅仅对音频头部进行样例替换修复,无法做到针对内容的修复,修复出来虽然能用播放器软件打开,但是容易出现音频听起来全是噪音,根本丧失了音频原本的意义。因此,针对当前wav文件的修复无法对wav实体数据进行修复导致音频数据播放为噪音的技术问题,需要一种新的技术来解决目前的问题。
技术实现思路
1、本发明的主要目的在于解决前wav文件的修复无法对wav实体数据进行修复导致音频数据播放为噪音的技术问题。
2、本发明第一方面提供了一种基于神经网络的wav音频修复方法,所述基于神经网络的wav音频修复方法包括:
3、接收待修复的wav音频数据;
4、解析所述wav音频数据中的音频数据块,得到解析结果;
5、根据所述解析结果和预置神经网络,对所述wav音频数据进行修复处理,生成修复后的wav音频数据。
6、可选的,在本发明第一方面的第一种实现方式中,所述解析所述wav音频数据中的音频数据块,得到解析结果包括:
7、读取所述wav音频数据的数据头,判断所述数据头是否损坏;
8、若数据头已损坏,则基于预置样例文件,对所述wav音频数据进行参考解码处理,得到音频编码数据;
9、若数据头未损坏,则对所述wav音频数据进行解码解析处理,得到音频编码数据;
10、利用所述音频编码数据,对所述wav音频数据进行数据块记录处理,得到音频数据块定位。
11、可选的,在本发明第一方面的第二种实现方式中,所述利用所述音频编码数据,对所述wav音频数据进行数据块记录处理,得到音频数据块定位包括:
12、基于所述音频编码数据,查询出所述wav音频数据中实体数据的初始位置和终止位置;
13、从所述初始位置至所述终止位置,对所述wav音频数据进行遍历数据块校验处理,得到音频数据块定位。
14、可选的,在本发明第一方面的第三种实现方式中,所述根据所述解析结果和预置神经网络,对所述wav音频数据进行修复处理,生成修复后的wav音频数据包括:
15、根据所述音频数据块定位和预置神经网络,对所述wav音频数据进行修复处理,得到修复后的音频数据块;
16、将所述音频编码数据组装为wav数据头,以及将所述修复后的音频数据块与所述wav数据头组装生成修复后的wav音频数据。
17、可选的,在本发明第一方面的第四种实现方式中,所述根据所述解析结果和预置神经网络,对所述wav音频数据进行修复处理,生成修复后的wav音频数据包括:
18、根据所述解析结果,对所述wav音频数据的实体数据进行转换处理,生成实体二维数据;
19、根据预置神经网络,对所述实体二维数据进行卷积线性组合处理,生成结果矩阵集;
20、根据预置激活函数,对所述结果矩阵集进行线性激活处理,生成判定结果;
21、根据所述判定结果,对所述wav音频数据进行片段恢复处理,生成修复后的wav音频数据。
22、可选的,在本发明第一方面的第五种实现方式中,所述根据预置激活函数,对所述结果矩阵集进行线性激活处理,生成判定结果包括:
23、根据预置sigmoid激活函数,对所述结果矩阵集进行线性激活处理,生成判定结果。
24、可选的,在本发明第一方面的第六种实现方式中,所述根据所述解析结果,对所述wav音频数据的实体数据进行转换处理,生成实体二维数据包括:
25、根据所述解析结果,对所述wav音频数据的实体数据进行傅里叶变换处理,生成频域实体数据;
26、将所述频域实体数据修改为对数幅度,生成频域二维数据;
27、根据预置标准化公式,对所述频域二维数据进行标准化处理,生成实体二维数据。
28、可选的,在本发明第一方面的第七种实现方式中,所述标准化公式包括:
29、
30、,其中,y为实体二维数据,x为频域二维数据,a为常数。
31、本发明第二方面提供了一种基于神经网络的wav音频修复设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于神经网络的wav音频修复设备执行上述的基于神经网络的wav音频修复方法。
32、本发明的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于神经网络的wav音频修复方法。
33、在本发明实施例中,在处理wav音频数据过程中,处理由于chunk数据损坏一部分导致音频播放全是噪音的情形,由于chunk数据损坏一部分导致音频播放全是噪音的情况下,能修复实体音频,解决了播放实体数据块损坏的wav音频数据播放声全为噪声的问题。
技术特征:1.一种基于神经网络的wav音频修复方法,其特征在于,包括步骤:
2.根据权利要求1所述的基于神经网络的wav音频修复方法,其特征在于,所述解析所述wav音频数据中的音频数据块,得到解析结果包括:
3.根据权利要求2所述的基于神经网络的wav音频修复方法,其特征在于,所述利用所述音频编码数据,对所述wav音频数据进行数据块记录处理,得到音频数据块定位包括:
4.根据权利要求3所述的基于神经网络的wav音频修复方法,其特征在于,所述根据所述解析结果和预置神经网络,对所述wav音频数据进行修复处理,生成修复后的wav音频数据包括:
5.根据权利要求1所述的基于神经网络的wav音频修复方法,其特征在于,所述根据所述解析结果和预置神经网络,对所述wav音频数据进行修复处理,生成修复后的wav音频数据包括:
6.根据权利要求5所述的基于神经网络的wav音频修复方法,其特征在于,所述根据预置激活函数,对所述结果矩阵集进行线性激活处理,生成判定结果包括:
7.根据权利要求5所述的基于神经网络的wav音频修复方法,其特征在于,所述根据所述解析结果,对所述wav音频数据的实体数据进行转换处理,生成实体二维数据包括:
8.根据权利要求7所述的基于神经网络的wav音频修复方法,其特征在于,所述标准化公式包括:
9.一种基于神经网络的wav音频修复设备,其特征在于,所述基于神经网络的wav音频修复设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的基于神经网络的wav音频修复方法。
技术总结本发明涉及音频修复领域,公开了一种基于神经网络的WAV音频修复方法、设备及存储介质。该方法包括:接收待修复的WAV音频数据;解析所述WAV音频数据中的音频数据块,得到解析结果;根据所述解析结果和预置神经网络,对所述WAV音频数据进行修复处理,生成修复后的WAV音频数据。在本发明实施例中,解决了前WAV文件的修复无法对WAV实体数据进行修复导致音频数据播放为噪音的技术问题。技术研发人员:朱金武,黄德安,陈子文,姜亚明受保护的技术使用者:深圳麦风科技有限公司技术研发日:技术公布日:2024/3/11本文地址:https://www.jishuxx.com/zhuanli/20240618/22197.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表