音频编解码系统的训练方法、编码方法、解码方法、装置与流程
- 国知局
- 2024-06-21 11:43:57
本技术涉及人工智能技术,尤其涉及一种音频编解码系统的训练方法、编码方法、解码方法、装置。
背景技术:
1、人工智能(ai,artificial intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
2、音频编解码技术是人工智能领域的重要应用之一,音频编解码技术是包括远程音视频通话在内的通信服务中的一项核心技术。语音编码技术,简单讲,就是使用较少的网络带宽资源去尽量多的传递语音信息。从香农信息论的角度来讲,语音编码是一种信源编码,信源编码的目的是在编码端尽可能的压缩我们想要传递信息的数据量,去掉信息中的冗余,同时在解码端还能够无损(或接近无损)的恢复出来。
3、相关技术中,音频编解码系统中的编码网络以及解码网络的训练周期很长,升级成本过高,无法满足用户需求。
技术实现思路
1、本技术实施例提供一种音频编解码系统的训练方法、编码方法、解码方法、装置,能够缩短音频编解码系统的训练周期。
2、本技术实施例的技术方案是这样实现的:
3、本技术实施例提供一种音频编解码系统的训练方法,包括:
4、获取第一音频编解码系统,其中,所述第一音频编解码系统包括第一编码网络以及第一解码网络,所述第一编码网络以及所述第一解码网络是通过第一音频样本训练得到的;
5、响应于针对所述第一编码网络的配置请求,确定与所述第一编码网络对应的待训练的第二编码网络;
6、基于所述待训练的第二编码网络对第二音频样本进行编码处理,得到所述第二音频样本的音频码流样本,并基于所述第一解码网络对所述音频码流样本进行解码处理,得到所述第二音频样本的合成音频样本;
7、基于所述合成音频样本更新所述待训练的第二编码网络的参数,得到训练后的第二编码网络。
8、本技术实施例提供一种音频编码方法,包括:
9、获取音频信号;
10、调用第一音频编解码系统中的训练后的第二编码网络,对所述音频信号进行编码处理,得到所述音频信号的第二编码特征,其中,所述第一音频编解码系统包括所述训练后的第二编码网络以及第一解码网络;
11、对所述音频信号的第二编码特征进行信号编码处理,得到所述音频信号的第二音频码流;
12、其中,第一音频码流与所述第二音频码流均能通过所述第一解码网络解码出所述音频信号对应的合成音频信号,所述第一音频码流是所述音频信号经过第一编码网络处理后得到的音频码流,所述训练后的第二编码网络是通过音频编解码系统的训练方法针对所述第一编码网络训练得到的。
13、本技术实施例提供一种音频解码方法,包括:
14、获取音频码流;
15、对所述音频码流进行信号解码处理,得到所述音频码流对应的编码特征估计值;
16、调用第一音频编解码系统中的第一解码网络,对所述编码特征估计值进行解码处理,得到所述音频码流对应的合成音频信号;
17、其中,所述第一音频编解码系统包括训练后的第二编码网络以及所述第一解码网络,所述音频码流是音频信号经过所述训练后的第二编码网络或第一编码网络处理后得到的,所述训练后的第二编码网络是通过音频编解码系统的训练方法针对所述第一编码网络训练得到的。
18、本技术实施例提供一种音频编解码系统的训练装置,包括:
19、第一获取模块,用于获取第一音频编解码系统,其中,所述第一音频编解码系统包括第一编码网络以及第一解码网络,所述第一编码网络以及所述第一解码网络是通过第一音频样本训练得到的;
20、确定模块,用于响应于针对所述第一编码网络的配置请求,确定与所述第一编码网络对应的待训练的第二编码网络;
21、训练模块,用于基于所述待训练的第二编码网络对第二音频样本进行编码处理,得到所述第二音频样本的音频码流样本,并基于所述第一解码网络对所述音频码流样本进行解码处理,得到所述第二音频样本的合成音频样本;
22、基于所述合成音频样本更新所述待训练的第二编码网络的参数,得到训练后的第二编码网络。
23、本技术实施例提供一种音频编码装置,包括:
24、第二获取模块,用于获取音频信号;
25、编码模块,用于调用第一音频编解码系统中的训练后的第二编码网络,对所述音频信号进行编码处理,得到所述音频信号的第二编码特征,其中,所述第一音频编解码系统包括所述训练后的第二编码网络以及第一解码网络;
26、信号编码模块,用于对所述音频信号的第二编码特征进行信号编码处理,得到所述音频信号的第二音频码流;
27、其中,第一音频码流与所述第二音频码流均能通过所述第一解码网络解码出所述音频信号对应的合成音频信号,所述第一音频码流是所述音频信号经过第一编码网络处理后得到的音频码流,所述训练后的第二编码网络是通过音频编解码系统的训练方法针对所述第一编码网络训练得到的。
28、本技术实施例提供一种音频解码装置,包括:
29、第三获取模块,用于获取音频码流;
30、信号解码模块,用于对所述音频码流进行信号解码处理,得到所述音频码流对应的编码特征估计值;
31、解码模块,用于调用第一音频编解码系统中的第一解码网络,对所述编码特征估计值进行解码处理,得到所述音频码流对应的合成音频信号;
32、其中,所述第一音频编解码系统包括训练后的第二编码网络以及所述第一解码网络,所述音频码流是音频信号经过所述训练后的第二编码网络或第一编码网络处理后得到的,所述训练后的第二编码网络是通过音频编解码系统的训练方法针对所述第一编码网络训练得到的。
33、本技术实施例提供一种电子设备,所述电子设备包括:
34、存储器,用于存储计算机程序或计算机可执行指令;
35、处理器,用于执行所述存储器中存储的计算机程序或计算机可执行指令时,实现本技术实施例提供的音频编解码系统的训练方法,或音频编码方法或音频解码方法。
36、本技术实施例提供一种计算机可读存储介质,存储有计算机可执行指令,被处理器执行时,实现本技术实施例提供的音频编解码系统的训练方法,或音频编码方法或音频解码方法。
37、本技术实施例提供一种计算机程序产品,包括计算机可执行指令,所述计算机可执行指令被处理器执行时实现本技术实施例提供的音频编解码系统的训练方法,或音频编码方法或音频解码方法。
38、本技术实施例具有以下有益效果:
39、由于在训练第二编码网络时,第一解码网络的参数不变,因此节省了针对第一解码网络的训练过程,相对于相关技术中同时训练第一解码网络以及待训练的第二编码网络,能够缩短音频编解码系统的训练周期,从而降低了音频编解码系统中编码网络的升级成本,以满足用户的实际应用需求;并且,固定第一解码网络的参数不变,训练第二编码网络,能够保证经过训练后的第二编码网络处理得到的码流,可以被第一解码网络正确解码,由于经过第一编码网络处理得到的码流,也可以被第一解码网络正确解码,因此保证了音频编解码系统的前向兼容性。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23191.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表