音频量化方法、装置、设备及存储介质与流程
- 国知局
- 2024-06-21 11:50:38
本公开实施例涉及音频处理,尤其涉及一种音频量化方法、装置、设备及存储介质。
背景技术:
1、端到端的神经网络编解码器通常包括编码器、量化器和解码器,其中,量化器是音频量化过程中重要的一个环节。量化器可以对编码器输出的音频特征信息进行量化。现有技术中,通常采用矢量量化(vector quantization,vq)或者残差矢量量化(residualvector quantization,rvq)两种方式进行量化。然而,现有的rvq精度较低,影响音频质量。
技术实现思路
1、本公开实施例提供一种音频量化方法、装置、设备及存储介质,可以提高音频量化的精度,从而提高音频质量。
2、第一方面,本公开实施例提供了一种音频量化方法,包括:
3、获取待处理音频帧的特征信息;
4、对所述特征信息按照如下方式进行n级量化处理,以获取目标量化信息:
5、对于第i级,基于参考信息从所述第i级对应的量化信息集中确定m个量化信息,作为候选量化信息;其中,所述量化信息集为量化信息的集合;所述量化信息为所述音频帧的量化值;n为量化的总级数,n为正整数,且n≥2;i为正整数,且1≤i≤n;参考信息为所述特征信息或者所述特征信息与前i-1级的候选量化信息之间的m个残差信息;m为正整数,且m≥2;
6、从第n级的m个候选量化信息中确定一个候选量化信息,作为第一目标量化信息;
7、从前n-1级中每一级的m个候选量化信息中确定与所述第一目标量化信息关联的一个候选量化信息,作为第二目标量化信息;其中,所述目标量化信息包括第一目标量化信息以及n-1个第二目标量化信息。
8、第二方面,本公开实施例还提供了一种音频量化装置,包括:
9、特征信息获取模块,用于获取待处理音频帧的特征信息;
10、量化处理模块,用于对所述特征信息进行n级量化处理,以获取目标量化信息;
11、所述量化处理模块包括:候选量化信息确定单元,用于对于第i级,基于参考信息从所述第i级对应的量化信息集中确定m个量化信息,作为候选量化信息;其中,所述量化信息集为量化信息的集合;所述量化信息为所述音频帧的量化值;n为量化的总级数,n为正整数,且n≥2;i为正整数,且1≤i≤n;参考信息为所述特征信息或者所述特征信息与前i-1级的候选量化信息之间的m个残差信息;m为正整数,且m≥2;
12、第一目标量化信息确定单元,用于从第n级的m个候选量化信息中确定一个候选量化信息,作为第一目标量化信息;
13、第二目标量化信息确定单元,用于从前n-1级中每一级的m个候选量化信息中确定与所述第一目标量化信息关联的一个候选量化信息,作为第二目标量化信息;其中,所述目标量化信息包括第一目标量化信息以及n-1个第二目标量化信息。
14、第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
15、一个或多个处理器;
16、存储装置,用于存储一个或多个程序,
17、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例所述的音频量化方法。
18、第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例所述的音频量化方法。
19、本公开实施例公开了一种音频量化方法、装置、设备及存储介质,获取待处理音频帧的特征信息;对所述特征信息按照如下方式进行n级量化处理,以获取目标量化信息:对于第i级,基于参考信息从所述第i级对应的量化信息集中确定m个量化信息,作为候选量化信息;其中,所述量化信息集为量化信息的集合;所述量化信息为所述音频帧的量化值;n为量化的总级数,n为正整数,且n≥2;i为正整数,且1≤i≤n;参考信息为所述特征信息或者所述特征信息与前i-1级的候选量化信息之间的m个残差信息;m为正整数,且m≥2;从第n级的m个候选量化信息中确定一个候选量化信息,作为第一目标量化信息;从前n-1级中每一级的m个候选量化信息中确定与所述第一目标量化信息关联的一个候选量化信息,作为第二目标量化信息;其中,所述目标量化信息包括第一目标量化信息以及n-1个第二目标量化信息。本公开实施例提供音频量化方法,在每一级量化处理时确定多个候选量化信息,可以降低获得的目标量化信息与待处理音频帧的特征信息间的误差,从而提高音频帧量化的精度。
技术特征:1.一种音频量化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对于第i级,基于参考信息从所述第i级对应的量化信息集中确定m个量化信息,作为候选量化信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述对于第i级,基于参考信息从所述第i级对应的量化信息集中确定m个量化信息,作为候选量化信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述对于第j级,获取所述特征信息与前j-1级候选量化信息间的m个残差信息,包括:
5.根据权利要求1所述的方法,其特征在于,所述从第n级的m个候选量化信息中确定一个候选量化信息,作为第一目标量化信息,包括:
6.根据权利要求1所述的方法,其特征在于,所述从前n-1级中每一级的m个候选量化信息中确定与所述目标量化信息关联的一个候选量化信息,作为第二目标量化信息,包括:
7.根据权利要求1所述的方法,其特征在于,若第i级中包括多个子级,则对于第i级,基于参考信息从所述第i级对应的量化信息集中确定m个量化信息,作为候选量化信息,包括:
8.一种音频量化装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-7中任一项所述的音频量化方法。
11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的音频量化方法。
技术总结本公开实施例提供了一种音频量化方法、装置、设备及存储介质。包括:获取待处理音频帧的特征信息;对所述特征信息按照如下方式进行N级量化处理,以获取目标量化信息:对于第i级,基于参考信息从所述第i级对应的量化信息集中确定M个量化信息,作为候选量化信息;从第N级的M个候选量化信息中确定一个候选量化信息,作为第一目标量化信息;从前N‑1级中每一级的M个候选量化信息中确定与所述第一目标量化信息关联的一个候选量化信息,作为第二目标量化信息。本公开实施例提供音频量化方法,在每一级量化处理时确定多个候选量化信息,可以降低获得的目标量化信息与待处理音频帧的特征信息间的误差,从而提高音频帧量化的精度。技术研发人员:蒋佳为,张德军,徐林平,肖益剑,丁飘,宋慎义受保护的技术使用者:抖音视界有限公司技术研发日:技术公布日:2024/5/10本文地址:https://www.jishuxx.com/zhuanli/20240618/23915.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表