技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频处理方法、装置、计算机设备和存储介质与流程 > 正文

音频处理方法、装置、计算机设备和存储介质与流程

国知局
2024-06-21 11:40:35

本申请涉及计算机，特别是涉及一种音频处理方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术：

1、随着计算机技术的发展，出现了音视频通话、直播、游戏、广播等需要传输音频数据的场景。发送端会将实时产生的音频数据包发送至接收端，接收端将音频数据包解码播放。由于发送端通过传输网络后会普遍存在时延、乱序、丢包等问题，接收端需要在收包环节加入音频缓冲区，用于缓存不同时刻传送过来的音频数据包，然后解码并播放出声音。

2、传统技术中，通常是音频缓冲区的累积数据量达到预设阈值时，会有数据包被无法继续缓存而被迫丢弃，这样容易导致音频有较大损伤、卡顿等问题，导致音频播放质量较低。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高音频播放质量的音频处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、本申请提供了一种音频处理方法，包括：

3、获取音频缓冲区的当前累积数据量和当前网络抖动值；

4、基于所述当前网络抖动值确定各个候选缓冲等级对应的累积数据量条件，基于所述当前累积数据量和所述累积数据量条件，从所述各个候选缓冲等级中确定所述音频缓冲区对应的目标缓冲等级；

5、基于所述目标缓冲等级确定目标数据包类型和所述目标数据包类型对应的目标压缩参数；

6、基于所述目标压缩参数，压缩所述音频缓冲区中属于所述目标数据包类型的音频数据包；所述音频缓冲区中的音频数据包用于解码播放。

7、本申请还提供了一种音频处理装置，包括：

8、数据获取模块，用于获取音频缓冲区的当前累积数据量和当前网络抖动值；

9、缓冲等级确定模块，用于基于所述当前网络抖动值确定各个候选缓冲等级对应的累积数据量条件，基于所述当前累积数据量和所述累积数据量条件，从所述各个候选缓冲等级中确定所述音频缓冲区对应的目标缓冲等级；

10、压缩参数确定模块，用于基于所述目标缓冲等级确定目标数据包类型和所述目标数据包类型对应的目标压缩参数；

11、数据包压缩模块，用于基于所述目标压缩参数，压缩所述音频缓冲区中属于所述目标数据包类型的音频数据包；所述音频缓冲区中的音频数据包用于解码播放。

12、本申请还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述音频处理方法所述的步骤。

13、本申请还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述音频处理方法所述的步骤。

14、本申请还提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述音频处理方法所述的步骤。

15、上述音频处理方法、装置、计算机设备、存储介质和计算机程序产品，获取音频缓冲区的当前累积数据量和当前网络抖动值；基于当前网络抖动值确定各个候选缓冲等级对应的累积数据量条件，基于当前累积数据量和累积数据量条件，从各个候选缓冲等级中确定音频缓冲区对应的目标缓冲等级；基于目标缓冲等级确定目标数据包类型和目标数据包类型对应的目标压缩参数；基于目标压缩参数，压缩音频缓冲区中属于目标数据包类型的音频数据包；音频缓冲区中的音频数据包用于解码播放。这样，音频缓冲区控制策略包括对音频缓冲区中特定类型的音频数据包进行特定压缩参数的压缩处理，从而为音频缓冲区节省出更多的存放空间，避免或减少音频数据包被丢弃。不同缓冲级别对应不同的音频缓冲区控制策略，能够灵活调整针对音频缓冲区的操作。通过当前网络抖动值设定不同缓冲级别的累积数据量条件，根据音频缓冲区的当前累积数据量和累积数据量条件确定音频缓冲区当前所处的缓冲等级，再采取相应的音频缓冲区控制策略，实现基于当前网络状态的音频缓冲区分级管理，能够根据当前网络状态灵活控制针对音频缓冲区的操作，保障音频播放质量，避免或减少音频延迟、音频损失严重的问题。

技术特征：

1.一种音频处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取音频缓冲区的当前累积数据量和当前网络抖动值，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据比较结果确定所述历史网络抖动值对应的调整方向，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于所述调整方向对所述历史网络抖动值进行调整，得到所述当前音频数据包对应的当前网络抖动值，包括：

5.根据权利要求4所述的方法，其特征在于，所述确定所述历史网络抖动值对应的调整比例为第一比例，包括：

6.根据权利要求5所述的方法，其特征在于，所述第一比例随着所述参考数据包类型的数据包占比的增加而增大。

7.根据权利要求2所述的方法，其特征在于，所述基于所述调整方向对所述历史网络抖动值进行调整，得到所述当前音频数据包对应的当前网络抖动值，包括：

8.根据权利要求1所述的方法，其特征在于，所述基于所述当前网络抖动值确定各个候选缓冲等级对应的累积数据量条件，基于所述当前累积数据量和所述累积数据量条件，从所述各个候选缓冲等级中确定所述音频缓冲区对应的目标缓冲等级，包括：

9.根据权利要求8所述的方法，其特征在于，所述基于所述当前网络抖动值确定参考累积数据量，包括：

10.根据权利要求9所述的方法，其特征在于，所述基于当前数据传输场景对应的调整权重，对所述当前网络抖动值进行调整，得到目标网络抖动值，包括：

11.根据权利要求1所述的方法，其特征在于，所述基于所述目标缓冲等级确定目标数据包类型和所述目标数据包类型对应的目标压缩参数，包括：

12.根据权利要求11所述的方法，其特征在于，所述基于所述目标缓冲等级确定目标类型数量，按照数据包类型对应的播放重要度从低到高，获取与所述目标类型数量匹配的各个数据包类型作为目标数据包类型，包括：

13.根据权利要求12所述的方法，其特征在于，所述无效声音数据包类型和所述语音数据包类型分别对应的目标压缩参数和目标缓冲等级呈正相关。

14.一种音频处理装置，其特征在于，所述装置包括：

15.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。

16.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。

17.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。

技术总结本申请涉及一种音频处理方法、装置、计算机设备、存储介质和计算机程序产品。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括：获取音频缓冲区的当前累积数据量和当前网络抖动值；基于当前网络抖动值确定各个候选缓冲等级对应的累积数据量条件，基于当前累积数据量和累积数据量条件，从各个候选缓冲等级中确定音频缓冲区对应的目标缓冲等级；基于目标缓冲等级确定目标数据包类型和目标数据包类型对应的目标压缩参数；基于目标压缩参数，压缩音频缓冲区中属于目标数据包类型的音频数据包；音频缓冲区中的音频数据包用于解码播放。采用本方法能够提高音频播放质量。技术研发人员：梁俊斌受保护的技术使用者：腾讯科技（深圳）有限公司技术研发日：技术公布日：2024/3/31