技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频处理方法、装置、设备、介质和计算机程序产品与流程  >  正文

音频处理方法、装置、设备、介质和计算机程序产品与流程

  • 国知局
  • 2024-06-21 11:49:45

本发明涉及计算机,特别涉及音频处理方法、装置、设备、介质和计算机程序产品。

背景技术:

1、现有对音频的码率控制方案主要针对实时直播场景,即,为了保证直播流畅性等目的,根据直播丢包或者带宽等实时网络条件进行码率的调整。而在点播场景中,出于对带宽成本的考虑,也需要对音频码率进行控制。然而,在点播场景中,由于不存在直播流畅性等要求,网络条件通常不是重点考虑对象,因此,上述针对直播场景的码率控制方案不适用于点播场景。

技术实现思路

1、本发明的目的在于提供音频处理方法、装置、设备、介质和计算机程序产品,不同于现有技术,本发明基于音频的垂类标签和特征信息,确定音频的码率,以最大化节省带宽。解决现有码率控制方案无法适用点播场景的问题。

2、本发明的实施方式公开了一种音频处理方法,用于电子设备,该方法包括:

3、确定音频对应的垂类标签;

4、确定该音频的特征信息;

5、基于该垂类标签和该特征信息,确定该音频的编码策略;

6、基于该编码策略选择相应的音频编码算法对该音频进行编码。

7、可选地,该垂类标签用于表示该音频的内容所属的垂类,该垂类标签包括:音乐类标签和非音乐类标签。

8、可选地,该特征信息包括:是否包含音乐特征的信息。

9、可选地,基于该垂类标签和该特征信息,确定该音频的编码策略包括:

10、该音频对应该音乐类标签或该音频的该特征信息包括包含音乐特征的信息的情况下,在多个编码策略中选定最高码率的编码策略。

11、可选地,

12、该非音乐类标签包括:语音类标签、生活类标签、户外类标签和影视类标签;

13、该特征信息还包括:直流分量特征的信息、风噪特征的信息、是否包含语音特征的信息和信噪比特征的信息。

14、可选地,该方法还包括对该音频进行预处理,包括:

15、对该音频进行线性均衡处理;

16、该音频对应该非音乐类标签、该音频的该特征信息包括具有直流分量的信息的情况下,对该音频进行去直流处理;

17、该音频对应该非音乐类标签、该音频的该特征信息包括具有风噪的信息的情况下,对该音频进行去风噪处理。

18、可选地,该编码策略包括高码率的编码策略、中码率的编码策略和低码率的编码策略。

19、可选地,基于该垂类标签和该特征信息,确定该音频的编码策略包括:

20、该音频对应该影视类标签的情况下,选定高码率的编码策略;

21、该音频对应该语音类标签的情况下,选定中码率的编码策略;

22、该音频对应该生活类标签或该户外类标签的情况下,选定低码率的编码策略。

23、可选地,基于该垂类标签和该特征信息,确定该音频的编码策略包括:

24、该音频的该特征信息包括不包含音乐特征的信息和包含语音特征的信息的情况下,选定中码率的编码策略;

25、该音频的该特征信息包括不包含音乐特征的信息和不包含语音特征的信息的情况下,选定低码率的编码策略。

26、本发明的实施方式公开了一种音频处理装置,该装置包括:

27、垂类确定模块,确定音频对应的垂类标签;

28、特征确定模块,确定该音频的特征信息;

29、策略确定模块,基于该垂类标签和该特征信息,确定该音频的编码策略;

30、编码模块,基于该编码策略选择相应的音频编码算法对该音频进行编码。

31、本发明的实施方式公开了一种音频处理设备,该设备包括存储有计算机可执行指令的存储器和处理器,当该指令被该处理器执行时,使得该设备实施根据本发明的实施方式的音频处理方法。

32、本发明的实施方式公开了一种计算机存储介质,在该计算机存储介质上存储有指令,当该指令在计算机上运行时,使得该计算机执行根据本发明的实施方式的音频处理方法。

33、本发明的实施方式公开了一种计算机程序产品,包括计算机可执行指令,该指令被处理器执行以实施根据本发明的实施方式的音频处理方法。

34、本发明实施方式与现有技术相比,主要区别及其效果在于:

35、在本发明中,基于垂类标签和特征信息,确定音频的编码策略;根据垂类和特征两个维度的融合,可以根据不同垂类和特征的音频的不同音质要求,差异化确定编码策略,以节省带宽,降低传输成本。

36、在本发明中,该音频对应该音乐类标签或该音频的该特征信息包括包含音乐特征的信息的情况下,在多个编码策略中选定最高码率的编码策略。由于音乐类音频对音质的要求较高,在垂类标签和特征信息中的一个确定该音频为音乐类的情况下,选择最高码率进行编码,以保证音质。

37、在本发明中,方法还包括对该音频进行预处理,包括:对该音频进行线性均衡处理;该音频对应该非音乐类标签、该音频的该特征信息包括具有直流分量的信息的情况下,对该音频进行去直流处理;该音频对应该非音乐类标签、该音频的该特征信息包括具有风噪的信息的情况下,对该音频进行去风噪处理。针对点播场景中,用户上传的音频质量参差不齐、类型众多的情况,对非音乐类的音频进行预处理,以提高用户的听感;而对音乐类音频则只做线性均衡,以保护原始音乐的音频特性。

技术特征:

1.一种音频处理方法,用于电子设备,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述垂类标签用于表示所述音频的内容所属的垂类,所述垂类标签包括:音乐类标签和非音乐类标签。

3.根据权利要求2所述的方法,其特征在于,所述特征信息包括:是否包含音乐特征的信息。

4.根据权利要求3所述的方法,其特征在于,基于所述垂类标签和所述特征信息,确定所述音频的编码策略包括:

5.根据权利要求3所述的方法,其特征在于,

6.根据权利要求5所述的方法,其特征在于,所述方法还包括对所述音频进行预处理,包括:

7.根据权利要求5所述的方法,其特征在于,所述编码策略包括高码率的所述编码策略、中码率的所述编码策略和低码率的所述编码策略。

8.根据权利要求7所述的方法,其特征在于,基于所述垂类标签和所述特征信息,确定所述音频的编码策略包括:

9.根据权利要求7所述的方法,其特征在于,基于所述垂类标签和所述特征信息,确定所述音频的编码策略包括:

10.一种音频处理装置,其特征在于,所述装置包括:

11.一种音频处理设备,其特征在于,所述设备包括存储有计算机可执行指令的存储器和处理器,当所述指令被所述处理器执行时,使得所述设备实施根据权利要求1-9中任一项所述的音频处理方法。

12.一种计算机存储介质,其特征在于,在所述计算机存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行根据权利要求1-9中任一项所述的音频处理方法。

13.一种计算机程序产品,其特征在于,包括计算机可执行指令,所述指令被处理器执行以实施根据权利要求1-9中任一项所述的音频处理方法。

技术总结本发明涉及音频处理方法,方法包括:确定音频对应的垂类标签;确定该音频的特征信息;基于该垂类标签和该特征信息,确定该音频的编码策略;基于该编码策略选择相应的音频编码算法对该音频进行编码。本发明还涉及音频处理装置、设备、介质和计算机程序产品。技术研发人员:武倩平受保护的技术使用者:书行科技(北京)有限公司技术研发日:技术公布日:2024/5/8

本文地址:https://www.jishuxx.com/zhuanli/20240618/23813.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。