技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频处理方法、装置、芯片和电子设备与流程  >  正文

音频处理方法、装置、芯片和电子设备与流程

  • 国知局
  • 2024-06-21 11:53:22

本申请涉及音频处理,特别涉及一种音频处理方法、装置、芯片和电子设备。

背景技术:

1、随着科学技术的发展,手机、平板电脑等便携式电子设备已经成为了人们生活中常用的电子产品,并且人们会在日常生活中使用便携式电子设备播放音频信号。便携式电子设备受到体积大小的限制,通常使用微型扬声器作为发声单元。微型扬声器在播放音频信号时,若音频信号包括齿音信号、钢琴音信号等需要压制的信号,则微型扬声器播放的声音会出现杂音或者听感比较刺耳,降低了用户的听觉体验。

2、目前,可以通过静态均衡器(equalizer,eq)或者通过动态范围规划(multibanddynamic range control,mbdrc)的方式压制音频信号中特定的频点或频带,从而抑制音频信号中的需要压制的信号。然而,这种方法虽然能够对需要压制的信号进行抑制,但是由于音频信号中需要压制的信号的频率和不需要压制的信号的频率存在交集,因此在对需要压制的信号进行抑制的同时也会抑制不需要压制的信号,影响了不需要压制的信号的听感。因此,如何在抑制待压制信号的过程中避免抑制不需要压制的信号,是亟待解决的技术问题。

技术实现思路

1、为了在抑制需要压制的信号的过程中避免抑制不需要压制的信号,本申请实施例提供了一种音频处理方法、装置、芯片和电子设备。

2、第一方面,本申请实施例提供了一种音频处理方法,音频处理方法包括:获取第一音频信号,第一音频信号包括电子设备的待播放音频信号;对第一音频信号进行分离,得到多帧目标信号,多帧目标信号包括背景音信号和人声信号;对多帧目标信号进行识别,得到待压制信号,待压制信号包括背景音信号中的钢琴音信号和人声信号中的齿音信号;对待压制信号进行压制,获取第二音频信号。

3、本申请实施例为了提高识别到的音频信号中需要压制的信号的精确度,首先对音频信号进行分离,以获取音频信号中的目标信号,其次对分离得到的目标信号进行齿音和钢琴音识别,以确定待压制信号,避免对不需要压制的信号进行误压;最后对识别到的待压制信号进行压制,获取第二音频信号。本申请实施例通过提高识别待压制信号精确度的方式,避免对不需要压制的信号进行误压,从而提高了压制后的音频信号的整体听感。

4、在一种可能的实现中,对多帧目标信号进行识别,得到待压制信号,包括:确定多帧目标信号中的各帧目标信号为待压制信号的各预测值;基于各预测值确定对应的各帧目标信号的第一概率,其中,第一概率为各帧目标信号为待压制信号的预测值的准确性概率;将多帧目标信号中的第一目标信号作为待压制信号,第一目标信号对应的第一概率大于第一阈值。

5、在一种可能的实现中,对待压制信号进行压制,获取第二音频信号,包括:基于各预测值确定对应的各帧待压制信号的幅值比例;基于各帧待压制信号的幅值比例对各帧待压制信号进行压制,获取第二音频信号。

6、在一种可能的实现中,基于各帧待压制信号的幅值比例对各帧待压制信号进行压制,包括:对于各帧待压制信号中幅值比例满足第二阈值的第一待压制信号,将第一待压制信号的当前幅值比例降低至第一比例;对于各帧待压制信号中幅值比例满足第三阈值的第二待压制信号,将第二待压制信号的当前幅值比例降低至第二比例;其中,第二阈值的最小值大于第三阈值的最大值,第一比例大于第二比例。

7、在一种可能的实现中,基于各预测值确定对应的各帧目标信号的第一概率,包括:获取目标信号预测值的最大阈值和最小阈值;基于目标信号预测值的最大阈值和最小阈值对各预测值进行归一化处理,得到各帧目标信号的第一概率。

8、在一种可能的实现中,基于各预测值确定对应的各帧待压制信号的幅值比例,包括:获取待压制信号幅值比例的最大阈值和最小阈值;基于待压制信号幅值比例的最大阈值和最小阈值对各预测值进行归一化处理,得到各帧待压制信号的幅值比例。

9、在一种可能的实现中,基于目标信号预测值的最大阈值和最小阈值对各预测值进行归一化处理,得到各帧目标信号的第一概率,包括:基于各预测值和目标信号预测值的最小阈值的差值,目标信号预测值的最大阈值和最小阈值的差值,计算得到各帧目标信号的第一概率。

10、在一种可能的实现中,基于待压制信号幅值比例的最大阈值和最小阈值对各预测值进行归一化处理,得到各帧待压制信号的幅值比例,包括:基于各预测值和待压制信号幅值比例的最小阈值的差值,待压制信号幅值比例的最大阈值和最小阈值的差值,计算得到各帧待压制信号的幅值比例。

11、在一种可能的实现中,对第一音频信号进行分离,得到多帧目标信号,包括:通过神经网络模型基于音频特征对第一音频信号进行分离,得到多帧目标信号,其中,音频特征包括时域特征和频域特征。

12、在一种可能的实现中,对应于目标信号为背景音信号,待压制信号为钢琴音信号;对应于目标信号为人声信号,待压制信号为齿音信号。

13、第二方面,本申请实施例提供了提供一种音频数据处理装置,包括:获取模块,用于获取第一音频信号,第一音频信号为电子设备的待播放音频信号;目标信号识别模块,用于对第一音频信号进行分离,得到多帧目标信号,多帧目标信号包括背景音信号和人声信号;待压制信号识别模块,用于对多帧目标信号进行识别,得到待压制信号,待压制信号包括背景音信号中的钢琴音信号和人声信号中的齿音信号;压制模块,用于对待压制信号进行压制,获取第二音频信号。

14、第三方面,本申请实施例提供了一种芯片,包括电路,该电路用于执行上述第一方面及上述第一方面的各种可能实现提供的任一种音频处理方法。

15、第四方面,本申请实施例提供了一种电子设备,该电子设备包括上述芯片。

技术特征:

1.一种音频处理方法,其特征在于,应用于电子设备,所述音频处理方法包括:

2.根据权利要求1所述的音频处理方法,其特征在于,所述对所述多帧目标信号进行识别,得到待压制信号,包括:

3.根据权利要求2所述的音频处理方法,其特征在于,所述对所述待压制信号进行压制,获取第二音频信号,包括:

4.根据权利要求3所述的音频处理方法,其特征在于,所述基于所述各帧待压制信号的幅值比例对所述各帧待压制信号进行压制,包括:

5.根据权利要求3所述的音频处理方法,其特征在于,所述基于所述各预测值确定对应的所述各帧目标信号的第一概率,包括:

6.根据权利要求5所述的音频处理方法,其特征在于,所述基于所述目标信号预测值的最大阈值和最小阈值对所述各预测值进行归一化处理,得到所述各帧目标信号的第一概率,包括:

7.根据权利要求5所述的音频处理方法,其特征在于,所述基于所述待压制信号幅值比例的最大阈值和最小阈值对所述各预测值进行归一化处理,得到所述各帧待压制信号的幅值比例,包括:

8.根据权利要求1所述的音频处理方法,其特征在于,所述对所述第一音频信号进行分离,得到多帧目标信号,包括:

9.一种音频数据处理装置,其特征在于,所述音频数据处理装置包括:

10.一种芯片,其特征在于,包括电路,所述电路用于执行权利要求1-8任一项所述音频处理方法。

11.一种电子设备,其特征在于,包括权利要求10所述的芯片。

技术总结本申请涉及音频处理技术领域,公开了一种音频处理方法、装置、芯片和电子设备。本申请的音频处理方法首先对第一音频信号进行分离,以获取目标信号,其次对分离得到的目标信号进行识别,以确定待压制信号,避免对不需要压制的信号进行误压;最后对识别到的待压制信号进行压制,获取第二音频信号。本申请通过对音频信号进行分离,得到目标信号,再识别目标信号中的待压制信号的方式,提高了识别待压制信号的精确度,避免对不需要压制的信号进行误压,从而提高了压制后的音频信号的整体听感。技术研发人员:石磊受保护的技术使用者:上海艾为电子技术股份有限公司技术研发日:技术公布日:2024/5/27

本文地址:https://www.jishuxx.com/zhuanli/20240618/24291.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。