技术新讯 > 乐器声学设备的制造及制作,分析技术 > 混响抑制方法、系统、介质及设备与流程  >  正文

混响抑制方法、系统、介质及设备与流程

  • 国知局
  • 2024-06-21 10:39:53

本申请涉及音频编码,特别涉及一种混响抑制方法、系统、介质及设备。

背景技术:

1、基于蓝牙语音通话时,特别是在室内,如果说话人距离麦克风比较远,麦克风采集到的声音中除了说话声和背景噪声,还可能包含混响。因为混响的存在降低了声音的清晰度和可懂度。现有技术进行混响抑制时,最后的音质效果一般,运算量较大,而且会增加端到端的延迟,降低了用户体验。

技术实现思路

1、针对进行混响拟制时,处理效果一般,运算量较大的问题,本申请提出一种混响抑制方法、系统、介质及设备。

2、第一方面,本申请提出一种混响抑制方法,包括:在对音频编码时,获取音频帧对应的频域谱系数和房间混响时间参数;根据频域谱系数和房间混响时间参数对音频帧进行特征提取,得到特征参数;将特征参数输入到第一预训练模型,得到音频对应的第一子带增益和第一去混幅度谱;将第一子带增益和频域谱系数对应的原始幅度谱相乘,得到第二去混幅度谱;将第一去混幅度谱和第二去混幅度谱输入到第二预训练模型,得到音频对应的第二子带增益;根据频域谱系数和第二子带增益得到去混谱系数;根据去混谱系数对音频帧进行编码。

3、可选的,在对音频编码时,获取音频帧对应的频域谱系数和房间混响时间参数,包括:对音频帧进行时频变换,得到频域谱系数;对音频帧进行计算,获取房间混响时间参数。

4、可选的,对音频帧进行时频变换,得到频域谱系数,包括:对音频进行分帧,得到音频帧;对音频帧进行离散余弦变换,得到频域谱系数。

5、可选的,根据频域谱系数和房间混响时间参数对音频帧进行特征提取,得到特征参数,包括:根据频域谱系数计算得到音频帧对应的幅度谱;根据幅度谱和和房间混响时间参数确定特征上下文,进而得到特征参数。

6、可选的,第一预训练模型的训练过程包括:获取房间声学冲激响应数据和纯净语音数据;将房间声学冲激响应数据和纯净语音数据进行混合,得到训练用混响语音;对训练用混响语音和纯净语音分别进行特征提取,得到相应的训练用特征参数;将训练用特征参数输入到第一神经网络中进行训练,得到第一预训练模型。

7、可选的,第二预训练模型的训练过程包括:获取训练用第一去混幅度谱和训练用第二去混幅度谱;根据训练用第一去混幅度谱和训练用第二去混幅度谱对第二神经网络进行训练,得到第二预训练模型。

8、第二方面,本申请提出一种混响抑制系统,包括:用于在对音频编码时,获取音频帧对应的频域谱系数和房间混响时间参数的模块;用于根据频域谱系数和房间混响时间参数对音频帧进行特征提取,得到特征参数的模块;用于将特征参数输入到第一预训练模型,得到音频对应的第一子带增益和第一去混幅度谱的模块;用于将第一子带增益和频域谱系数对应的原始幅度谱相乘,得到第二去混幅度谱的模块;用于将第一去混幅度谱和第二去混幅度谱输入到第二预训练模型,得到音频对应的第二子带增益的模块。

9、第三方面,本申请提出一种计算机可读存储介质,其存储有计算机程序,其中计算机程序被操作以执行方案一中的混响抑制方法。

10、第四方面,本申请提出一种计算机设备,其包括处理器和存储器,存储器存储有计算机程序,其中:处理器操作计算机程序以执行方案一中的混响抑制方法。

11、本申请在音频编码过程中,利用第一预训练模型对音频进行处理,得到处理音频对应的第一子带增益和第一去混幅度谱,从而在子带增益和频谱映射等多个方面对音频进行处理,提高对音频混响的抑制效果。然后通过得到的第二预训练模型将第一去混幅度谱和第二去混幅度谱进行合并处理,得到音频最终的去混谱系数,保证音频在混响抑制后的音质。

技术特征:

1.一种混响抑制方法,其特征在于,包括:

2.根据权利要求1所述的混响抑制方法,其特征在于,所述在对音频编码时,获取音频帧对应的频域谱系数和房间混响时间参数,包括:

3.根据权利要求2所述的混响抑制方法,其特征在于,所述对音频帧进行时频变换,得到所述频域谱系数,包括:

4.根据权利要求1所述的混响抑制方法,其特征在于,所述根据所述频域谱系数和所述房间混响时间参数对所述音频帧进行特征提取,得到特征参数,包括:

5.根据权利要求1所述的混响抑制方法,其特征在于,所述第一预训练模型的训练过程包括:

6.根据权利要求1所述的混响抑制方法,其特征在于,所述第二预训练模型的训练过程包括:

7.一种混响抑制系统,其特征在于,包括:

8.根据权利要求7所述的混响抑制系统,其特征在于,所述第一预训练模型的训练过程包括:

9.一种计算机可读存储介质,其存储有计算机程序,其中所述计算机程序被操作以执行权利要求1-6中任一项所述的混响抑制方法。

10.一种计算机设备,其包括处理器和存储器,存储器存储有计算机程序,其中:处理器操作计算机程序以执行权利要求1-6中任一项所述的混响抑制方法。

技术总结本申请公开了一种混响抑制方法、系统、介质及设备,属于音频编码技术领域。该方法包括:在对音频编码时,获取音频帧对应的频域谱系数和房间混响时间参数;根据频域谱系数和房间混响时间参数对音频帧进行特征提取,得到特征参数;将特征参数输入到第一预训练模型,得到音频帧对应的第一子带增益和第一去混幅度谱;将第一子带增益和频域谱系数对应的原始幅度谱相乘,得到第二去混幅度谱;将第一去混幅度谱和第二去混幅度谱输入到第二预训练模型,得到音频帧对应的第二子带增益;根据频域谱系数和第二子带增益得到去混谱系数,并根据去混谱系数对音频帧进行编码。本申请提高对音频混响的抑制效果,提升用户使用体验。技术研发人员:李强,王凌志,叶东翔,朱勇受保护的技术使用者:百瑞互联集成电路(上海)有限公司技术研发日:技术公布日:2024/1/22

本文地址:https://www.jishuxx.com/zhuanli/20240618/21056.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。