技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频处理方法、装置、智能设备及存储介质、程序产品与流程 > 正文

音频处理方法、装置、智能设备及存储介质、程序产品与流程

国知局
2024-06-21 11:58:08

本发明涉及计算机，具体涉及一种音频处理方法、装置、智能设备及计算机可读存储介质、计算机程序产品。

背景技术：

1、随着通信技术的不断发展，用户能够随时随地的进行语音通信。由于通信地点不固定，在通信时周围环境可能存在噪声，使得传输的音频信号中携带了部分非必要的信号。

2、在一个场景中，该非必要信号主要是指噪声信号，该噪声信号包括回声信号，以及其他物体发出的声音信号(如汽车鸣笛)。这些噪声信号会给通信过程中语音信号带来不利影响，比如语音信号接收方的用户未能听清语音信号发送方的用户的语音内容，降低了语音交互的质量。

技术实现思路

1、本发明实施例提供了一种音频处理方法、装置、智能设备及计算机可读存储介质、程序产品，能够在一定程度上提高音频信号的质量。

2、一方面，本申请实施例提供了一种音频处理方法，该方法包括：

3、获取待处理的音频信号，并根据音频频段划分值将所述待处理的音频信号划分为待处理的第一频段信号和待处理的第二频段信号；

4、对所述待处理的第一频段信号进行特征提取得到n维低频特征参数，并根据所述n维低频特征参数和所述待处理的音频信号得到m维系数特征参数；

5、将所述待处理的第二频段信号划分为k个频带，并对每频带进行特征提取得到k维高频特征参数；

6、调用噪声优化模型对所述n维低频特征参数，所述m维系数特征参数和所述k维高频特征参数进行处理，得到p维增益参数，p为正整数；

7、对所述待处理的音频信号和所述p维增益参数进行增益计算处理，得到处理后的音频信号；

8、其中，所述噪声优化模型包括r层门控循环单元网络和激活层，所述激活层用于对第r层门控循环单元网络的输出结果进行激活，r为大于等于2的正整数。

9、另一方面，本申请实施例提供了一种音频处理装置，该处理装置包括：

10、获取单元，用于获取待处理的音频信号；

11、处理单元，用于根据音频频段划分值将所述待处理的音频信号划分为待处理的第一频段信号和待处理的第二频段信号；以及用于对所述待处理的第一频段信号进行特征提取得到n维低频特征参数，并根据所述n维低频特征参数和所述待处理的音频信号得到m维系数特征参数；以及用于将所述待处理的第二频段信号划分为k个频带，并对每频带进行特征提取得到k维高频特征参数；以及用于调用噪声优化模型对所述n维低频特征参数，所述m维系数特征参数和所述k维高频特征参数进行处理，得到p维增益参数，p为正整数；以及用于对所述待处理的音频信号和所述p维增益参数进行增益计算处理，得到处理后的音频信号；

12、其中，所述噪声优化模型包括r层门控循环单元网络和激活层，所述激活层用于对第r层门控循环单元网络的输出结果进行激活，r为大于等于2的正整数。

13、相应地，本申请实施例还提供了一种音频处理设备，包括处理器、存储器和通信接口，所述处理器、所述存储器和所述通信接口相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述的音频处理方法。

14、相应地，本申请提供了一种计算机可读存储介质，计算机可读存储介质存储有一条或多条指令，一条或多条指令适于由处理器加载并执行上述的音频处理方法。

15、相应地，本申请提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中，计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述的音频处理方法。

16、本申请实施例中，通过直接提取待处理的音频信号中第一频段信号对应的n维低频特征参数，较为完整的保留了第一频段信号的特征；并结合第二频段信号对应的k维高频特征参数和m为系数特征参数，较为完整的保留了待处理的音频信号的特征，进而提高增益参数的准度；通过增益参数对待处理的音频信号进行增益计算处理，可以较为有效地对待处理的音频信号进行优化修正，降低甚至消除该待处理的音频信号中关于噪声音频信号的特征对待处理的音频信号的不利影响，从而提高语音交互的质量。

技术特征：

1.一种音频处理方法，其特征在于，由噪声优化模型对待处理的音频信号进行处理，所述待处理的音频信号的特征参数包括：n维低频特征参数，m维系数特征参数和k维高频特征参数，所述方法包括：

2.如权利要求1所述的方法，其特征在于，还包括：

3.如权利要求2所述的方法，其特征在于，所述待处理的第一频段信号包括n个频点，所述n维低频特征参数是对所述n个频点分别进行特征提取后得到的。

4.如权利要求3所述的方法，其特征在于，p＝n+k，所述对所述待处理的音频信号和所述p维增益参数进行处理，得到处理后的音频信号，包括：

5.如权利要求2所述的方法，其特征在于，所述m维系数特征参数包括m-2维中间特征参数，滤波特征参数和能量参数；所述根据所述n维低频特征参数和所述待处理的音频信号得到m维系数特征参数，包括：

6.如权利要求2所述的方法，其特征在于，所述k个频带中，第i个频带中包括至少两个频点，第i个频带中频点的数量小于或等于第i+1个频带中频点的数量，i为正整数，且i小于等于k。

7.如权利要求2所述的方法，其特征在于，所述噪声优化模型是根据语音样本数据训练得到的，所述样本数据包括的音频信号为混合信号，调用噪声优化模型对所述n维低频特征参数，所述m维系数特征参数和所述k维高频特征参数进行处理，得到p维增益参数之前，所述方法还包括：

8.一种音频处理方法，其特征在于，包括：

9.如权利要求8所述的方法，其特征在于，所述分别对各个待处理的音频信号进行处理，得到各个待处理的音频信号对应的n维低频特征参数，m维系数特征参数和k维高频特征参数，包括：

10.如权利要求8或9所述的方法，其特征在于，所述采用噪声优化模型对各个待处理的音频信号对应的n维低频特征参数，m维系数特征参数和k维高频特征参数进行处理，得到各个待处理的音频信号对应的p维增益参数，包括：

11.一种音频处理装置，其特征在于，包括用于实现如权利要求1-10任一项所述的音频处理方法的单元。

12.一种智能设备，其特征在于，包括：存储装置和处理器；

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时，如权利要求1-10任一项所述音频处理方法被实现。

14.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时，实现如权利要求1-10任一项所述的音频处理方法。

技术总结本申请实施例公开了一种音频处理方法、装置、智能设备及存储介质、程序产品。其中方法包括：获取待处理的音频信号，并根据音频频段划分值将待处理的音频信号划分为待处理的第一频段信号和待处理的第二频段信号；对待处理的第一频段信号进行特征提取得到N维低频特征参数，并根据N维低频特征参数和待处理的音频信号得到M维系数特征参数；将待处理的第二频段信号划分为K个频带，并对每频带进行特征提取得到K维高频特征参数；调用噪声优化模型对N维低频特征参数，M维系数特征参数和K维高频特征参数进行处理，得到P维增益参数。通过增益参数对待处理的音频信号进行增益计算处理，改善待处理的音频信号中的噪声音频信号造成的不利影响。技术研发人员：鲍枫受保护的技术使用者：腾讯科技（深圳）有限公司技术研发日：技术公布日：2024/6/13