技术新讯 > 乐器声学设备的制造及制作,分析技术 > 用于信号增强的信号处理器和相关方法与流程  >  正文

用于信号增强的信号处理器和相关方法与流程

  • 国知局
  • 2024-06-21 11:44:03

本公开涉及用于信号增强的设备和方法,并且具体来说(但未必)涉及用于语音信号增强的设备和方法。

背景技术:

1、在全双工语音通信系统以及自动语音识别(asr)系统中,由于在音频装置的(一个或多个)扬声器和(一个或多个)麦克风之间的耦合,声学回波可产生。在语音通信系统中,这类可听见的声学回波可被视为恼人的并且可劣化所传输语音信号的质量和可懂度。在语音识别系统中,声学回波的存在可显著地劣化asr的性能或关键字辨识系统的性能。从语音信号中充分去除这类非期望声学回波(这可被称为声学回波控制)在语音信号处理中是具挑战性的和长期存在的问题。

技术实现思路

1、根据本公开的第一方面,提供用于执行信号增强的信号处理器,该信号处理器包括:输入端,该输入端被配置成接收输入信令;输出端;干扰消除块,该干扰消除块被配置成接收输入信令并且基于输入信令提供干扰估计信令和干扰消除信号;特征块,该特征块被配置成基于干扰消除信号和干扰估计信令提供组合特征信号;和神经网络块,该神经网络块被配置成将模型参数应用于组合特征信号以向输出端提供神经网络输出信号。

2、在一个或多个实施例中,特征块可被配置成通过串接表示干扰估计信令的噪声信号和表示干扰消除信号的净信号来确定组合特征信号。

3、在一个或多个实施例中,噪声信号可包括干扰估计信令的频谱系数。

4、在一个或多个实施例中,净信号可包括干扰消除信号的频谱系数。

5、在一个或多个实施例中,噪声信号可包括干扰估计信令的一个或多个频谱分量的对数。

6、在一个或多个实施例中,净信号可包括干扰消除信号的一个或多个频谱分量的对数。

7、在一个或多个实施例中,神经网络输出信号可包括估计净信号或可表示增益函数或潜在净信号特征。

8、在一个或多个实施例中,干扰消除块可包括回波消除块或波束成形器。

9、在一个或多个实施例中,干扰估计信令和干扰消除信号均可为时域信号。

10、在一个或多个实施例中,输入信令可包括信号帧,并且特征块可被配置成基于表示以下的信息,确定用于输入信令的组合特征信号:一个或多个先前信号帧;和/或一个或多个稍后信号帧。

11、在一个或多个实施例中,信号处理器可进一步包括被配置成接收第二输入信号的第二输入端,其中干扰消除块可被配置成基于输入信令和第二输入信号两者,提供干扰估计信令和干扰消除信号两者。

12、在一个或多个实施例中,信号处理器可进一步包括被配置成接收第二输入信号的第二输入端,其中:干扰消除块可被配置成基于第二输入信号,确定第二干扰估计信令和第二干扰消除信号;并且特征块可被配置成通过组合表示干扰估计信令、干扰消除信号、第二干扰估计信令和第二干扰消除信号的信令来提供组合特征信号。

13、在一个或多个实施例中,可基于多个信号对的比较预先确定神经网络模型参数,每个信号对包括:输入特征信号,该输入特征信号包括训练干扰估计信令和训练干扰消除信号;和输出特征信号,该输出特征信号表示期望神经网络输出信号。

14、在一个或多个实施例中,多个信号对可包括表示以下中的一个或多个的信号对:由一个或多个说话者提供的语音信号;一种或多种类型的干扰信号;净信号和干扰信号之间的一个或多个比率;一个或多个电子音频装置;和一个或多个声学环境。

15、在一个或多个实施例中,信号处理器可进一步包括合成块,该合成块被配置成接收神经网络输出信号和干扰消除信号并且基于神经网络输出信号的量值和可选地基于干扰消除信号的相位,提供减少干扰信号。

16、在一个或多个实施例中,输入信令包括语音信号,并且信号处理器进一步包括被配置成基于神经网络输出信号,提供期望语音特征信号的语音块。

17、在一个或多个实施例中,神经网络块可被配置成将非线性变换应用到组合特征信号以便确定神经网络输出信号。

18、在一个或多个实施例中,神经网络块可包括以下中的一个或多个:前馈神经网络、递归神经网络、长短时记忆神经网络和卷积神经网络。

19、在一个或多个实施例中,信号处理器可进一步包括特征预处理块,该被特征预处理配置成对组合特征信号的每个特征尺度应用归一化。

20、在一个或多个实施例中,集成电路或电子装置可包括本文所公开的任何信号处理器。

21、在一个或多个实施例中,当在计算机上运行时,计算机程序可使计算机配置本文所公开的任何信号处理器。

22、根据本公开的另一方面,提供用于执行信号增强的方法,该方法包括:接收输入信令;基于输入信令,提供干扰估计信令和干扰消除信号;基于干扰消除信号和干扰估计信令,提供组合特征信号;和使用神经网络将模型参数应用到组合特征信号以提供神经网络输出信号。

23、在一个或多个实施例中,可通过比较多个信号对来提供模型参数,所述信号对中的每一个包括:输入特征信号,该输入特征信号包括净信号和干扰信令;和输出特征信号,该输出特征信号表示净信号。

24、在一个或多个实施例中,多个语音对可包括表示以下中的一个或多个的信号对:由一个或多个说话者提供的语音信号;一种或多种类型的干扰信号;净信号和干扰信令之间的一个或多个比率;一个或多个电子音频装置;和一个或多个声学环境。

25、在一个或多个实施例中,多个语音对可包括表示以下中的一个或多个的信号对:由特定说话者提供的语音信号;特定类型的干扰信号;净信号和干扰信号之间的特定比率;特定电子音频装置;和特定声学环境。

26、虽然本公开容许各种修改和替代形式,但是已经借助于实例在附图中示出其细节且将进行详细描述。然而,应理解,除所描述的特定实施例以外,其它实施例也是可以的。也涵盖落在所附权利要求书的精神和范围内的所有修改、等效物和替代实施例。

27、以上论述并非旨在表示当前或未来权利要求集的范围内的每个例子实施例或每个实施方案。附图和之后的具体实施方式还举例说明了各种例子实施例。结合附图考虑以下具体实施方式可更全面地理解各种例子实施例。

技术特征:

1.一种用于执行信号增强的信号处理器,其特征在于,所述信号处理器包括:

2.根据权利要求1所述的信号处理器,其特征在于,所述信号处理器还包括:

3.根据权利要求2所述的信号处理器,其特征在于,所述合成块还被配置成基于所述神经网络输出信号的量值和所述干扰消除信号的相位,以向所述输出端提供所述减少干扰信号;

4.根据权利要求3所述的信号处理器,其特征在于,所述合成块包括去归一块、频谱量值块、结合块、相位块、逆离散傅里叶变换块和交叠相加块;

5.根据权利要求1至4中任一项所述的信号处理器,其特征在于,所述特征块被配置成通过串接以下来确定所述组合特征信号:

6.根据权利要求5所述的信号处理器,其特征在于:

7.根据权利要求6所述的信号处理器,其特征在于,所述噪声信号包括所述干扰估计信令的一个或多个频谱分量的对数,所述净信号包括干扰消除信号的一个或多个频谱分量的对数。

8.根据权利要求1至7中任一项所述的信号处理器,所述特征块包括高通滤波器块、低通滤波器块、短时成帧块、离散傅里叶变换块、提取量值块、记录块和串接块;

9.根据权利要求1至8中任一项所述的信号处理器,其特征在于,所述神经网络输出信号包括估计的净信号或表示增益函数或潜在净信号特征。

10.根据权利要求1至9中任一项所述的信号处理器,其特征在于,所述干扰消除块包括回波消除块、波束成形器和单通道噪声抑制器中的至少一个。

11.根据权利要求1至10中任一项所述的信号处理器,其特征在于,所述干扰估计信令和所述干扰消除信号均为时域信号。

12.根据权利要求1至11中任一项所述的信号处理器,其特征在于,所述输入信令包括信号帧,并且所述特征块被配置成基于表示以下的信息,确定用于所述输入信令的所述组合特征信号:

13.根据权利要求1至12中任一项所述的信号处理器,其特征在于,进一步包括被配置成接收第二输入信号的第二输入端,其中所述干扰消除块被配置成基于所述输入信令和所述第二输入信号两者,提供所述干扰估计信令和所述干扰消除信号两者。

14.根据权利要求1至13中任一项所述的信号处理器,其特征在于,进一步包括被配置成接收第二输入信号的第二输入端,其中:

15.根据权利要求1至14中任一项所述的信号处理器,其特征在于,基于多个信号对的比较,预先确定所述神经网络模型参数,每个信号对包括:

16.根据权利要求1至15中任一项所述的信号处理器,其特征在于,所述神经网络块被配置成将非线性变换应用到所述组合特征信号以确定所述神经网络输出信号。

17.根据权利要求16所述的信号处理器,其特征在于,所述神经网络块为具有m层互联神经元的前馈神经网络,每一层神经元层包括多个神经元;其中,提供到第一神经元层的输入由通过所述特征块提供的所述组合特征信号组成,所述组合特征信号包括在频域中的输入特征,借助指标l编索引到帧中;

18.根据权利要求17所述的信号处理器,其特征在于,所述神经网络块通过具有神经网络参数θ的用参数表示的函数,将所述组合特征信号的输入特征变换成所述神经网络输出信号,其中,所述神经网络参数θ满足:

技术总结一种用于执行信号增强的信号处理器,所述信号处理器包括:输入端,所述输入端被配置成接收输入信令;输出端;干扰消除块,所述干扰消除块被配置成接收所述输入信令并且基于所述输入信令,提供干扰估计信令和干扰消除信号。所述信号处理器进一步包括:特征块,所述特征块被配置成基于所述干扰消除信号和所述干扰估计信令,提供组合特征信号;和神经网络块,所述神经网络块被配置成将模型参数应用于所述组合特征信号以向所述输出端提供神经网络输出信号。技术研发人员:布鲁诺·加布里埃尔·保罗·G·德弗雷恩,奈尔施·马杜,沃特·约斯·蒂瑞受保护的技术使用者:汇顶科技(香港)有限公司技术研发日:技术公布日:2024/4/17

本文地址:https://www.jishuxx.com/zhuanli/20240618/23204.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。