一种在线多输入多输出语音信号的去混响方法及系统与流程
- 国知局
- 2024-06-21 11:52:59
本发明涉及语音处理,尤其涉及一种在线多输入多输出语音信号的去混响方法及系统。
背景技术:
1、语音信号质量对于语音识别,特别是短指令识别的准确性具有极大影响,因此如果有效地降低混响影响,提高语音信号质量,对于语音识别系统具有重要意义。
2、近年来,麦克风阵列技术广泛应用到ai语音硬件设备中,相比传统单/双麦克拾音设备,通过远场语音增强能够实现更好的语音交互体验。因此,混响问题成为多通道语音信号处理中的关键技术问题。
3、现有的去混响技术方案,大多针对各个通道单独进行混响成分估计,从而实现去混响,但是同时应用各个通道数据进行联合去混响,会因为受到巨大计算量的约束导致无法实时应用。因此,亟需一种在线多输入多输出语音信号的去混响方法及系统来解决上述问题。
技术实现思路
1、针对现有技术存在的问题,本发明提供一种在线多输入多输出语音信号的去混响方法及系统。
2、本发明提供一种在线多输入多输出语音信号的去混响方法,包括:
3、对麦克风阵列接收信号进行频域转换,获取多通道语音频域信号;
4、基于所述多通道语音频域信号的滤波器系数阶数,获取滤波器系数矩阵,并根据更新步长,对所述滤波器系数矩阵进行更新,获取更新后的滤波器系数矩阵;
5、根据所述更新后的滤波器系数矩阵,对所述多通道语音频域信号进行去混响处理,获取去混响后的多通道语音频域信号;
6、根据所述去混响后的多通道语音频域信号和补偿系数,确定多通道语音频域信号去混响结果,其中,所述补偿系数是通过补偿模型输出得到的,所述补偿模型是由样本误差去混响信号和样本无混响信号,对神经网络进行训练得到的,所述样本误差去混响信号是通过滤波器得到的干扰误差信号。
7、根据本发明提供的一种在线多输入多输出语音信号的去混响方法,所述补偿模型通过以下步骤训练得到:
8、根据样本滤波器系数矩阵,获取样本误差去混响信号;
9、根据所述样本误差去混响信号和样本无混响信号,构建训练样本集;
10、将所述训练样本集输入到神经网络中进行训练,获取训练好的补偿模型。
11、根据本发明提供的一种在线多输入多输出语音信号的去混响方法,所述神经网络包括级联的长短期记忆人工神经网络。
12、根据本发明提供的一种在线多输入多输出语音信号的去混响方法,所述滤波器系数矩阵的更新公式为:
13、
14、其中,gl(n)表示多通道语音频域信号中n个观测点的去混响滤波器系数矩阵,i表示单位矩阵,α(n)表示更新步长,xl(n)表示多通道语音频域信号中n个观测点的历史观测值,表示历史观测值的共轭转置矩阵,gl(n-1)表示多通道语音频域信号中n-1个观测点的去混响滤波器系数矩阵,yh(n)表示多通道语音频域信号的共轭转置矩阵。
15、根据本发明提供的一种在线多输入多输出语音信号的去混响方法,所述多通道语音频域信号去混响结果的计算公式为:
16、β(n)=δ(n)(y(n)-gl(n)hxl(n));
17、其中,β(n)表示多通道语音频域信号去混响结果,δ(n)代表补偿系数,y(n)表示多通道语音频域信号,gl(n)表示多通道语音频域信号的去混响滤波器系数矩阵,xl(n)表示多通道语音频域信号中n个观测点的历史观测值,h表示对矩阵取共轭转置,l表示多通道语音频域信号的去混响滤波器系数阶数。
18、本发明还提供一种在线多输入多输出语音信号的去混响系统,包括:
19、频域信号获取模块,用于对麦克风阵列接收信号进行频域转换,获取多通道语音频域信号;
20、滤波器更新模块,用于基于所述多通道语音频域信号的滤波器系数阶数,获取滤波器系数矩阵,并根据更新步长,对所述滤波器系数矩阵进行更新,获取更新后的滤波器系数矩阵;
21、滤波处理模块,用于根据所述更新后的滤波器系数矩阵,对所述多通道语音频域信号进行去混响处理,获取去混响后的多通道语音频域信号;
22、去混响结果确定模块,用于根据所述去混响后的多通道语音频域信号和补偿系数,确定多通道语音频域信号去混响结果,其中,所述补偿系数是通过补偿模型输出得到的,所述补偿模型是由样本误差去混响信号和样本无混响信号,对神经网络进行训练得到的,所述样本误差去混响信号是通过滤波器得到的干扰误差信号。
23、根据本发明提供的一种在线多输入多输出语音信号的去混响系统,所述系统还包括:
24、误差去混响信号获取模块,用于根据样本滤波器系数矩阵和样本观测值,获取样本误差去混响信号;
25、训练样本集构建模块,用于根据所述样本误差去混响信号和样本无混响信号,构建训练样本集;
26、补偿模型训练模块,用于将所述训练样本集输入到神经网络中进行训练,获取训练好的补偿模型。
27、根据本发明提供的一种在线多输入多输出语音信号的去混响系统,所述系统还包括:
28、初始化模块,用于根据单位矩阵和预设随机对角矩阵,对所述滤波器系数矩阵进行初始化。
29、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述在线多输入多输出语音信号的去混响方法的步骤。
30、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述在线多输入多输出语音信号的去混响方法的步骤。
31、本发明提供的在线多输入多输出语音信号的去混响方法及系统,通过更新步长对滤波器系数矩阵进行实时更新,得到更新后的滤波器系数矩阵;基于更新后的滤波器系数矩阵,对多通道语音频域信号进行去混响处理,实现了实时在线去混响;根据补偿模型输出得到补偿系数,再结合去混响处理后的多通道语音频域信号和补偿系数,得到多通道语音频域信号去混响结果,降低了运算复杂度,实现了计算量可控,同时提高了估算去混响信号的准确性。
技术特征:1.一种在线多输入多输出语音信号的去混响方法,其特征在于,包括:
2.根据权利要求1所述的在线多输入多输出语音信号的去混响方法,其特征在于,所述补偿模型通过以下步骤训练得到:
3.根据权利要求1所述的在线多输入多输出语音信号的去混响方法,其特征在于,所述神经网络为级联的长短期记忆人工神经网络。
4.根据权利要求1所述的在线多输入多输出语音信号的去混响方法,其特征在于,所述滤波器系数矩阵的更新公式为:
5.根据权利要求1所述的在线多输入多输出语音信号的去混响方法,其特征在于,所述多通道语音频域信号去混响结果的计算公式为:
6.一种在线多输入多输出语音信号的去混响系统,其特征在于,包括:
7.根据权利要求6所述的在线多输入多输出语音信号的去混响系统,其特征在于,所述系统还包括:
8.根据权利要求6所述的在线多输入多输出语音信号的去混响系统,其特征在于,所述系统还包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述在线多输入多输出语音信号的去混响方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述在线多输入多输出语音信号的去混响方法的步骤。
技术总结本发明提供一种在线多输入多输出语音信号的去混响方法及系统,该方法包括:对麦克风阵列接收信号进行频域转换,获取多通道语音频域信号;基于多通道语音频域信号的滤波器系数阶数,获取滤波器系数矩阵,根据更新步长,对滤波器系数矩阵进行更新,获取更新后的滤波器系数矩阵;根据更新后的滤波器系数矩阵,对多通道语音频域信号进行去混响处理,获取去混响后的多通道语音频域信号;根据去混响后的多通道语音频域信号和补偿系数,确定多通道语音频域信号去混响结果,其中,补偿系数是通过补偿模型输出得到,补偿模型是由样本误差去混响信号和样本无混响信号,对神经网络进行训练得到。本发明可实时在线去混响,降低运算复杂度,实现计算量可控。技术研发人员:栾天祥受保护的技术使用者:海尔优家智能科技(北京)有限公司技术研发日:技术公布日:2024/5/20本文地址:https://www.jishuxx.com/zhuanli/20240618/24238.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。