技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于麦克风阵列降噪的语音识别方法及系统与流程  >  正文

一种基于麦克风阵列降噪的语音识别方法及系统与流程

  • 国知局
  • 2024-06-21 11:57:35

本发明涉及信号处理,具体而言,涉及一种基于麦克风阵列降噪的语音识别方法及系统。

背景技术:

1、语音识别通过机器学习方法让机器能够自动的将语音转换成对应的文字,其广泛应用于各种智能终端上,也使得越来越多的用户习惯用语音输入词语。在现有技术中,机器采集声音信号时,吵杂的环境会使得通话的语音质量严重下降;需要存储大量的语言模型信息,占用了大量的内存,使其查找过程需要耗费较长的时间,降低了语音识别效率。

技术实现思路

1、本发明的目的在于提供一种基于麦克风阵列降噪的语音识别方法及系统,其能够通过有效控制自适应滤波器消除噪声,提高信噪比,同时很好的保护语音质量,并提供了一种全新的“端到端”的语音识别架构,不需要训练海量的文字标注的语音数据,极大提高了语音识别的效率。

2、为解决上述技术问题,本发明采用的技术方案为:

3、第一方面,本申请提供一种基于麦克风阵列降噪的语音识别方法,包括以下步骤:

4、采集周围环境的声音信号;计算所有声音信号的入射角度;根据上述入射角度进行信号成分的统计,获得统计结果,并根据统计结果获取噪声成分占比参数;将上述占比参数作为自适应滤波器的控制参数对声音信号进行处理,获得待识别语音信息;提取待识别语音信息中的声学特征,并通过解码模型将上述声学特征解码为音素阵列,以及将上述音素阵列进一步解码为文字序列。

5、基于第一方面,上述计算所有声音信号的入射角度的步骤包括:

6、计算声音信号各个频率子带的相位差,并根据相位差计算声音信号各频率子带的相对延时;根据各频率子带的相对延时计算声音信号的入射角度。

7、基于第一方面,上述通过解码模型将声学特征解码为音素阵列,以及将上述音素阵列进一步解码为文字序列的步骤包括:

8、基于词典录训练解码模型,上述词典录包括音素序列和对应的文字序列。

9、第二方面,本申请提供一种基于麦克风阵列降噪的语音识别系统,其包括:

10、麦克风阵列,用于采集周围环境的声音信号;计算模块,用于计算所有声音信号的入射角度;统计模块,用于根据上述入射角度进行信号成分的统计,获得统计结果,并根据统计结果获取噪声成分占比参数;处理模块,用于将占比参数作为自适应滤波器的控制参数对声音信号进行处理,获得待识别语音信息;语音识别模块,用于提取待识别语音信息中的声学特征,并通过解码模型将上述声学特征解码为音素阵列,以及将上述音素阵列进一步解码为文字序列。

11、基于第二方面,包括训练模块,上述训练模块用于基于词典录训练解码模型,上述词典录包括音素序列和对应的文字序列。

12、基于第二方面,上述解码模型包括第一网络模型和第二网络模型,上述第一网络模型用于将上述声学特征解码为音素阵列,上述第二网络模型用于将上述音素阵列进一步解码为文字序列。

13、基于第二方面,包括同步解码模块,上述同步解码模块用于采样上述第一网络模型所解码的上述音素阵列,并将采样后的上述音素阵列输入至上述第二网络模型。

14、基于第二方面,包括报警模块,上述报警模块用于在系统发生故障时进行报警。

15、第三方面,本申请提供一种电子设备,其包括至少一个处理器、至少一个存储器和数据总线;其中:上述处理器与上述存储器通过上述数据总线完成相互间的通信;上述存储器存储有被上述处理器执行的程序指令,上述处理器调用上述程序指令以执行如上述第一方面中任一项上述的方法。

16、第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项上述的方法。

17、相对于现有技术,本发明至少具有如下优点或有益效果:

18、本发明提出了一种基于麦克风阵列降噪的语音识别方法,通过两个全指向性麦克风组成的麦克风阵列采集的声音信号,然后计算声音信号的入射角度得到控制参数,随之自适应滤波器根据控制参数调整更新速度,计算得到降噪后的语音信号。进一步语音信号通过第一网络模型和第二网络模型,实现了一种全新的“端到端”的语音识别架构,不需要训练海量的文字标注的语音数据,极大提高了语音识别的效率。

技术特征:

1.一种基于麦克风阵列降噪的语音识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于麦克风阵列降噪的语音识别方法,其特征在于,所述计算所有声音信号的入射角度的步骤包括:

3.根据权利要求1所述的一种基于麦克风阵列降噪的语音识别方法,其特征在于,所述通过解码模型将声学特征解码为音素阵列,以及将所述音素阵列进一步解码为文字序列的步骤包括:

4.一种基于麦克风阵列降噪的语音识别系统,其特征在于,包括:

5.根据权利要求4所述的一种基于麦克风阵列降噪的语音识别系统,其特征在于,包括训练模块,所述训练模块用于基于词典录训练解码模型,所述词典录包括音素序列和对应的文字序列。

6.根据权利要求4所述的一种基于麦克风阵列降噪的语音识别系统,其特征在于,所述解码模型包括第一网络模型和第二网络模型,所述第一网络模型用于将所述声学特征解码为音素阵列,所述第二网络模型用于将所述音素阵列进一步解码为文字序列。

7.根据权利要求4所述的一种基于麦克风阵列降噪的语音识别系统,其特征在于,包括同步解码模块,所述同步解码模块用于采样所述第一网络模型所解码的所述音素阵列,并将采样后的所述音素阵列输入至所述第二网络模型。

8.根据权利要求4所述的一种基于麦克风阵列降噪的语音识别系统,其特征在于,包括报警模块,所述报警模块用于在系统发生故障时进行报警。

9.一种电子设备,其特征在于,包括至少一个处理器、至少一个存储器和数据总线;其中:所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行如权利要求1-3任一项所述的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-3中任一项所述的方法。

技术总结本发明提出了一种基于麦克风阵列降噪的语音识别方法及系统,涉及信号处理技术领域。该方法通过两个全指向性麦克风组成的麦克风阵列采集的声音信号,然后计算声音信号的入射角度得到控制参数,随之自适应滤波器根据控制参数调整更新速度,计算得到降噪后的语音信号,其能够通过有效控制自适应滤波器消除噪声。进一步语音信号通过第一网络模型和第二网络模型实现了一种全新的语音识别架构,不需要训练海量的文字标注的语音数据,极大提高了语音识别的效率。此外本发明还提出一种基于麦克风阵列降噪的语音识别系统,包括麦克风阵列、获取模块、统计模块、处理模块和语音识别模块。技术研发人员:周玉海受保护的技术使用者:屿声技术有限公司技术研发日:技术公布日:2024/6/11

本文地址:https://www.jishuxx.com/zhuanli/20240618/24730.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。