技术新讯 > 乐器声学设备的制造及制作,分析技术 > 用于远场语音的语音降噪方法及系统、存储介质与流程 > 正文

用于远场语音的语音降噪方法及系统、存储介质与流程

国知局
2024-06-21 11:43:44

本发明涉及远场语音交互，具体地涉及一种用于远场语音的语音降噪方法及系统、存储介质。

背景技术：

1、随着语音识别技术的迅猛发展，利用远场语音实现人机交互的需求也越来越旺盛。具体而言，远场语音控制技术是指利用麦克风等设备接收和识别较远距离语音信号，用户通过在一定距离内向智能终端设备发出语音控制指令，以实现与该智能终端设备之间的人机交互的技术。当前，远场语音控制技术已较广泛地应用于智能家居、智能安防、汽车控制等多个领域。

2、相较于近场语音交互技术，在远场语音交互中，用户与交互的智能终端设备之间距离相对较远(例如，约1米～10米)，因此用户发出的控制语音更易受到所处空间中的环境噪音以及终端设备(例如，电视机)自身发出的语音的干扰。如何对远场语音进行更有效的降噪处理，是当下值得重点关注的问题。

技术实现思路

1、本发明实施例解决的技术问题是如何改进远场语音中的设备语音和环境噪音的降噪效果。

2、为解决上述技术问题，本发明实施例提供一种用于远场语音的语音降噪方法，包括以下步骤：采用多个麦克风采集远场语音，所述远场语音包括用户交互语音、设备语音以及环境噪音，其中，所述用户交互语音由用户发出且用于与智能终端设备进行交互、所述设备语音由所述智能终端设备发出；对每个麦克风采集的远场语音进行初步降噪处理，以去除所述设备语音，得到初步降噪后语音；基于各个初步降噪后语音进行二次降噪处理，以去除所述环境噪音，得到降噪后用户交互语音；其中，每两个麦克风之间的距离大于等于单个麦克风的长度的10倍，和/或每个麦克风与所述智能终端设备之间的距离大于等于单个麦克风的长度的10倍。

3、可选的，每两个麦克风之间的距离为20cm至5m，和/或，每个麦克风与所述智能终端设备之间的距离为20cm至5m。

4、可选的，所述多个麦克风中具有一个主麦克风；所述主麦克风与所述智能终端设备之间的距离，大于所述主麦克风的标准使用距离。

5、可选的，每个麦克风接收到的所述智能终端设备发出的设备语音，与所述智能终端设备发出该设备语音之间的时延小于等于20ms。

6、可选的，所述多个麦克风与所述智能终端设备之间采用le audio技术进行无线通信。

7、可选的，所述基于各个初步降噪后语音进行二次降噪处理，包括：以每两个初步降噪后语音为一组，并确定每组初步降噪后语音之间的相位差；基于所确定的多个相位差进行降噪处理。

8、本发明实施例还提供一种用于远场语音的语音降噪系统，包括：智能终端设备；多个麦克风，用于采集远场语音，所述远场语音包括用户交互语音、设备语音以及环境噪音，其中，所述用户交互语音由用户发出且用于与智能终端设备进行交互、所述设备语音由所述智能终端设备发出；初步降噪处理模块，用于对每个麦克风采集的远场语音进行初步降噪处理，以去除所述设备语音，得到初步降噪后语音；二次降噪处理模块，用于基于各个初步降噪后语音进行二次降噪处理，以去除所述环境噪音，得到降噪后用户交互语音；其中，每两个麦克风之间的距离、以及每个麦克风与所述智能终端设备之间的距离大于等于单个麦克风的长度的10倍。

9、可选的，所述初步降噪处理模块配置于所述麦克风，且每个麦克风均配置有各自的初步降噪模块。

10、可选的，所述智能终端设备配置有多个环境灯，所述环境灯的数量与所述麦克风的数量一致；其中，每个麦克风安装于单个环境灯的灯管内。

11、可选的，每个环境灯的灯管内设置有供电模块，用于向安装于该环境灯的灯管内的麦克风进行供电。

12、可选的，所述麦克风的数量为2个至6个，且各个麦克风环绕所述智能终端设备均匀排布。

13、本发明实施例还提供一种存储介质，其上存储有计算机程序，所述计算机程序被处理器运行时执行上述用于远场语音的语音降噪方法的步骤。

14、与现有技术相比，本发明实施例的技术方案具有以下有益效果：

15、在本发明实施例中，采用多个麦克风采集远场语音，所述远场语音包括用户交互语音、设备语音以及环境噪音，其中，所述用户交互语音由用户发出且用于与智能终端设备进行交互、所述设备语音由所述智能终端设备发出；对每个麦克风采集的远场语音进行初步降噪处理，以去除所述设备语音，得到初步降噪后语音；基于各个初步降噪后语音进行二次降噪处理，以去除所述环境噪音，得到降噪后用户交互语音；其中，每两个麦克风之间的距离大于等于单个麦克风的长度的10倍，和/或每个麦克风与所述智能终端设备之间的距离大于等于单个麦克风的长度的10倍。

16、由上，通过设置每两个麦克风之间的距离大于等于单个麦克风的长度的10倍，和/或每个麦克风与所述智能终端设备之间的距离大于等于单个麦克风的长度的10倍，相较于将各个麦克风集中排布并封装于尺寸有限的单一器件单元内，或者相较于仅设置较小数量级的倍数关系(例如，2倍至5倍)，本实施方案通过大幅度增加麦克风之间、麦克风与智能终端设备之间的距离，可以显著提升对远场语音中的设备语音(可称为“同源语音”)和环境噪音的降噪效果，获得更加纯净的用户交互语音。进一步，有助于后续获得更佳的语音识别效果，提升用户体验。

17、进一步，在本发明实施例中，通过设置所述主麦克风与所述智能终端设备之间的距离，大于所述主麦克风的标准使用距离，有助于使得主麦克风采集到的用户交互语音的强度大于采集到的设备语音的强度，避免将所述用户交互语音误认为是环境噪音而被错误消除的情形，从而提升降噪效果。

18、进一步，在本发明实施例中，通过将每个麦克风分别配置于所述智能终端设备的单个环境灯的灯管内，一方面，各个环境灯的安装位置与所述智能终端设备的放置位置之间的距离可以相对较远，远距离设置更易实现；另一方面，相较于将各个麦克风配置于所述智能终端设备的其他配件(例如，智能电视机的音箱)可能会导致用户交互语音更易受到设备语音干扰，本实施方案将麦克风配置于环境灯内更易实现最小化的设备语音干扰。进一步，还可以直接复用环境灯自带的供电模块对麦克风进行供电，无需额外设置专门的麦克风供电模块，降低成本。

技术特征：

1.一种用于远场语音的语音降噪方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，每两个麦克风之间的距离为20cm至5m，和/或，每个麦克风与所述智能终端设备之间的距离为20cm至5m。

3.根据权利要求1或2所述的方法，其特征在于，所述多个麦克风中具有一个主麦克风；

4.根据权利要求1所述的方法，其特征在于，每个麦克风接收到的所述智能终端设备发出的设备语音，与所述智能终端设备发出该设备语音之间的时延小于等于20ms。

5.根据权利要求1或4所述的方法，其特征在于，所述多个麦克风与所述智能终端设备之间采用le audio技术进行无线通信。

6.根据权利要求1所述的方法，其特征在于，所述基于各个初步降噪后语音进行二次降噪处理，包括：

7.一种用于远场语音的语音降噪系统，其特征在于，包括：

8.根据权利要求7所述的语音降噪系统，其特征在于，所述初步降噪处理模块配置于所述麦克风，且每个麦克风均配置有各自的初步降噪模块。

9.根据权利要求7或8所述的语音降噪系统，其特征在于，所述智能终端设备配置有多个环境灯，所述环境灯的数量与所述麦克风的数量一致；

10.根据权利要求9所述的语音降噪系统，其特征在于，每个环境灯的灯管内设置有供电模块，用于向安装于该环境灯的灯管内的麦克风进行供电。

11.根据权利要求7所述的语音降噪系统，其特征在于，所述麦克风的数量为2个至6个，且各个麦克风环绕所述智能终端设备均匀排布。

12.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行权利要求1至6任一项所述用于远场语音的语音降噪方法的步骤。

技术总结一种用于远场语音的语音降噪方法及系统、存储介质，方法包括：采用多个麦克风采集远场语音，所述远场语音包括用户交互语音、设备语音以及环境噪音，其中，用户交互语音由用户发出且用于与智能终端设备进行交互、设备语音由所述智能终端设备发出；对每个麦克风采集的远场语音进行初步降噪处理，以去除所述设备语音，得到初步降噪后语音；基于各个初步降噪后语音进行二次降噪处理，以去除所述环境噪音，得到降噪后用户交互语音；其中，每两个麦克风之间的距离大于等于单个麦克风的长度的10倍，和/或每个麦克风与所述智能终端设备之间的距离大于等于单个麦克风的长度的10倍。上述方案有助于改进远场语音中的设备语音和环境噪音的降噪效果。技术研发人员：乔磊,李丹受保护的技术使用者：江苏惠通集团有限责任公司技术研发日：技术公布日：2024/4/17