技术新讯 > 乐器声学设备的制造及制作,分析技术 > 头戴设备语音处理方法和头戴设备与流程 > 正文

头戴设备语音处理方法和头戴设备与流程

国知局
2024-06-21 11:31:27

本公开涉及语音处理领域，尤其一种头戴设备语音处理方法和使用该方法的头戴设备。

背景技术：

1、头戴设备通常具有眼镜、眼罩或头盔的形式。通过以镜片形式把显示屏贴近用户的眼睛及光路调整焦距，头戴设备能够在近距离以比普通显示器小的多的体积生成广角画面。

2、除了使用镜片进行内容显示，头戴设备通常还配有麦克风和扬声器，用于提供各类语音交互服务。在语音交互场景中，需要正确采集目标说话人的声音并滤除周围环境的无关声音。在现有技术中，通常基于频域能量的大小来辨别无关声音。但此类方法存在诸多无法滤除无关声音的情况，例如，无法将旁边人的大声说话完全抑制，从而导致无关声音被错误识别，降低佩戴者的头戴设备使用体验。

3、因此，需要一种改进的用于头戴设备的无关声音滤除方法。

技术实现思路

1、本公开要解决的一个技术问题是提供一种头戴设备语音处理方法和使用该方法的头戴设备。该语音处理方法会对头戴设备采集到的原始时域信号进行基于当前使用场景的方向增强/抑制处理，并且根据处理前后时域信号的能量来判定是否要对原始信号进行后续的语音识别处理。

2、根据本公开的第一个方面，提供了一种头戴设备语音处理方法，包括：获取麦克风采集的原始时域信号；对所述原始时域信号进行基于方向的增强抑制处理，以获取经处理时域信号，其中，根据所述头戴设备的当前使用场景选择所述增强抑制处理中需要增强和/或抑制的方向；根据所述原始时域信号与所述经处理时域信号的能量判定是否进行基于所述原始时域信号的语音处理。

3、可选地，根据所述原始时域信号与所述经处理时域信号的能量判定是否进行基于所述原始时域信号的语音处理包括：计算所述经处理时域信号与所述原始时域信号的能量比；根据所述能量比的大小判定是否进行基于所述原始时域信号的语音识别处理。

4、可选地，计算所述经处理时域信号与所述原始时域信号的能量比包括：计算所述经处理时域信号与所述原始时域信号在时间窗口内的能量均值之比作为所述能量比。

5、可选地，根据所述能量比的大小判定是否进行基于所述原始时域信号的语音处理包括：在所述能量比小于第一阈值时，不进行基于所述原始时域信号的语音处理；以及在所述能量比大于所述第一阈值时，进行基于所述原始时域信号的语音处理。

6、可选地，所述头戴设备包括布置在不同位置的多个麦克风，所述多个麦克风分别为多个使用场景下的主麦克风；对所述原始时域信号进行基于方向的增强抑制处理，以获取经处理时域信号，包括：对所述当前使用场景下的主麦克风采集的主麦克风原始时域信号进行基于方向的增强抑制处理，以获取所述经处理时域信号。

7、可选地，获取麦克风采集的原始时域信号包括：获取由所述当前使用场景下的主麦克风采集的主麦克风原始时域信号以及由除所述主麦克风之外的其它麦克风采集的其他麦克风原始时域信号。此时，对所述当前使用场景下的主麦克风采集的主麦克风原始时域信号进行基于方向的增强抑制处理，以获取所述经处理时域信号包括：使用所述其他麦克风原始时域信号，对所述当前使用场景下的主麦克风采集的主麦克风原始时域信号进行定向增强处理，以获取所述经处理时域信号。

8、可选地，根据所述原始时域信号与所述经处理时域信号的能量判定是否进行基于所述原始时域信号的语音处理包括：在所述经处理时域信号的频域能量的值大于第二阈值且小于第三阈值的情况下，根据所述原始时域信号与所述经处理时域信号的能量判定是否进行基于所述原始时域信号的语音处理。

9、可选地，所述方法还包括：在所述频域能量的值小于第二阈值时，不进行基于所述原始时域信号的语音处理；以及在所述频域能量的值大于第三阈值时，进行基于所述原始时域信号的语音处理。

10、可选地，所述头戴设备包括扬声器，并且对所述原始时域信号进行基于方向的增强抑制处理，以获取经处理时域信号包括：在所述扬声器在所述当前使用场景中进行音频输出时，使用所述音频信号进行基于所述扬声器所在方向的回声消除处理。

11、可选地，根据所述当前使用场景判定说话人方向，并在所述增强抑制处理中增强所述说话人方向的信号强度。

12、根据本公开的第二个方面，提供了一种头戴设备，包括：麦克风，用于采集语音信号；以及处理单元，用于执行如第一方面所述的语音处理方法。

13、由此，本公开基于经处理信号(例如，经定向增强处理的信号)相比于原始信号的能量衰减程度来判定采集信号是否包含目标说话人的语音信息，尤其能够准确分辨非目标说话人大声说话的情况，从而避免头戴设备的误操作。如上判定可以作为常规基于频域能量大小的判定的替换或是补充。

技术特征：

1.一种头戴设备语音处理方法，包括：

2.如权利要求1所述的方法，其中，根据所述原始时域信号与所述经处理时域信号的能量判定是否进行基于所述原始时域信号的语音处理，包括：

3.如权利要求2所述的方法，其中，计算所述经处理时域信号与所述原始时域信号的能量比，包括：

4.如权利要求2所述的方法，其中，根据所述能量比的大小判定是否进行基于所述原始时域信号的语音处理，包括：

5.如权利要求1所述的方法，其中，所述头戴设备包括布置在不同位置的多个麦克风，所述多个麦克风分别为多个使用场景下的主麦克风；

6.如权利要求5所述的方法，其中，获取麦克风采集的原始时域信号，包括：

7.如权利要求5所述的方法，其中，根据所述原始时域信号与所述经处理时域信号的能量判定是否进行基于所述原始时域信号的语音处理，包括：

8.如权利要求7所述的方法，还包括：

9.如权利要求1所述的方法，其中，所述头戴设备包括扬声器，并且对所述原始时域信号进行基于方向的增强抑制处理，以获取经处理时域信号包括：

10.如权利要求1所述的方法，其中，根据所述当前使用场景判定说话人方向，并在所述增强抑制处理中增强所述说话人方向的信号强度。

11.一种头戴设备，包括：

技术总结公开了一种头戴设备语音处理方法和头戴设备。该语音处理方法包括：获取麦克风采集的原始时域信号；对原始时域信号进行基于方向的增强抑制处理，以获取经处理时域信号，其中，根据头戴设备的当前使用场景选择增强抑制处理中需要增强和/或抑制的方向；根据原始时域信号与经处理时域信号的能量判定是否进行基于原始时域信号的语音处理。本公开基于经处理信号相比于原始信号的能量衰减程度来判定采集信号是否包含目标说话人的语音信息，尤其能够准确分辨非目标说话人大声说话的情况，避免头戴设备的误操作。技术研发人员：李林峰,黄海荣受保护的技术使用者：湖北星纪魅族集团有限公司技术研发日：技术公布日：2024/3/4