技术新讯 > 乐器声学设备的制造及制作,分析技术 > 可穿戴电子设备及其语音检测方法与流程  >  正文

可穿戴电子设备及其语音检测方法与流程

  • 国知局
  • 2024-06-21 11:39:06

本公开涉及语音处理领域,尤其涉及一种用于可穿戴电子设备的语音检测方法,以及应用该方法的可穿戴电子设备。

背景技术:

1、诸如智能眼镜的可穿戴电子设备可以为设备佩戴者提供影音娱乐与健康等相关的各种便捷功能。为了方便佩戴者进行操控,可穿戴电子设备通常都具备语音交互功能。

技术实现思路

1、根据本公开的第一方面,提出了一种可穿戴电子设备的语音检测方法,所述电子设备包括第一处理器和第二处理器,所述第二处理器的语音处理能效高于所述第一处理器,其中,所述方法包括:获取语音信号;确定第二处理器在所述语音信号中检测到唤醒词,对唤醒发生后的第一时段内的语音信号进行人声检测;确定第二处理器在所述第一时段内检测到人声,使得经由第一处理器实现对唤醒发生后的时长不长于第二时段的语音信号的命令词检测以进行语音识别。

2、可选地,所述获取语音信号还包括使用所述第二处理器对所述语音信号进行增强操作,所述增强操作包括回声消除、降噪处理、空间增强中的至少一者。

3、可选地,所述方法还包括:响应于第二处理器在第一时段内的语音信号中未检测到人声,使得经由所述第一处理器进行语音识别。

4、可选地,所述对唤醒发生后的第一时段内的语音信号进行人声检测,包括:在所述可穿戴电子设备的存储器中使用循环缓冲队列保存具有所述第二时段时长的语音信号,其中,所述第二时段的时长不小于所述第一时段的时长。

5、可选地,确定第二处理器在所述第一时段内检测到人声,使得经由第一处理器实现对唤醒发生的后时长不长于第二时段的语音信号的命令词检测以进行语音识别,包括:所述第二处理器将与所述第一时段内人声起始位置相对应的所述循环缓冲队列中的位置信息提供给所述第一处理器,使得所述第一处理器从所述循环缓冲队列中获取从所述位置信息开始且长度不长于所述第二时段的语音信号用于语音识别。

6、可选地,确定第二处理器在所述第一时段内检测到人声,使得经由第一处理器实现对唤醒发生后的时长不长于第二时段的语音信号的命令词检测以进行语音识别,包括:确定第二处理器在所述第一时段内检测到人声,使得所述第一处理器建立与语音识别服务器的连接;将所述唤醒发生后的时长不长于第二时段的语音信号提供给所述语音识别服务器以进行语音识别;以及基于所述语音识别服务器的语音识别结果,执行与所述命令词相应的操作。

7、可选地,所述方法还包括:确定所述第二处理器在所述第一时段内未检测到人声,触发引导用户说出命令词表达的提示操作;以及确定所述第二处理器在所述提示操作后的语音信号中检测到人声,使得经由所述第一处理器实现对所述提示操作后的时长不长于第二时段的语音信号的命令词检测以进行语音识别。

8、可选地,第一处理器是通用处理单元,第二处理器是专用处理单元。

9、根据本公开的第二方面,提出了一种可穿戴电子设备,包括:麦克风,用于采集语音信号;专用处理单元,用于采集的语音信号执行唤醒检测和连说检测,并且输出表示是否检测到唤醒词的唤醒检测结果和表示是否检测到人声的连说检测结果,其中,所述连说检测结果用于表示在唤醒发生后的第一时段内的语音信号是否检测到人声;以及通用处理单元,用于根据所述唤醒检测结果和所述连说检测结果,激活语音识别。

10、可选地,响应于所述连说检测结果表示未检测到人声,所述通用处理单元判定进行普通检测,并在激活所述语音识别之前还包括:触发引导用户说出命令词的提示操作。

11、可选地,所述专用处理单元包括:语音信号增强模块,用于对采集的语音信号执行语音信号增强操作以生成增强语音信号,并且,所述专用处理单元基于所述增强语音信号执行执行唤醒检测和连说检测。

12、可选地,所述语音信号增强模块包括:回声消除模块,对采集的语音信号执行回声消除以获得去除回声后的第一语音信号;降噪模块,对所述第一语音信号执行降噪处理以生成降低背景噪声后的第二语音信号;以及双麦克风增强模块,通过多麦克风增强技术,对所述第二语音信号执行空间增强处理并输出所述增强语音信号。

13、可选地,所述专用处理单元包括:唤醒检测模块,用于检测所述增强语音信号中是否存在所述唤醒词,并且输出所述唤醒检测结果;以及连说检测模块,用于在所述唤醒检测结果表示检测到唤醒词时,检测在唤醒发生后的第一时段内的所述增强语音输入中是否检测到人声,并且输出所述连说检测结果;并且所述通用处理单元包括:语音识别激活模块,用于根据所述唤醒检测结果和所述连说检测结果判定进行连说检测,激活所述语音识别;交互模块,用于建立与语音识别服务器的连接,将所述唤醒发生后的时长不长于第二时段的语音信号提供给所述语音识别服务器以进行语音识别,并获取所述所述语音识别服务器的语音识别结果;以及操作执行模块,基于所述语音识别服务器的语音识别结果,执行与所述命令词相应的操作。

14、可选地,所述专用处理单元使用一个循环队列来保存具有所述第一时段时长的增强语音信号,并且新到的语音信号覆盖之前的语音信号,并且,所述通用处理单元基于从所述专用处理单元获取的位置信息,从所述循环队列中获取用于执行语音识别的增强语音信号。

15、根据本公开的第三方面,提出了一种可穿戴电子设备,包括:处理器;以及存储器,用于存储计算机程序,其中,所述计算机程序在被所述处理器执行时,使得所述处理器执行根据本公开第一方面所述的方法。

16、可选地,所述可穿戴电子设备包括智能眼镜,所述智能眼镜包括麦克风,所述麦克风与所述处理器耦接。

技术特征:

1.可穿戴电子设备的语音检测方法,所述电子设备包括第一处理器和第二处理器,所述第二处理器的语音处理能效高于所述第一处理器,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述获取语音信号还包括使用所述第二处理器对所述语音信号进行增强操作,所述增强操作包括回声消除、降噪处理、空间增强中的至少一者。

3.根据权利要求1所述的方法,还包括:响应于第二处理器在第一时段内的语音信号中未检测到人声,使得经由所述第一处理器进行语音识别。

4.根据权利要求1所述的方法,其中,所述对唤醒发生后的第一时段内的语音信号进行人声检测,包括:在所述可穿戴电子设备的存储器中使用循环缓冲队列保存具有所述第二时段时长的语音信号,其中,所述第二时段的时长不小于所述第一时段的时长。

5.根据权利要求4所述的方法,其中,确定第二处理器在所述第一时段内检测到人声,使得经由第一处理器实现对唤醒发生的后时长不长于第二时段的语音信号的命令词检测以进行语音识别,包括:

6.根据权利要求1所述的方法,其中,确定第二处理器在所述第一时段内检测到人声,使得经由第一处理器实现对唤醒发生后的时长不长于第二时段的语音信号的命令词检测以进行语音识别,包括:

7.根据权利要求1所述的方法,还包括:

8.根据权利要求1所述的方法,其中,第一处理器是通用处理单元,第二处理器是专用处理单元。

9.可穿戴电子设备,包括:

10.根据权利要求9所述的可穿戴电子设备,其中,响应于所述连说检测结果表示未检测到人声,所述通用处理单元判定进行普通检测,并在激活所述语音识别之前还包括:触发引导用户说出命令词的提示操作。

11.根据权利要求9所述的可穿戴电子设备,其中,所述专用处理单元包括:

12.根据权利要求11所述的可穿戴电子设备,其中,所述语音信号增强模块包括:

13.根据权利要求11所述的可穿戴电子设备,其中,所述专用处理单元包括:

14.根据权利要求11所述的可穿戴电子设备,其中,所述专用处理单元使用一个循环队列来保存具有所述第一时段时长的增强语音信号,并且新到的语音信号覆盖之前的语音信号,

15.可穿戴电子设备,包括:处理器;

16.根据权利要求15所述的可穿戴电子设备,包括智能眼镜,所述智能眼镜包括麦克风,所述麦克风与所述处理器耦接。

技术总结公开了一种可穿戴电子设备及其语音检测方法。电子设备包括第一处理器和第二处理器,第二处理器的语音处理能效高于第一处理器。语音检测方法包括:获取语音信号;确定第二处理器在语音信号中检测到唤醒词,对唤醒发生后第一时段内的语音信号进行人声检测;以及确定在第一时段内检测到人声,使得经由第一处理器实现对唤醒发生后的时长不长于第二时段的语音信号进行语音识别。通过将唤醒检测、连说检测放在语音处理能效更高的第二处理器上实现,并在检测到连说时经由第一处理器进行后续命令词的识别,本公开能够在高效进行音频处理并降低主处理器开销的同时,快速检测出唤醒和连说,降低延迟,并防止唤醒连说时的漏识别和误识别。技术研发人员:李林峰,黄海荣,曹阳受保护的技术使用者:湖北星纪魅族集团有限公司技术研发日:技术公布日:2024/3/27

本文地址:https://www.jishuxx.com/zhuanli/20240618/22681.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。