技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音唤醒方法、装置、设备、可读存储介质及车辆与流程  >  正文

语音唤醒方法、装置、设备、可读存储介质及车辆与流程

  • 国知局
  • 2024-06-21 10:39:13

本公开涉及智能车辆,尤其涉及一种语音唤醒方法、装置、设备、可读存储介质及车辆。

背景技术:

1、随着科技的不断发展,车辆也在不断发展与进步,车辆上的语音唤醒功能也在不断完善。

2、目前,车辆上的语音唤醒功能可以由任意乘客唤醒,若可能导致行车风险的乘客(例如儿童等)进行了语音唤醒,不仅会给其他乘客带来困扰,而且可能影响行车安全。

技术实现思路

1、为了解决上述技术问题,本公开提供了一种语音唤醒方法、装置、设备、可读存储介质及车辆。

2、第一方面,本公开实施例提供一种语音唤醒方法,所述方法包括:

3、响应于唤醒语音,确定所述唤醒语音所在的目标音区;

4、获取所述目标音区的图像信息;

5、基于所述图像信息,判断发出所述唤醒语音的乘客的类别是否为禁止语音唤醒预设的乘客类别;

6、若是,则禁止本次唤醒操作。

7、在一些实施例中,所述响应于唤醒语音,确定所述唤醒语音所在的目标音区之后,所述方法还包括:

8、对所述目标音区对应的音频采集装置进行声源抑制,所述声源抑制至少包括关闭所述目标音区对应的音频采集装置、不执行所述目标音区对应的音频采集装置采集的语音指令;

9、若判断发出所述唤醒语音的乘客的类别不是禁止语音唤醒预设的乘客类别,则解除所述目标音区对应的音频采集装置的声源抑制。

10、在一些实施例中,所述响应于唤醒语音,确定所述唤醒语音所在的目标音区之后,所述方法还包括:

11、对所述唤醒语音进行识别,得到所述唤醒语音包括的唤醒词;

12、若判断发出所述唤醒语音的乘客的类别是禁止语音唤醒预设的乘客类别,则丢弃所述唤醒词。

13、在一些实施例中,所述对所述唤醒语音进行识别,得到所述唤醒语音包括的唤醒词,包括:

14、对所述唤醒词进行加锁处理,所述加锁处理为保留所述唤醒词但不进行唤醒操作。

15、在一些实施例中,所述对所述唤醒语音进行识别,得到所述唤醒语音包括的唤醒词之后,所述方法还包括:

16、对所述目标音区对应的音频采集装置进行声源抑制,所述声源抑制至少包括关闭所述目标音区对应的音频采集装置、不执行所述目标音区对应的音频采集装置采集的语音指令。

17、在一些实施例中,所述基于所述图像信息,判断发出所述唤醒语音的乘客的类别是否为禁止语音唤醒预设的乘客类别,包括:

18、基于所述图像信息,识别所述图像信息中的乘客的类别;

19、判断识别的乘客的类别是否为禁止语音唤醒预设的乘客类别。

20、在一些实施例中,所述基于所述图像信息,识别所述图像信息中的乘客的类别,包括:

21、对所述图像信息进行人体识别,得到所述图像信息中的乘客的体型信息;

22、基于识别的乘客的体型信息,确定所述图像信息中的乘客的类别。

23、在一些实施例中,所述方法还包括:

24、若判断发出所述唤醒语音的乘客的类别不是禁止语音唤醒预设的乘客类别,则执行唤醒反馈,并通过所述目标音区对应的音频采集装置继续采集语音指令。

25、第二方面,本公开实施例提供一种语音唤醒装置,所述装置包括:

26、确定模块,用于响应于唤醒语音,确定所述唤醒语音所在的目标音区;

27、获取模块,用于获取所述目标音区的图像信息;

28、判断模块,用于基于所述图像信息,判断发出所述唤醒语音的乘客的类别是否为禁止语音唤醒预设的乘客类别;

29、禁止模块,用于当判断发出所述唤醒语音的乘客的类别为禁止语音唤醒预设的乘客类别时,禁止本次唤醒操作。

30、第三方面,本公开实施例提供一种电子设备,包括:

31、存储器;

32、处理器;以及

33、计算机程序;

34、其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。

35、第四方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面所述的方法。

36、第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如上所述的语音唤醒方法。

37、第六方面,本公开实施例还提供了一种车辆,包括:

38、存储器;

39、处理器;以及

40、计算机程序;

41、其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如上所述的语音唤醒方法。

42、本公开实施例提供的语音唤醒方法、装置、设备、可读存储介质及车辆,通过响应于唤醒语音,确定唤醒语音所在的目标音区,获取目标音区的图像信息,基于图像信息,判断发出唤醒语音的乘客的类别是否为禁止语音唤醒预设的乘客类别,若是,则禁止本次唤醒操作。本公开实施例根据唤醒语音确定唤醒语音所在的目标音区,进一步获取目标音区的图像信息,基于图像信息判断发出唤醒语音的乘客的类别是否为禁止语音唤醒预设的乘客类别,由于唤醒前先判断发出唤醒语音的乘客的类别,当判断发出唤醒语音的乘客的类别为禁止语音唤醒预设的乘客类别时,禁止本次唤醒操作,可以避免儿童或其他可能导致行车风险的乘客执行语音唤醒功能,避免给其他乘客带来困扰,提高行车安全,提高乘客的体验。

技术特征:

1.一种语音唤醒方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述响应于唤醒语音,确定所述唤醒语音所在的目标音区之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述响应于唤醒语音,确定所述唤醒语音所在的目标音区之后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述唤醒语音进行识别,得到所述唤醒语音包括的唤醒词,包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述唤醒语音进行识别,得到所述唤醒语音包括的唤醒词之后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.一种语音唤醒装置,其特征在于,所述装置包括:

8.根据权利要求7所述的装置,其特征在于,所述装置还包括:

9.根据权利要求7所述的装置,其特征在于,所述装置还包括:

10.一种电子设备,其特征在于,包括:

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。

12.一种车辆,其特征在于,包括:

技术总结本公开涉及一种语音唤醒方法、装置、设备、可读存储介质及车辆,该方法包括:响应于唤醒语音,确定唤醒语音所在的目标音区;获取目标音区的图像信息;基于图像信息,判断发出唤醒语音的乘客的类别是否为禁止语音唤醒预设的乘客类别;若是,则禁止本次唤醒操作。由于唤醒前先获取目标音区的图像信息,基于图像信息判断发出唤醒语音的乘客的类别,当判断发出唤醒语音的乘客的类别为禁止语音唤醒预设的乘客类别时,禁止本次唤醒操作,可以避免儿童或其他可能导致行车风险的乘客执行语音唤醒功能,避免给其他乘客带来困扰,提高行车安全,提高乘客的体验。技术研发人员:胡含受保护的技术使用者:北京车和家信息技术有限公司技术研发日:技术公布日:2024/1/15

本文地址:https://www.jishuxx.com/zhuanli/20240618/20952.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。