技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种语音助手启动方法、装置、终端及存储介质与流程  >  正文

一种语音助手启动方法、装置、终端及存储介质与流程

  • 国知局
  • 2024-06-21 11:52:58

本发明涉及计算机,特别是涉及一种语音助手启动方法、装置、终端及存储介质。

背景技术:

1、随着计算机技术的快速发展,终端向用户提供的服务日益丰富,终端中可以安装为用户提供不同服务的应用程序,例如,终端中安装有为用户提供语音交互服务的应用程序(即语音助手)。当用户启动终端中的语音助手之后,可以通过输入语音数据的方式,控制终端中的其他应用程序。例如,用户对终端中的语音助手说“导航去机场”,终端通过语音助手获取用户输入的语音数据之后,终端可以自动启动导航应用程序,并通过导航应用程序导航至机场。

2、相关技术中,用户可以通过以下方式,启动终端中安装的语音助手。例如,用户说出指定的唤醒词,例如,“你好,xxxx”,终端检测到用户说出唤醒词后,启动语音助手。或者,用户可以长按终端的电源键,终端检测到用户针对电源键的长按操作时,启动语音助手。

3、然而,上述过程中,通过唤醒词启动语音助手的方式,可能会存在无法唤醒、误唤醒、不方便唤醒等问题,降低用户体验。并且,通过长按终端的电源键启动语音助手的方式,容易导致用户误操作,例如,触发终端的重启或关机,降低用户体验。

技术实现思路

1、本发明实施例的目的在于提供一种语音助手启动方法、装置、终端及存储介质,以简化语音交互步骤,快速启动语音助手,提高用户体验。具体技术方案如下:

2、第一方面,为了达到上述目的,本发明实施例提供了一种语音助手启动方法,所述方法应用于终端,所述方法包括:

3、接收用户输入的语音数据,作为当前语音数据;

4、检测所述当前语音数据是否满足气息唤醒事件对应的第一触发条件;其中,所述第一触发条件包括:用户在输入所述当前语音数据时,针对所述终端进行预设动作,且所述当前语音数据的音量值属于预设音量值区间;

5、若检测到所述当前语音数据满足所述第一触发条件,启动所述终端中安装的所述语音助手。

6、可选的,在所述接收用户输入的语音数据,作为当前语音数据之后,所述方法还包括:

7、检测所述当前语音数据是否满足语音唤醒事件对应的第二触发条件;

8、若检测到所述当前语音数据满足所述第二触发条件,检测是否已通过所述气息唤醒事件启动所述语音助手;

9、若检测到已通过所述气息唤醒事件启动所述语音助手,不响应所述语音唤醒事件;

10、若检测到未通过所述气息唤醒事件启动所述语音助手,启动所述语音助手。

11、可选的,所述检测所述当前语音数据是否满足语音唤醒事件对应的第二触发条件,包括:

12、检测所述当前语音数据是否包含一级关键字;

13、若检测到所述当前语音数据包含所述一级关键字,检测所述当前语音数据是否包含二级唤醒词,以及所述当前语音数据的声纹特征是否与所述终端本地存储的目标声纹特征相同;

14、若检测到所述当前语音数据包含二级唤醒词,且所述当前语音数据的声纹特征与所述目标声纹特征相同,确定所述当前语音数据满足所述第二触发条件。

15、可选的,所述若检测到所述当前语音数据满足所述第一触发条件,启动所述终端中安装的所述语音助手,包括:

16、若检测到所述当前语音数据满足所述第一触发条件,检测是否已通过所述语音唤醒事件启动所述语音助手;

17、若检测到未通过所述语音唤醒事件启动所述语音助手,启动所述终端中安装的所述语音助手;

18、若检测到已通过所述语音唤醒事件启动所述语音助手,不响应所述气息唤醒事件。

19、可选的,所述若检测到所述当前语音数据满足所述第一触发条件,检测是否已通过所述语音唤醒事件启动所述语音助手,包括:

20、在检测到所述当前语音数据包含一级关键字之后,若检测到所述当前语音数据满足所述第一触发条件,检测是否已通过所述语音唤醒事件启动所述语音助手;

21、或者,

22、在检测到所述当前语音数据包含二级唤醒词,且所述当前语音数据的声纹特征与所述目标声纹特征相同之后,若检测到所述当前语音数据满足所述第一触发条件,检测是否已通过所述语音唤醒事件启动所述语音助手。

23、可选的,所述接收用户输入的语音数据,作为当前语音数据,包括:

24、接收用户输入的语音数据,并对接收到的语音数据进行分流处理,得到两路当前语音数据;

25、所述检测所述当前语音数据是否满足气息唤醒事件对应的第一触发条件,包括:

26、检测分流得到的一路当前语音数据是否满足气息唤醒事件对应的第一触发条件;

27、所述检测所述当前语音数据是否满足语音唤醒事件对应的第二触发条件,包括:

28、检测分流得到的另一路当前语音数据是否满足语音唤醒事件对应的第二触发条件。

29、可选的,所述启动所述终端中安装的所述语音助手,包括:

30、在所述终端的显示界面中,显示所述语音助手的语音交互页面。

31、可选的,在所述启动所述终端中安装的所述语音助手之后,所述方法还包括:

32、通过所述语音助手获取所述当前语音数据对应的响应语音数据,并播放所述响应语音数据。

33、第二方面,为了达到上述目的,本发明实施例提供了一种语音助手启动装置,所述装置应用于终端,所述装置包括:

34、语音数据获取模块,用于接收用户输入的语音数据,作为当前语音数据;

35、气息唤醒检测模块,用于检测所述当前语音数据是否满足气息唤醒事件对应的第一触发条件;若检测到所述当前语音数据满足所述第一触发条件,向语音助手发送第一启动指令;其中,所述第一触发条件包括:用户在输入所述当前语音数据时,针对所述终端进行预设动作,且所述当前语音数据的音量值属于预设音量值区间;

36、所述语音助手,用于在接收到所述第一启动指令后,按照所述第一启动指令在所述终端的显示界面中显示预设的语音交互页面。

37、可选的,所述装置还包括;

38、语音唤醒检测模块,用于检测所述当前语音数据是否满足语音唤醒事件对应的第二触发条件;若检测到所述当前语音数据满足所述第二触发条件,向所述语音助手发送第二启动指令;

39、所述语音助手,还用于在接收到所述第二启动指令后,检测是否已接收到所述气息唤醒检测模块发送的所述第一启动指令;若检测到已接收到所述第一启动指令,丢弃所述第二启动指令;若检测到未接收到所述气息唤醒检测模块发送的所述第一启动指令,按照所述第二启动指令在所述终端的显示界面中显示预设的语音交互页面。

40、可选的,所述语音唤醒检测模块,包括:

41、一级语音校验子模块,用于检测所述当前语音数据是否包含一级关键字;

42、二级语音校验子模块,用于检测所述当前语音数据是否包含二级唤醒词,以及所述当前语音数据的声纹特征是否与所述终端本地存储的目标声纹特征相同;若检测到所述当前语音数据包含二级唤醒词,且所述当前语音数据的声纹特征与所述目标声纹特征相同,确定所述当前语音数据满足所述第二触发条件。

43、可选的,所述语音助手,具体用于在接收到所述第一启动指令后,检测是否已接收到语音唤醒检测模块发送的第二启动指令;若检测到未接收到所述语音唤醒检测模块发送的所述第二启动指令,按照所述第一启动指令在所述终端的显示界面中显示预设的语音交互页面;若检测到已接收到所述语音唤醒检测模块发送的所述第二启动指令,丢弃所述第一启动指令。

44、可选的,所述语音助手,具体用于在所述一级语音校验子模块检测到所述当前语音数据包含一级关键字之后,在接收到所述第一启动指令后,检测是否已接收到语音唤醒检测模块发送的第二启动指令;

45、或者,

46、所述语音助手,具体用于在所述二级语音校验子模块检测到所述当前语音数据包含二级唤醒词,且所述当前语音数据的声纹特征与所述目标声纹特征相同之后,在接收到所述第一启动指令后,检测是否已接收到语音唤醒检测模块发送的第二启动指令。

47、可选的,所述语音数据获取模块,具体用于接收用户输入的语音数据,并对接收到的语音数据进行分流处理,得到两路当前语音数据;

48、所述气息唤醒检测模块,具体用于检测分流得到的一路当前语音数据是否满足气息唤醒事件对应的第一触发条件;

49、所述语音唤醒检测模块,具体用于检测分流得到的另一路当前语音数据是否满足语音唤醒事件对应的第二触发条件。

50、可选的,所述装置还包括:

51、语音数据缓存模块,用于将所述当前语音数据存储至预设缓存区;

52、所述语音助手,还用于从所述预设缓存区,获取所述当前语音数据;获取所述当前语音数据对应的响应语音数据,并播放所述响应语音数据。

53、第三方面,为了达到上述目的,本发明实施例提供了一种终端,包括:音频输入输出模块、主处理器和数字信号处理器;

54、所述音频输入输出模块,用于接收用户输入的语音数据,作为当前语音数据,并将所述当前语音数据发送至所述数字信号处理器;

55、所述数字信号处理器,用于检测所述当前语音数据是否满足气息唤醒事件对应的第一触发条件,将检测结果发送至主处理器;其中,所述第一触发条件包括:用户在输入所述当前语音数据时,针对所述终端进行预设动作,且所述当前语音数据的音量值属于预设音量值区间;

56、所述主处理器,用于在检测到所述当前语音数据满足所述第一触发条件时,启动所述终端中安装的所述语音助手。

57、可选的,所述数字信号处理器,还用于检测所述当前语音数据是否包含一级关键字,将检测结果发送至主处理器;

58、所述主处理器,还用于在检测到所述当前语音数据包含所述一级关键字时,检测所述当前语音数据是否包含二级唤醒词,以及所述当前语音数据的声纹特征是否与所述终端本地存储的目标声纹特征相同;并在检测到所述当前语音数据包含二级唤醒词,且所述当前语音数据的声纹特征与所述目标声纹特征相同时,确定所述当前语音数据满足所述第二触发条件;并在所述当前语音数据满足所述第二触发条件时,检测是否已通过所述气息唤醒事件启动所述语音助手;若检测到已通过所述气息唤醒事件启动所述语音助手,不响应所述语音唤醒事件;若检测到未通过所述气息唤醒事件启动所述语音助手,启动所述语音助手。

59、可选的,所述数字信号处理器,还用于对接收到的所述当前语音数据进行分流处理,对分流得到的一路当前语音数据执行所述检测所述当前语音数据是否满足气息唤醒事件对应的第一触发条件,将检测结果发送至主处理器的步骤;对分流得到的另一路当前语音数据执行所述检测所述当前语音数据是否包含一级关键字,将检测结果发送至主处理器的步骤。

60、本发明实施例还提供了一种终端,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

61、存储器,用于存放计算机程序;

62、处理器,用于执行存储器上所存放的程序时,实现上述任一所述的语音助手启动方法步骤。

63、本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的语音助手启动方法步骤。

64、本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的语音助手启动方法。

65、本发明实施例提供的一种语音助手启动方法,接收用户输入的语音数据,作为当前语音数据;检测当前语音数据是否满足气息唤醒事件对应的第一触发条件;第一触发条件包括:用户在输入当前语音数据时,针对终端进行预设动作,且当前语音数据的音量值属于预设音量值区间;若检测到当前语音数据满足第一触发条件,启动终端中安装的语音助手。

66、基于上述处理,第一触发条件包括:用户在输入当前语音数据时,针对终端进行预设动作,且当前语音数据的音量值属于预设音量值区间。当前语音数据满足第一触发条件,也就是用户抬起终端,且将终端靠近嘴部输入当前语音数据,表明用户需要启动语音助手,则启动终端中安装的语音助手,也就是可以通过气息唤醒事件启动语音助手,用户不需要通过唤醒词或长按电源键启动终端中安装的语音助手,可以简化语音交互步骤,快速启动语音助手,可以避免无法唤醒、误唤醒、不方便唤醒等问题,并且可以避免用户误操作的问题,可以提高用户体验。

67、当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

本文地址:https://www.jishuxx.com/zhuanli/20240618/24235.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。