技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、装置、设备和介质与流程  >  正文

语音交互方法、装置、设备和介质与流程

  • 国知局
  • 2024-06-21 11:56:53

本申请涉及交互领域,尤其涉及一种语音交互方法、装置、设备和介质。

背景技术:

1、很多车辆的智能座舱具备可见即可说功能,可以使用语音交互对界面上显示的内容进行无手动触控式控制,也就是“可见即可说”控制。具体地,可以通过控制页面元素的语音指令对界面上显示的内容进行控制,其中,控制页面元素的语音指令称之为热词。

2、目前,实现可见即可说的方式需要引入第三方sdk(software development kit,软件开发工具包),或无法指定当前页面哪些元素可以响应热词,灵活性差。

3、因此,如何简化可见即可说的实现方式,提高灵活性,是较为重要的问题。

技术实现思路

1、本申请提供一种语音交互方法、装置、设备和介质,用以简化可见即可说的实现方式。

2、第一方面,本申请提供一种语音交互方法,包括:

3、接收到语音指令时,判断所述语音指令是否命中包括有元素特性的热词配置信息集合中的热词;

4、若是,根据所述热词获取对应的目标热词配置信息;

5、遍历当前页面的页面元素集合,确定是否存在与所述目标热词配置信息中的元素特性匹配的页面元素;

6、若是,对当前页面中与所述元素特性匹配的页面元素执行可见即可说操作。

7、可选地,通过下述方式得到热词配置信息集合:

8、预先在本地根据目标页面的各个页面元素的元素特性设置对应的热词配置信息,或从云端获取各个热词配置信息;

9、为各个所述热词配置信息配置对应的热词,并建立各个所述热词配置信息和对应热词之间的映射关系,得到热词配置信息集合。

10、可选地,所述为所述热词配置信息生成热词,具体包括:

11、调用可见即可说服务,控制所述可见即可说服务为所述热词配置信息配置热词。

12、可选地,所述为各个所述热词配置信息配置对应的热词,具体包括:

13、调用可见即可说服务,控制所述可见即可说服务为各个所述热词配置信息配置对应的热词。

14、可选地,得到热词配置信息集合之后,所述方法还包括:

15、将所述热词配置信息集合发送至语音助手;

16、所述接收到语音指令时,判断所述语音指令是否命中包括有元素特性的热词配置信息集合中的热词,具体包括:

17、启动所述语音助手,通过所述语音助手获取语音指令;

18、控制所述语音助手判断所述语音指令是否命中所述热词配置信息集合中的热词。

19、可选地,得到热词配置信息集合之后,所述方法还包括:

20、将所述热词配置信息集合存储于云端;

21、所述接收到语音指令时,判断所述语音指令是否命中包括有元素特性的热词配置信息集合中的热词,具体包括:

22、通过语音助手获取语音指令后,从云端获取所述热词配置信息集合,并将所示热词配置信息集合发送至所述语音助手;

23、控制所述语音助手

24、判断所述语音指令是否命中所述热词配置信息集合中的热词。

25、可选地,所述遍历当前页面的页面元素集合,确定是否存在与所述目标热词配置信息集合中的元素特性匹配的页面元素,具体包括:

26、将所述目标热词配置信息传递给可见即可说服务;

27、控制所述可见即可说服务遍历当前页面的页面元素集合,并获取各个页面元素的元素特性;

28、控制所述可见即可说服务确定是否存在与所述目标热词配置信息中的元素特性匹配的页面元素。

29、可选地,所述页面元素的元素特性包括以下至少一个:

30、页面元素的标识、页面元素对应的应用包名称、页面元素对应的控件类型,以及页面元素的层级信息;

31、所述页面元素的层级信息包括以下至少一种:

32、页面元素位于窗口层次中的层级、页面元素的父级控件的标识以及页面元素的父级控件的类型。

33、第二方面,本申请提供一种语音交互装置,包括:

34、预设模块,用于预先设定热词配置信息,为所述热词配置信息配置热词,并建立所述热词配置信息和所述热词之间的对应关系;

35、第一判断模块,用于接收到语音指令时,判断所述语音指令是否命中所述热词;

36、获取模块,用于在所述语音指令命中所述热词时,根据所述热词和所述热词配置信息之间的对应关系,获取所述热词配置信息;

37、第二判断模块,用于判断当前页面是否存在,匹配所述热词配置信息的页面元素;

38、执行模块,用于在当前页面中存在匹配所述热词配置信息的页面元素时,对与所述热词配置信息匹配的页面元素执行可见即可说操作。

39、第三方面,本申请提供一种电子设备,包括:存储器和处理器;

40、存储器用于存储指令;处理器用于调用存储器中的指令执行第一方面及第一方面任一种可能的设计中的方法。

41、第四方面,本申请提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机指令,当电子设备的至少一个处理器执行该计算机指令时,电子设备执行第一方面及第一方面任一种可能的设计中的方法。

42、第五方面,本申请提供一种计算机程序产品,所述计算机程序产品包括计算机指令,当电子设备的至少一个处理器执行该计算机指令时,电子设备执行第一方面及第一方面任一种可能的设计中的方法。

43、本申请提供的语音交互方法、装置、设备和介质,接收到语音指令时,判断语音指令是否命中预先设定的热词配置信息集合中的热词,若语音指令命中热词配置信息集合中的热词,根据命中的热词获取对应的目标热词配置信息。而后,遍历当前页面的页面元素集合,确定是否存在与目标热词配置信息中的元素特性匹配的页面元素,若存在,对当前页面中与目标热词配置信息中的元素特性匹配的页面元素执行可见即可说操作。通过预先设定的热词配置信息集合能够快速响应语音指令实现可见即可说,并且无需引入第三方软件开发工具包,降低资源占用。

技术特征:

1.一种语音交互方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,通过下述方式得到热词配置信息集合:

3.根据权利要求2所述的方法,其特征在于,所述为各个所述热词配置信息配置对应的热词,具体包括:

4.根据权利要求2所述的方法,其特征在于,得到热词配置信息集合之后,所述方法还包括:

5.根据权利要求2所述的方法,其特征在于,得到热词配置信息集合之后,所述方法还包括:

6.根据权利要求1-5中任意一项所述的方法,其特征在于,所述遍历当前页面的页面元素集合,确定是否存在与所述目标热词配置信息集合中的元素特性匹配的页面元素,具体包括:

7.根据权利要求6所述的方法,其特征在于,所述页面元素的元素特性包括以下至少一个:

8.一种语音交互装置,其特征在于,所述装置,包括:

9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现如权利要求1至7中任一项所述的方法。

技术总结本申请提供一种语音交互方法、装置、设备和介质,接收到语音指令时,判断语音指令是否命中预先设定的热词配置信息集合中的热词,若语音指令命中热词配置信息集合中的热词,根据命中的热词获取对应的目标热词配置信息。而后,遍历当前页面的页面元素集合,确定是否存在与目标热词配置信息中的元素特性匹配的页面元素,若存在,对当前页面中与目标热词配置信息中的元素特性匹配的页面元素执行可见即可说操作。通过预先设定的热词配置信息集合能够快速响应语音指令实现可见即可说,并且无需引入第三方软件开发工具包,降低资源占用。技术研发人员:陈剑,臧东来受保护的技术使用者:亿咖通(湖北)技术有限公司技术研发日:技术公布日:2024/6/5

本文地址:https://www.jishuxx.com/zhuanli/20240618/24654.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。