技术新讯 > 乐器声学设备的制造及制作,分析技术 > 车载屏幕的语音控制方法、装置、汽车及存储介质与流程  >  正文

车载屏幕的语音控制方法、装置、汽车及存储介质与流程

  • 国知局
  • 2024-08-22 14:47:31

本申请涉及车辆交互,尤其涉及一种车载屏幕的语音控制方法、装置、汽车及存储介质。

背景技术:

1、随着智能汽车的进步,语音在车机系统中有着高频的应用场景,现代车载屏幕已经成为一个多功能的信息和娱乐中心,提供了许多高级功能和应用程序。在车辆行驶过程中,用户可以仅通过说话就能达到操作某项功能的目的,极大地提升了用户的使用体验。

2、相关技术中,车载屏幕的语音控制方法完全依赖于自然语言识别的能力。用户发起语音指令,首先由自然语言进行语义识别,经过后端服务针对语义结果进行逻辑处理,最后交由端上服务进行指令执行。但是随着用户的多样化需求增加,车载屏幕的页面元素越来越复杂,车载屏幕页面存在各种的弹窗与复杂布局,给自然语言识别与页面元素的关联带来很大的挑战,导致相关技术中车载屏幕的语音控制方法的执行错误率越来越高。

3、如何更加准确地识别用户语音的意图,在车载屏幕复杂的页面元素中快速地执行语音命令,是亟须解决的问题。

技术实现思路

1、为解决或部分解决相关技术中存在的问题,本申请提供一种车载屏幕的语音控制方法、装置、汽车及存储介质,能够提高用户语音指令控制车载屏幕的准确率,提升用户的使用体验。

2、本申请第一方面提供一种车载屏幕的语音控制方法,包括:

3、接收语音指令,分析语音指令的操作意图;

4、获取车载屏幕中应用的页面元素,将页面元素按照预设格式转为操作组件;

5、根据操作意图和操作组件,确定目标应用并响应目标应用。

6、可选地,接收语音指令,分析语音指令的操作意图,包括:对语音指令进行语义分析,得到语义分析结果;根据语义分析结果,判断目标应用和目标应用对应的操作类型。

7、可选地,获取车载屏幕的操作组件,包括:识别车载屏幕的当前应用,获取当前应用的第一页面元素;按照预设数据读取方式,获取后台应用的第二页面元素。

8、可选地,按照预设数据读取方式,获取后台应用的第二页面元素,包括:获取后台应用预设的页面元素;和/或从后台应用的缓存数据中,获取页面元素,缓存数据为后台应用从车载屏幕前台退出时保存的缓存数据。

9、可选地,将页面元素按照预设格式转为操作组件,包括:获取页面元素对应的关键字,关键字包括:页面元素的视图组件标识、页面元素对应的应用、页面元素对应的操作指令和页面元素对应的应用场景;关联相同应用场景下的页面元素,根据相同应用场景下的页面元素的关键字,生成操作组件。

10、可选地,根据操作意图和操作组件,确定目标应用并响应目标应用,包括:确定操作意图对应的关键字;按照预设优先级获取所述操作组件,将所述操作意图对应的关键字和所述操作组件匹配;根据最优匹配结果,确定目标操作组件和目标操作组件对应的目标应用;根据所述目标操作组件响应所述目标应用,以执行目标应用对应的目标指令。

11、可选地,按照预设优先级获取操作组件,将操作意图对应的关键字和操作组件中的关键字逐一匹配,包括:判断车载屏幕当前应用的操作组件是否匹配操作意图;在当前操作组件不符合时,判断车载屏幕后台的操作组件是否匹配操作意图。

12、本申请第二方面一种车载屏幕的语音控制装置,包括:

13、接收单元,用于接收语音指令,分析语音指令的操作意图;

14、判断单元,用于获取车载屏幕中应用的页面元素,将页面元素按照预设格式转为操作组件;

15、执行单元,用于根据操作意图和操作组件,确定目标应用并响应目标应用。

16、本申请第三方面提供一种汽车,包括:

17、处理器;以及

18、存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如上的方法。

19、本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当可执行代码被汽车的处理器执行时,使处理器执行如上的方法。

20、本申请提供的技术方案可以包括以下有益效果:

21、本申请能够将复杂的页面元素关联到相同应用场景的操作组件下,从而提高后续识别目标应用的准确率,并降低了识别目标应用的工作量。本申请还通过识别语音指令的操作意图,根据操作意图和操作组件匹配的结果,快速完成对车载屏幕中应用的响应。

22、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

技术特征:

1.一种车载屏幕的语音控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述接收语音指令,分析语音指令的操作意图,包括:

3.根据权利要求1所述的方法,其特征在于,所述获取车载屏幕的页面元素,包括:

4.根据权利要求1所述的方法,其特征在于,所述按照预设数据读取方式,获取后台应用的第二页面元素,包括:

5.根据权利要求1所述的方法,其特征在于,所述将所述页面元素按照预设格式转为操作组件,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述操作意图和所述操作组件,确定目标应用并响应所述目标应用,包括:

7.根据权利要求6所述的方法,其特征在于,所述按照预设优先级获取所述操作组件,将所述操作意图对应的关键字和所述操作组件中的关键字逐一匹配,包括:

8.一种车载屏幕的语音控制装置,其特征在于,包括:

9.一种汽车,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,其上存储有可执行代码,当所述可执行代码被汽车的处理器执行时,使所述处理器执行如权利要求1至7任一项所述的方法。

技术总结本申请涉及一种车载屏幕的语音控制方法、装置、汽车及存储介质,该方法包括:接收语音指令,分析语音指令的操作意图;获取车载屏幕中应用的页面元素,将页面元素按照预设格式转为操作组件;根据操作意图和操作组件,确定目标应用并响应目标应用。本申请提供的车载屏幕的语音控制方法,能够将复杂的页面元素关联到相同应用场景的操作组件下,通过准确识别语音指令的操作意图,根据操作意图和操作组件匹配的结果,准确快速地完成对车载屏幕中目标应用的响应。技术研发人员:付俊强受保护的技术使用者:广州小鹏汽车科技有限公司技术研发日:技术公布日:2024/8/20

本文地址:https://www.jishuxx.com/zhuanli/20240822/279888.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。