技术新讯 > 乐器声学设备的制造及制作,分析技术 > 车载屏幕的语音控制方法、装置、汽车及存储介质与流程 > 正文

车载屏幕的语音控制方法、装置、汽车及存储介质与流程

国知局
2024-08-22 14:47:31

本申请涉及车辆交互，尤其涉及一种车载屏幕的语音控制方法、装置、汽车及存储介质。

背景技术：

1、随着智能汽车的进步，语音在车机系统中有着高频的应用场景，现代车载屏幕已经成为一个多功能的信息和娱乐中心，提供了许多高级功能和应用程序。在车辆行驶过程中，用户可以仅通过说话就能达到操作某项功能的目的，极大地提升了用户的使用体验。

2、相关技术中，车载屏幕的语音控制方法完全依赖于自然语言识别的能力。用户发起语音指令，首先由自然语言进行语义识别，经过后端服务针对语义结果进行逻辑处理，最后交由端上服务进行指令执行。但是随着用户的多样化需求增加，车载屏幕的页面元素越来越复杂，车载屏幕页面存在各种的弹窗与复杂布局，给自然语言识别与页面元素的关联带来很大的挑战，导致相关技术中车载屏幕的语音控制方法的执行错误率越来越高。

3、如何更加准确地识别用户语音的意图，在车载屏幕复杂的页面元素中快速地执行语音命令，是亟须解决的问题。

技术实现思路

1、为解决或部分解决相关技术中存在的问题，本申请提供一种车载屏幕的语音控制方法、装置、汽车及存储介质，能够提高用户语音指令控制车载屏幕的准确率，提升用户的使用体验。

2、本申请第一方面提供一种车载屏幕的语音控制方法，包括：

3、接收语音指令，分析语音指令的操作意图；

4、获取车载屏幕中应用的页面元素，将页面元素按照预设格式转为操作组件；

5、根据操作意图和操作组件，确定目标应用并响应目标应用。

6、可选地，接收语音指令，分析语音指令的操作意图，包括：对语音指令进行语义分析，得到语义分析结果；根据语义分析结果，判断目标应用和目标应用对应的操作类型。

7、可选地，获取车载屏幕的操作组件，包括：识别车载屏幕的当前应用，获取当前应用的第一页面元素；按照预设数据读取方式，获取后台应用的第二页面元素。

8、可选地，按照预设数据读取方式，获取后台应用的第二页面元素，包括：获取后台应用预设的页面元素；和/或从后台应用的缓存数据中，获取页面元素，缓存数据为后台应用从车载屏幕前台退出时保存的缓存数据。

9、可选地，将页面元素按照预设格式转为操作组件，包括：获取页面元素对应的关键字，关键字包括：页面元素的视图组件标识、页面元素对应的应用、页面元素对应的操作指令和页面元素对应的应用场景；关联相同应用场景下的页面元素，根据相同应用场景下的页面元素的关键字，生成操作组件。

10、可选地，根据操作意图和操作组件，确定目标应用并响应目标应用，包括：确定操作意图对应的关键字；按照预设优先级获取所述操作组件，将所述操作意图对应的关键字和所述操作组件匹配；根据最优匹配结果，确定目标操作组件和目标操作组件对应的目标应用；根据所述目标操作组件响应所述目标应用，以执行目标应用对应的目标指令。

11、可选地，按照预设优先级获取操作组件，将操作意图对应的关键字和操作组件中的关键字逐一匹配，包括：判断车载屏幕当前应用的操作组件是否匹配操作意图；在当前操作组件不符合时，判断车载屏幕后台的操作组件是否匹配操作意图。

12、本申请第二方面一种车载屏幕的语音控制装置，包括：

13、接收单元，用于接收语音指令，分析语音指令的操作意图；

14、判断单元，用于获取车载屏幕中应用的页面元素，将页面元素按照预设格式转为操作组件；

15、执行单元，用于根据操作意图和操作组件，确定目标应用并响应目标应用。

16、本申请第三方面提供一种汽车，包括：

17、处理器；以及

18、存储器，其上存储有可执行代码，当可执行代码被处理器执行时，使处理器执行如上的方法。

19、本申请第四方面提供一种计算机可读存储介质，其上存储有可执行代码，当可执行代码被汽车的处理器执行时，使处理器执行如上的方法。

20、本申请提供的技术方案可以包括以下有益效果：

21、本申请能够将复杂的页面元素关联到相同应用场景的操作组件下，从而提高后续识别目标应用的准确率，并降低了识别目标应用的工作量。本申请还通过识别语音指令的操作意图，根据操作意图和操作组件匹配的结果，快速完成对车载屏幕中应用的响应。

22、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

技术特征：

1.一种车载屏幕的语音控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述接收语音指令，分析语音指令的操作意图，包括：

3.根据权利要求1所述的方法，其特征在于，所述获取车载屏幕的页面元素，包括：

4.根据权利要求1所述的方法，其特征在于，所述按照预设数据读取方式，获取后台应用的第二页面元素，包括：

5.根据权利要求1所述的方法，其特征在于，所述将所述页面元素按照预设格式转为操作组件，包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述操作意图和所述操作组件，确定目标应用并响应所述目标应用，包括：

7.根据权利要求6所述的方法，其特征在于，所述按照预设优先级获取所述操作组件，将所述操作意图对应的关键字和所述操作组件中的关键字逐一匹配，包括：

8.一种车载屏幕的语音控制装置，其特征在于，包括：

9.一种汽车，其特征在于，包括：

10.一种计算机可读存储介质，其特征在于，其上存储有可执行代码，当所述可执行代码被汽车的处理器执行时，使所述处理器执行如权利要求1至7任一项所述的方法。

技术总结本申请涉及一种车载屏幕的语音控制方法、装置、汽车及存储介质，该方法包括：接收语音指令，分析语音指令的操作意图；获取车载屏幕中应用的页面元素，将页面元素按照预设格式转为操作组件；根据操作意图和操作组件，确定目标应用并响应目标应用。本申请提供的车载屏幕的语音控制方法，能够将复杂的页面元素关联到相同应用场景的操作组件下，通过准确识别语音指令的操作意图，根据操作意图和操作组件匹配的结果，准确快速地完成对车载屏幕中目标应用的响应。技术研发人员：付俊强受保护的技术使用者：广州小鹏汽车科技有限公司技术研发日：技术公布日：2024/8/20