技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音控制方法、装置、电子设备和存储介质与流程 > 正文

语音控制方法、装置、电子设备和存储介质与流程

国知局
2024-06-21 10:41:57

本公开涉及ai(artificial intelligence，人工智能)领域，具体涉及语音技术、自动驾驶、nlp(natural language processing，自然语言处理)、深度学习等，尤其涉及语音控制方法、装置、电子设备和存储介质。

背景技术：

1、目前，用户或驾驶者可以通过无接触的方式，实现对车辆进行控制，比如，车机端可以提供所见即可说功能，基于该所见即可说功能，用户可以通过语音控制车机端内置的功能，或安装在车机端的app(application，应用)。其中，所见即可说，是指页面上能看到的所有内容(所见)，都可以通过语音来控制(所说)，而页面上无法看到的内容，不能通过语音来控制。

技术实现思路

1、本公开提供了一种用于语音控制方法、装置、电子设备和存储介质。

2、根据本公开的一方面，提供了一种语音控制方法，包括：

3、响应于监听到语音信号，对所述语音信号进行解析，以得到用于控制目标页面元素的控制指令；

4、获取处于前台运行状态的目标应用的标识信息；

5、查询是否存在与所述标识信息关联的第一注册数据；其中，所述第一注册数据中包含所述目标应用中当前时刻所展示的第一页面的可视区域中的至少一个第一页面元素的注册信息；

6、在存在所述第一注册数据，且各所述第一页面元素的注册信息中包含所述目标页面元素的注册信息的情况下，根据所述控制指令，对所述目标页面元素执行对应操作。

7、根据本公开的另一方面，提供了一种语音控制装置，包括：

8、解析模块，用于响应于监听到语音信号，对所述语音信号进行解析，以得到用于控制目标页面元素的控制指令；

9、获取模块，用于获取处于前台运行状态的目标应用的标识信息；

10、查询模块，用于查询是否存在与所述标识信息关联的第一注册数据；其中，所述第一注册数据中包含所述目标应用中当前时刻所展示的第一页面的可视区域中的至少一个第一页面元素的注册信息；

11、执行模块，用于在存在所述第一注册数据，且各所述第一页面元素的注册信息中包含所述目标页面元素的注册信息的情况下，根据所述控制指令，对所述目标页面元素执行对应操作。

12、根据本公开的又一方面，提供了一种电子设备，包括：

13、至少一个处理器；以及

14、与所述至少一个处理器通信连接的存储器；其中，

15、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开上述一方面提出的语音控制方法。

16、根据本公开的再一方面，提供了一种计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本公开上述一方面提出的语音控制方法。

17、根据本公开的还一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现本公开上述一方面提出的语音控制方法。

18、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种语音控制方法，包括：

2.根据权利要求1所述的方法，其中，所述根据所述控制指令，对所述目标页面元素执行对应操作，包括：

3.根据权利要2所述的方法，其中，所述将所述控制指令发送至所述目标应用，包括：

4.根据权利要求1所述的方法，其中，所述第一注册数据，是所述目标应用通过以下步骤注册的：

5.根据权利要求4所述的方法，其中，所述设定条件包括以下至少一项：

6.根据权利要求4所述的方法，其中，所述根据各所述第一页面元素的元素信息，生成所述第一注册数据，包括：

7.根据权利要求4所述的方法，其中，所述从各所述页面元素中确定所述第一页面元素，包括：

8.根据权利要求1所述的方法，其中，所述方法还包括：

9.根据权利要求1所述的方法，其中，所述方法还包括：

10.根据权利要求9所述的方法，其中，所述方法还包括：

11.根据权利要求1-10中任一项所述的方法，其中，所述方法还包括：

12.根据权利要求1-10中任一项所述的方法，其中，所述查询是否存在与所述标识信息关联的第一注册数据之后，所述方法还包括：

13.一种语音控制装置，包括：

14.根据权利要求13所述的装置，其中，所述执行模块，用于：

15.根据权利要求14所述的装置，其中，所述执行模块，用于：

16.根据权利要求13所述的装置，其中，所述第一注册数据，是所述目标应用通过以下模块注册的：

17.根据权利要求16所述的装置，其中，所述设定条件包括以下至少一项：

18.根据权利要求16所述的装置，其中，所述生成模块，用于：

19.根据权利要求16所述的装置，其中，所述确定模块，用于：

20.根据权利要求13所述的装置，其中，所述装置还包括：

21.根据权利要求13所述的装置，其中，所述装置还包括：

22.根据权利要求21所述的装置，其中，

23.根据权利要求13-22中任一项所述的装置，其中，所述装置还包括：

24.根据权利要求13-22中任一项所述的装置，其中，所述装置还包括：

25.一种电子设备，包括：

26.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-12中任一项所述的语音控制方法。

27.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-12中任一项所述语音控制方法的步骤。

技术总结本公开公开了一种语音控制方法、装置、电子设备和存储介质，涉及语音技术、自动驾驶、NLP、深度学习等领域。具体实现方案为：对语音信号进行解析，以得到用于控制目标页面元素的控制指令；获取处于前台运行状态的目标应用的标识信息；查询是否存在与标识信息关联的第一注册数据，若是，且第一注册数据中包括目标页面元素的注册信息，则根据控制指令，对目标页面元素执行对应操作。由此，通过将用户可见的页面元素进行注册，当注册数据中包括用户想要控制的目标页面元素的注册信息时，可对该目标页面元素进行控制，而当目标页面元素未被注册时，无需对该目标页面元素进行控制，可以在有效实现所见即可说功能的基础上，满足用户的个性化控制需求。技术研发人员：毛文强受保护的技术使用者：阿波罗智联（北京）科技有限公司技术研发日：技术公布日：2024/2/1