技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音关联方法、装置、设备及存储介质与流程 > 正文

语音关联方法、装置、设备及存储介质与流程

国知局
2024-06-21 11:44:42

本公开涉及语音处理领域，具体涉及语音识别、语音交互等，可应用于多音区交互场景下，尤其涉及一种语音关联方法、装置、设备及存储介质。

背景技术：

1、车载语音助手为了理解新接收到的语音的用户预期目标，需要使用云端在线的大量计算资源对新接收到的语音和其他音区的历史语音进行上下文联系。但当车载语音助手无法与云端进行通信时，由于计算资源不足，不能对当前语音和其他音区的历史语音进行上下文联系，不能完成用户预期目标。

2、目前，车载语音助手会通过白名单的方式，来确定当前语音是否与其他音区的历史语音相关联，从而根据当前语音和相关联的历史语音控制车辆，完成用户预期目标。

3、但是，这种设置白名单的方式的可扩展性差，导致车辆不能准确地完成用户预期的目标，用户体验较差。

技术实现思路

1、本公开提供了一种语音关联方法、装置、设备及存储介质，能够在离线状态下准确地将当前语音与不同音区的历史语音相关联，提高用户体验。

2、根据本公开的第一方面，提供了一种语音关联方法，包括：

3、接收到来自第一音区的第一语音；根据第一语音，得到第一语音的第一解析结果，第一解析结果用于指示第一语音的意图；获取来自第二音区的第二语音对应的识别文本、第二语音的第二解析结果，第二语音为历史语音，第二解析结果用于指示第二语音的控制类别和意图；根据第一解析结果中的第一语音的意图，以及第二语音对应的关联规则，从第二语音中，确定第三语音，第二语音对应的关联规则为根据第二语音的第二解析结果的控制类别确定的，第三语音为对应的关联规则包括第一语音的意图能够满足的关联规则的第二语音；根据第一语音和第三语音，确定目标控制指令。

4、根据本公开的第二方面，提供了一种语音关联装置，该装置包括：

5、接收模块，用于接收到来自第一音区的第一语音。

6、解析模块，用于根据第一语音，得到第一语音的第一解析结果，第一解析结果用于指示第一语音的意图。

7、获取模块，用于获取来自第二音区的第二语音对应的识别文本、第二语音的第二解析结果，第二语音为历史语音，第二解析结果用于指示第二语音的控制类别和意图。

8、确定模块，用于根据第一解析结果中的第一语音的意图，以及第二语音对应的关联规则，从第二语音中，确定第三语音，第二语音对应的关联规则为根据第二语音的第二解析结果的控制类别确定的，第三语音为对应的关联规则包括第一语音的意图能够满足的关联规则的第二语音。

9、控制模块，用于根据第一语音和第三语音，确定目标控制指令。

10、根据本公开的第三方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如第一方面的方法。

11、根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行根据第一方面的方法。

12、根据本公开的第五方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现根据第一方面的方法。

13、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种语音关联方法，所述方法包括：

2.根据权利要求1所述的方法，所述根据所述第一解析结果中的所述第一语音的意图，以及所述第二语音对应的关联规则，从所述第二语音中，确定第三语音，包括：

3.根据权利要求1或2所述的方法，所述第三语音包括多个，所述根据所述第一语音和所述第三语音，确定目标控制指令，包括：

4.根据权利要求1-3任一项所述的方法，在所述获取第二音区的第二语音、所述第二语音的第二解析结果之后，所述方法还包括：

5.根据权利要求1-4任一项所述的方法，所述第一音区的历史语音对应的识别文本存储于第一数组容器中，所述来自第二音区的第二语音对应的识别文本存储于第二数组容器中，所述第一数组容器和所述第二数组容器设置在一个单例中。

6.根据权利要求1-5所述的方法，在所述根据所述第一解析结果中的所述第一语音的意图，以及所述第二语音对应的关联规则，从所述第二语音中，确定第三语音之后，所述方法还包括：

7.一种语音关联装置，所述装置包括：

8.根据权利要求7所述的装置，所述确定模块，具体用于：

9.根据权利要求7或8所述的装置，所述第三语音包括多个，所述控制模块，具体用于：

10.根据权利要求7-9任一项所述的装置，所述装置还包括：

11.根据权利要求7-10任一项所述的装置，所述第一音区的历史语音对应的识别文本存储于第一数组容器中，所述来自第二音区的第二语音对应的识别文本存储于第二数组容器中，所述第一数组容器和所述第二数组容器设置在一个单例中。

12.根据权利要求7-11所述的装置，所述装置还包括：

13.一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；

14.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使计算机执行根据权利要求1-6任一项所述的方法。

15.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-6任一项所述的方法。

技术总结本公开提供了一种语音关联方法、装置、设备及存储介质，涉及语音处理领域，具体涉及语音识别、语音交互等技术领域，可应用于多音区交互场景下。具体实现方案包括：接收到来自第一音区的第一语音；根据第一语音，得到第一语音的第一解析结果；获取来自第二音区的第二语音对应的识别文本、第二语音的第二解析结果；根据第一解析结果中的第一语音的意图，以及第二语音对应的关联规则，从第二语音中，确定第三语音；根据第一语音和第三语音，确定目标控制指令。本公开能够在离线状态下准确地将当前语音与不同音区的历史语音相关联，提高用户体验。技术研发人员：周文欢受保护的技术使用者：阿波罗智联（北京）科技有限公司技术研发日：技术公布日：2024/4/17