技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音识别控制模块和语音识别控制框架的制作方法 > 正文

语音识别控制模块和语音识别控制框架的制作方法

国知局
2024-06-21 10:38:45

本发明涉及设备控制，尤其涉及一种语音识别控制模块和语音识别控制框架。

背景技术：

1、在智能家居、消费电子产品领域，采用语音识别控制模块进行语音采集、语音识别及基于识别的结果向控制设备传输控制信号。目前的语音识别控制模块内设置有语音控制模块以实现语音识别及控制信号生成，因语音识别控制模块的计算资源有限，导致语音识别控制模块的控制功能有限。

技术实现思路

1、基于此，有必要针对现有技术的语音识别控制模块的计算资源有限，导致语音识别控制模块的控制功能有限的技术问题，提出了一种语音识别控制模块和语音识别控制框架。

2、第一方面，提供了一种语音识别控制模块，所述语音识别控制模块包括：第一数据处理单元、第一音频获取单元、第一无线通信单元；

3、所述第一数据处理单元与所述第一音频获取单元、所述第一无线通信单元连接；

4、其中，所述第一数据处理单元用于：获取用户的第一音频信号，通过所述第一无线通信单元根据所述第一音频信号从智能设备获取目标命令数据，其中，所述智能设备用于对所述第一音频信号进行语音识别及所述目标命令数据确定；根据所述目标命令数据，向目标设备发送控制信号。

5、进一步地，所述第一数据处理单元还用于：将所述目标命令数据添加到第一队列中，基于预设发送规则，根据所述第一队列中的各个所述目标命令数据，向所述目标设备发送所述控制信号；

6、其中，所述预设发送规则包括：相同设备相同命令数据只发送一次、相同设备的各个命令数据合并发送；

7、所述智能设备用于：对所述第一音频信号进行语音识别及所述目标命令数据确定，和/或，获取待处理音频信号，对所述待处理音频信号进行语音识别及所述目标命令数据确定。

8、进一步地，所述第一数据处理单元还用于：从所述智能设备获取学习数据，根据所述学习数据进行学习，其中，所述学习数据包括：命令标识、标定语音数据和标准播报语音。

9、进一步地，所述语音识别控制模块还包括：音频播报模块，所述音频播报模块与所述第一数据处理单元连接，所述音频播报模块用于播放所述目标命令数据对应的所述标准播报语音。

10、进一步地，所述语音识别控制模块的工作模式包括：部分本地模式或全部非本地模式；

11、所述第一数据处理单元的所述通过所述第一无线通信单元根据所述第一音频信号从智能设备获取目标命令数据具体包括：

12、在所述语音识别控制模块的工作模式为全部非本地模式时，则通过所述第一无线通信单元根据所述第一音频信号从智能设备获取目标命令数据；

13、在所述语音识别控制模块的工作模式为部分本地模式时，则基于预设判断规则，对所述第一音频信号进行识别模式确定，在所述识别模式为本地时，对所述第一音频信号进行语音识别及所述目标命令数据确定，在所述识别模式为非本地时，通过所述第一无线通信单元根据所述第一音频信号从所述智能设备获取所述目标命令数据；

14、其中，所述预设判断规则包括：信号长度超过第一阈值和/或命令数量超过第二阈值时为非本地。

15、进一步地，所述第一数据处理单元的所述在所述识别模式为本地时，对所述第一音频信号进行语音识别及所述目标命令数据确定具体包括：对所述第一音频信号进行语音降噪处理和语音增强处理，得到目标音频信号，对所述目标音频信号进行语音识别及所述目标命令数据确定。

16、第二方面，提供了一种语音识别控制框架，所述框架包括：智能设备和如上述任一项所述的语音识别控制模块，所述智能设备与所述语音识别控制模块通讯连接。

17、进一步地，所述智能设备包括：第二数据处理单元、第二无线通信单元；

18、所述第二数据处理单元用于通过所述第二无线通信单元获取所述语音识别控制模块的第一无线通信单元发送的第一音频信号，将所述第一音频信号添加到第二队列中，对所述第二队列中的所述第一音频信号进行语音识别及目标命令数据确定所，通过所述第二无线通信单元将所述目标命令数据发送给所述第一无线通信单元。

19、进一步地，所述智能设备还包括：第二音频获取单元，所述第二音频获取单元与所述第二数据处理单元连接，所述第二音频获取单元用于获取用户的第二音频信号；

20、所述第二数据处理单元，还用于对所述第二音频信号进行回声消除处理、语音降噪处理和语音增强处理，得到第三音频信号，根据所述第三音频信号生成所述学习数据，将所述学习数据通过所述第二无线通信单元发送给所述第一无线通信单元，其中，所述语音识别控制模块用于根据所述学习数据进行学习；

21、所述第二数据处理单元，还用于获取待处理音频信号，对所述待处理音频信号进行回声消除处理、语音降噪处理和语音增强处理，得到第四音频信号，对所述第四音频信号进行语音识别及所述目标命令数据确定。

22、进一步地，所述第二数据处理单元的所述根据所述第三音频信号生成所述学习数据具体包括：

23、根据所述第三音频信号生成命令标识和标定语音数据；

24、将预设合成配置作为语音合成配置；

25、基于预设的语音合成模型和所述语音合成配置，根据所述标定语音数据和所述命令标识对应的播报文本进行语音合成，得到待处理播报语音；

26、根据所述待处理播报语音进行语音播报；

27、基于播报的语音获取用户的选择结果；

28、若所述选择结果为失败标识，则对所述语音合成配置进行调整，跳转到所述基于预设的语音合成模型和所述语音合成配置，根据所述标定语音数据和所述命令标识对应的播报文本进行语音合成，得到待处理播报语音的步骤重新执行；

29、若所述选择结果为成功标识，则将所述待处理播报语音作为所述第三音频信号对应的标准播报语音。

30、本申请的语音识别控制模块，通过所述第一无线通信单元根据所述第一音频信号从智能设备获取目标命令数据，从而将语音的识别及目标命令数据的确定放在智能设备，减少了语音识别控制模块的成本费用；而智能设备的计算资源比语音识别控制模块的计算资源高，通过借助了智能设备的计算资源，提高了用于语音识别及目标命令数据的准确度，增加了语音识别控制模块的控制功能。

技术特征：

1.一种语音识别控制模块，其特征在于，所述语音识别控制模块包括：第一数据处理单元、第一音频获取单元、第一无线通信单元；

2.根据权利要求1所述的语音识别控制模块，其特征在于，所述第一数据处理单元还用于：将所述目标命令数据添加到第一队列中，基于预设发送规则，根据所述第一队列中的各个所述目标命令数据，向所述目标设备发送所述控制信号；

3.根据权利要求1所述的语音识别控制模块，其特征在于，所述第一数据处理单元还用于：从所述智能设备获取学习数据，根据所述学习数据进行学习，其中，所述学习数据包括：命令标识、标定语音数据和标准播报语音。

4.根据权利要求3所述的语音识别控制模块，其特征在于，所述语音识别控制模块还包括：音频播报模块，所述音频播报模块与所述第一数据处理单元连接，所述音频播报模块用于播放所述目标命令数据对应的所述标准播报语音。

5.根据权利要求1所述的语音识别控制模块，其特征在于，所述语音识别控制模块的工作模式包括：部分本地模式或全部非本地模式；

6.根据权利要求5所述的语音识别控制模块，其特征在于，所述第一数据处理单元的所述在所述识别模式为本地时，对所述第一音频信号进行语音识别及所述目标命令数据确定具体包括：对所述第一音频信号进行语音降噪处理和语音增强处理，得到目标音频信号，对所述目标音频信号进行语音识别及所述目标命令数据确定。

7.一种语音识别控制框架，其特征在于，所述框架包括：智能设备和如权利要求1至6任一项所述的语音识别控制模块，所述智能设备与所述语音识别控制模块通讯连接。

8.根据权利要求7所述的语音识别控制框架，其特征在于，所述智能设备包括：第二数据处理单元、第二无线通信单元；

9.根据权利要求8所述的语音识别控制框架，其特征在于，所述智能设备还包括：第二音频获取单元，所述第二音频获取单元与所述第二数据处理单元连接，所述第二音频获取单元用于获取用户的第二音频信号；

10.根据权利要求9所述的语音识别控制框架，其特征在于，所述第二数据处理单元的所述根据所述第三音频信号生成所述学习数据具体包括：

技术总结本申请揭示了一种语音识别控制模块和语音识别控制框架，其中语音识别控制模块包括：第一数据处理单元、第一音频获取单元、第一无线通信单元；第一音频获取单元，用于获取用户的第一音频信号；第一数据处理单元与第一音频获取单元、第一无线通信单元连接；第一数据处理单元用于：通过第一无线通信单元根据第一音频信号从智能设备获取目标命令数据，其中，智能设备用于对第一音频信号进行语音识别及目标命令数据确定；根据目标命令数据，向目标设备发送控制信号。通过借助了智能设备的计算资源，提高了用于语音识别及目标命令数据的准确度，增加了语音识别控制模块的控制功能。技术研发人员：李国军,周翌受保护的技术使用者：深圳唯创知音电子有限公司技术研发日：技术公布日：2024/1/15