智能设备的控制命令触发方法、装置、设备和存储介质与流程
- 国知局
- 2024-06-21 11:58:30
本技术涉及人工智能,特别是涉及一种智能设备的控制命令触发方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、随着人工智能技术的发展,智能设备的应用越来越广泛,在使用智能设备时,常常通过语音信号触发智能设备的控制命令,基于控制命令对智能设备进行控制。传统技术中,在语音信号不是目标语种的语言时,容易将非命令词识别为命令词,从而导致误触发语音命令。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够避免误触发的智能设备的控制命令触发方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种智能设备的控制命令触发方法。所述方法包括:
3、对从语音信号中截取的至少两个语音片段进行特征提取,得到语音特征;
4、通过识别网络的命令词识别子网络,对所述语音特征进行命令词识别,得到命令词识别结果;
5、通过所述识别网络的语种识别子网络,对所述语音特征进行语种识别,得到语种识别结果;
6、当所述命令词识别结果与所述语种识别结果满足触发条件时,基于所述命令词识别结果触发控制命令。
7、第二方面,本技术还提供了一种智能设备的控制命令触发装置。所述装置包括:
8、提取模块,用于对从语音信号中截取的至少两个语音片段进行特征提取,得到语音特征;
9、命令词识别模块,用于通过识别网络的命令词识别子网络,对所述语音特征进行命令词识别,得到命令词识别结果;
10、语种识别模块,用于通过所述识别网络的语种识别子网络,对所述语音特征进行语种识别,得到语种识别结果;
11、触发模块,用于当所述命令词识别结果与所述语种识别结果满足触发条件时,基于所述命令词识别结果触发控制命令。
12、在一个实施例中,所述提取模块,还用于:
13、确定片段截取长度以及滑动窗口移动步长;
14、根据所述滑动窗口移动步长对滑动窗口进行移动;
15、基于所述片段截取长度,对移动后的所述滑动窗口内的语音信号进行截取,得到至少两个语音片段,并对所述语音片段进行特征提取。
16、在一个实施例中,所述触发条件包括命令词条件与语种条件;所述触发模块,还用于:
17、若所述命令词识别结果满足命令词条件、且所述语种识别结果满足语种条件,基于所述命令词识别结果触发控制命令。
18、在一个实施例中,所述命令词识别模块,还用于:
19、通过识别网络的命令词识别子网络,对所述语音特征进行命令词识别,得到命令词识别向量;所述命令词识别向量中包括至少两个向量元素;所述向量元素用于表示所述语音片段包含各命令词的概率,或者表示所述语音片段不包含命令词的概率;
20、对所述命令词识别向量中向量元素进行排序;
21、基于排序的结果确定所述语音片段对应的命令词识别结果。
22、在一个实施例中,所述语种识别模块,还用于:
23、通过所述识别网络的语种识别子网络对所述语音特征进行语种识,得到语种识别向量;所述语种识别向量中包括至少两个向量元素,所述向量元素用于表示所述语音片段为目标语种或者为所述目标语种之外的其他语种的概率;
24、对所述语种识别向量的向量元素进行排序;
25、基于排序的结果确定所述语音片段对应的语种识别结果。
26、在一个实施例中,所述识别网络是对预训练的识别网络进行训练所得,所述预训练的识别网络包括预训练的命令词识别子网络与预训练的语种识别子网络;所述装置还包括:
27、所述提取模块,还用于对从语音信号样本中截取的至少两个语音片段样本进行特征提取,得到语音样本特征;
28、所述命令词识别模块,还用于通过所述预训练的命令词识别子网络,对所述语音样本特征进行命令词识别,得到命令词训练结果;
29、所述语种识别模块,还用于通过所述预训练的语种识别子网络,对所述语音样本特征进行语种识别,得到语种训练结果;
30、计算模块,用于基于所述命令词训练结果以及所述语种训练结果进行计算,得到损失值;
31、训练模块,用于根据所述损失值对所述预训练的识别网络进行训练,得到所述识别网络。
32、在一个实施例中,所述计算模块,还用于:
33、基于所述命令词训练结果计算得到命令词子网络损失值;
34、基于所述语种训练结果计算得到语种子网络损失值;
35、根据加权参数对所述命令词子网络损失值与所述语种子网络损失值进行计算,得到损失值。
36、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
37、对从语音信号中截取的至少两个语音片段进行特征提取,得到语音特征;
38、通过识别网络的命令词识别子网络,对所述语音特征进行命令词识别,得到命令词识别结果;
39、通过所述识别网络的语种识别子网络,对所述语音特征进行语种识别,得到语种识别结果;
40、当所述命令词识别结果与所述语种识别结果满足触发条件时,基于所述命令词识别结果触发控制命令。
41、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
42、对从语音信号中截取的至少两个语音片段进行特征提取,得到语音特征;
43、通过识别网络的命令词识别子网络,对所述语音特征进行命令词识别,得到命令词识别结果;
44、通过所述识别网络的语种识别子网络,对所述语音特征进行语种识别,得到语种识别结果;
45、当所述命令词识别结果与所述语种识别结果满足触发条件时,基于所述命令词识别结果触发控制命令。
46、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
47、对从语音信号中截取的至少两个语音片段进行特征提取,得到语音特征;
48、通过识别网络的命令词识别子网络,对所述语音特征进行命令词识别,得到命令词识别结果;
49、通过所述识别网络的语种识别子网络,对所述语音特征进行语种识别,得到语种识别结果;
50、当所述命令词识别结果与所述语种识别结果满足触发条件时,基于所述命令词识别结果触发控制命令。
51、上述智能设备的控制命令触发方法、装置、计算机设备、存储介质和计算机程序产品,对从语音信号中截取的至少两个语音片段进行特征提取,得到语音特征。通过识别网络的命令词识别子网络,对语音特征进行命令词识别,得到命令词识别结果,通过识别网络的语种识别子网络,对语音特征进行语种识别,得到语种识别结果。当命令词识别结果与语种识别结果满足触发条件时,基于命令词识别结果触发控制命令。通过识别网络可以同时对语音片段的命令词和语种进行识别,在命令词识别结果和语种识别结果满足触发条件时才触发控制指令,可以有效避免非目标语种的语音信号造成的误触发。并且,计算机设备只需运行一个识别模型即可得到命令词识别结果与语种识别结果,提高了识别的速度,继而提高了控制命令的触发效率。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24818.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表