技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音控制方法、装置、设备及计算机可读存储介质与流程  >  正文

语音控制方法、装置、设备及计算机可读存储介质与流程

  • 国知局
  • 2024-06-21 11:26:55

本技术实施例涉及智能控制,特别涉及一种语音控制方法、装置、设备及计算机可读存储介质。

背景技术:

1、随着智能控制技术的不断发展,设备的智能化程度越来越高,智能设备仅通过用户的语音即可执行对应的控制操作。

2、相关技术中,智能设备中存储有多个关键词和各个关键词对应的控制操作;响应于获取到语音数据,将语音数据转换成文本内容,基于文本内容中包括目标关键词,则执行目标关键词对应的控制操作。

3、然而,上述语音控制方法需要文本内容中包括关键词才能执行关键词对应的控制操作,使得语音控制的自由度和灵活性较差。而且,容易出现用户没有特意说出关键词,但智能设备误识别到关键词并做出了响应的情况,使得语音控制的准确性较差,进而降低了用户的交互体验。

技术实现思路

1、本技术实施例提供了一种语音控制方法、装置、设备及计算机可读存储介质,可用于解决相关技术中的问题。所述技术方案如下:

2、一方面,本技术实施例提供了一种语音控制方法,所述方法包括:

3、对获取到的控制语音进行转换,得到所述控制语音对应的文本内容;

4、确定各个控制文本和所述文本内容之间的匹配度,任一控制文本对应一种控制操作;

5、在所述各个控制文本中确定目标控制文本,所述目标控制文本为所述各个控制文本中和所述文本内容之间的匹配度大于匹配度阈值,且满足匹配要求的控制文本;

6、执行所述目标控制文本对应的控制操作。

7、在一种可能的实现方式中,执行所述目标控制文本对应的控制操作,包括:

8、获取所述目标控制文本对应的控制参数;

9、按照所述目标控制文本对应的控制参数,执行所述目标控制文本对应的控制操作。

10、在一种可能的实现方式中,所述获取所述目标控制文本对应的控制参数,包括:

11、基于所述目标控制文本中包括控制参数,将所述目标控制文本中包括的控制参数作为所述目标控制文本对应的控制参数;

12、或者,基于所述目标控制文本中不包括控制参数,播放控制参数获取语音;基于所述控制参数获取语音,获取所述目标控制文本对应的控制参数;

13、或者,基于所述目标控制文本中不包括控制参数,显示控制参数获取页面,所述控制参数获取页面中显示有控制参数获取框;根据所述控制参数获取框中输入的内容,获取所述目标控制文本对应的控制参数。

14、在一种可能的实现方式中,所述在所述各个控制文本中确定目标控制文本,包括:

15、在所述各个控制文本中确定至少一个第一控制文本,任一第一控制文本和所述文本内容之间的匹配度大于所述匹配度阈值;将所述至少一个第一控制文本中和所述文本内容之间的匹配度满足匹配要求的控制文本作为所述目标控制文本;

16、或者,在所述各个控制文本中确定第二控制文本,所述第二控制文本和所述文本内容之间的匹配度满足匹配要求;基于所述第二控制文本和所述文本内容之间的匹配度大于所述匹配度阈值,将所述第二控制文本作为所述目标控制文本。

17、在一种可能的实现方式中,所述方法还包括:

18、基于所述各个控制文本中不存在和所述文本内容之间的匹配度大于匹配度阈值的控制文本,或,基于所述各个控制文本中和所述文本内容之间的匹配度满足匹配要求的控制文本和所述文本内容之间的匹配度不满足匹配要求,展示提示内容,所述提示内容用于提示重新获取控制语音。

19、在一种可能的实现方式中,所述确定各个控制文本和所述文本内容之间的匹配度,包括:

20、获取用于表征所述各个控制文本的第一文本特征向量;

21、获取用于表征所述文本内容的第二文本特征向量;

22、根据各个第一文本特征向量和所述第二文本特征向量,确定所述各个控制文本和所述文本内容之间的匹配度。

23、在一种可能的实现方式中,所述对获取到的控制语音进行转换,得到所述控制语音对应的文本内容,包括:

24、获取用于表征所述控制语音的音色的音色特征向量;

25、根据所述音色特征向量,确定发出所述控制语音的对象的设备控制权限;

26、基于发出所述控制语音的对象的设备控制权限指示所述对象具有设备控制权限,对获取到的控制语音进行转换,得到所述控制语音对应的文本内容。

27、另一方面,本技术实施例提供了一种语音控制装置,所述装置包括:

28、获取模块,用于对获取到的控制语音进行转换,得到所述控制语音对应的文本内容;

29、确定模块,用于确定各个控制文本和所述文本内容之间的匹配度,任一控制文本对应一种控制操作;

30、所述确定模块,还用于在所述各个控制文本中确定目标控制文本,所述目标控制文本为所述各个控制文本中和所述文本内容之间的匹配度大于匹配度阈值,且满足匹配要求的控制文本;

31、执行模块,用于执行所述目标控制文本对应的控制操作。

32、在一种可能的实现方式中,所述执行模块,用于获取所述目标控制文本对应的控制参数;按照所述目标控制文本对应的控制参数,执行所述目标控制文本对应的控制操作。

33、在一种可能的实现方式中,所述执行模块,用于基于所述目标控制文本中包括控制参数,将所述目标控制文本中包括的控制参数作为所述目标控制文本对应的控制参数;或者,基于所述目标控制文本中不包括控制参数,播放控制参数获取语音;基于所述控制参数获取语音,获取所述目标控制文本对应的控制参数;或者,基于所述目标控制文本中不包括控制参数,显示控制参数获取页面,所述控制参数获取页面中显示有控制参数获取框;根据所述控制参数获取框中输入的内容,获取所述目标控制文本对应的控制参数。

34、在一种可能的实现方式中,所述确定模块,用于在所述各个控制文本中确定至少一个第一控制文本,任一第一控制文本和所述文本内容之间的匹配度大于所述匹配度阈值;将所述至少一个第一控制文本中和所述文本内容之间的匹配度满足匹配要求的控制文本作为所述目标控制文本;或者,在所述各个控制文本中确定第二控制文本,所述第二控制文本和所述文本内容之间的匹配度满足匹配要求;基于所述第二控制文本和所述文本内容之间的匹配度大于所述匹配度阈值,将所述第二控制文本作为所述目标控制文本。

35、在一种可能的实现方式中,所述装置还包括:

36、展示模块,用于基于所述各个控制文本中不存在和所述文本内容之间的匹配度大于匹配度阈值的控制文本,或,基于所述各个控制文本中和所述文本内容之间的匹配度满足匹配要求的控制文本和所述文本内容之间的匹配度不满足匹配要求,展示提示内容,所述提示内容用于提示重新获取控制语音。

37、在一种可能的实现方式中,所述确定模块,用于获取用于表征所述各个控制文本的第一文本特征向量;获取用于表征所述文本内容的第二文本特征向量;根据各个第一文本特征向量和所述第二文本特征向量,确定所述各个控制文本和所述文本内容之间的匹配度。

38、在一种可能的实现方式中,所述获取模块,用于获取用于表征所述控制语音的音色的音色特征向量;根据所述音色特征向量,确定发出所述控制语音的对象的设备控制权限;基于发出所述控制语音的对象的设备控制权限指示所述对象具有设备控制权限,对获取到的控制语音进行转换,得到所述控制语音对应的文本内容。

39、另一方面,本技术实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以使计算机设备实现上述任一所述的语音控制方法。

40、另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以使计算机实现上述任一所述的语音控制方法。

41、另一方面,还提供了一种计算机程序或计算机程序产品,所述计算机程序或计算机程序产品中存储有至少一条计算机指令,所述至少一条计算机指令由处理器加载并执行,以使计算机实现上述任一种语音控制方法。

42、本技术实施例提供的技术方案至少带来如下有益效果:

43、本技术实施例提供的技术方案在获取到控制语音之后,将控制语音转换为文本,确定文本和控制文本之间的匹配度,每个控制文本对应一个控制操作,进而执行匹配度满足匹配要求的控制文本所对应的控制操作。由于不需要文本内容中必须包括控制文本也即是控制语音中不需要包括控制文本,这样能够提高语音控制的灵活性和自由度。而且,由于是根据匹配度来确定目标控制文本,进而执行目标控制文本对应的控制操作,这样能够降低误控制的概率,进而能够提高语音控制的准确性。

本文地址:https://www.jishuxx.com/zhuanli/20240618/21585.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。