语音处理方法、装置、设备及介质与流程
- 国知局
- 2024-06-21 11:57:27
本公开涉及人工智能,尤其涉及一种语音处理方法、装置、设备及介质。
背景技术:
1、人工智能(artificial intelligence,ai),是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别等。随着人工智能的发展,基于人工智能进行语音识别处理,成为一种常见的交互方式。
2、相关技术中,对于用户的语音控制指令出现多语义时,多采用澄清技术,通过多次与用户交互,使得用户选择正确的语义,以完成语音处理,如当用户的语音控制指令为“播放匆匆那年”,则对应的语义服务对象可能是歌曲类型,也有可能是视频类型,因此,需要再次与用户交互以进行语义澄清,比如,询问用户“你想听匆匆那年的歌曲还是视频”等,当用户确认“想听歌曲”,则确定最后的语义识别结果为“播放匆匆那年歌曲”,而与用户进行交互以获取正确的语义过程的耗时,导致语音处理的效率较低。
技术实现思路
1、为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种语音处理方法、装置、设备及介质,在语音控制指令对应的语音服务对象存在多个服务类型时,通过语音控制指令对应的语义服务对象与开启的应用程序的服务类型匹配,确定与语音控制指令对应的应用程序,以便于基于对应的应用程序提供语音服务,减少了与用户进行语义澄清的交互,降低了语义澄清的耗时,提升了语音处理效率。
2、本公开实施例提供了一种语音处理方法,所述方法包括:响应于接收到的语音控制指令,确定与所述语音控制指令对应的语义服务对象以及所述语义服务对象的第一服务类型;在所述第一服务类型为多个的情况下,确定当前处于开启状态的应用程序的第二服务类型,并将所述第二服务类型与所述第一服务类型匹配;在所述第二服务类型中存在与所述第一服务类型匹配成功的第一目标服务类型的情况下,通过所述第一目标服务类型对应的应用程序提供与所述语义服务对象对应的语音服务。
3、本公开实施例还提供了一种语音处理装置,所述装置包括:确定模块,用于响应于接收到的语音控制指令,确定与所述语音控制指令对应的语义服务对象以及所述语义服务对象的第一服务类型;匹配模块,用于在所述第一服务类型为多个的情况下,确定当前处于开启状态的应用程序的第二服务类型,并将所述第二服务类型与所述第一服务类型匹配;处理模块,用于在所述第二服务类型中存在与所述第一服务类型匹配成功的第一目标服务类型的情况下,通过所述第一目标服务类型对应的应用程序提供与所述语义服务对象对应的语音服务。
4、本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的语音处理方法。
5、本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的语音处理方法。
6、本公开实施例提供的技术方案与现有技术相比具有如下优点:
7、本公开实施例提供的语音处理方案,响应于接收到的语音控制指令,确定与语音控制指令对应的语义服务对象以及语义服务对象的第一服务类型,在第一服务类型为多个的情况下,确定当前处于开启状态的应用程序的第二服务类型,并将第二服务类型与第一服务类型匹配,进而,在第二服务类型中存在与第一服务类型匹配成功的第一目标服务类型的情况下,通过第一目标服务类型对应的应用程序提供与语义服务对象对应的语音服务。在本公开的实施例中,在语音控制指令对应的语音服务对象存在多个服务类型时,通过语音控制指令对应的语义服务对象与开启的应用程序的服务类型匹配,确定与语音控制指令对应的应用程序,以便于基于对应的应用程序提供语音服务,从而,减少了与用户进行语义澄清的交互,降低了语义澄清的耗时,提升了语音处理效率。
技术特征:1.一种语音处理方法,其特征在于,包括以下步骤:
2.如权利要求1所述的方法,其特征在于,所述确定与所述语音控制指令对应的语义服务对象以及所述语义服务对象的第一服务类型,包括:
3.如权利要求2所述的方法,其特征在于,所述对所述分词标签单元集合中由所述行分词和列分词组成的各子单元标注对应的信息类别标签,包括:
4.如权利要求2或3所述的方法,其特征在于,所述根据所述分词标签单元集合中的所述信息类别标签确定所述语义服务对象和所述语义服务对象的第一服务类型,包括:
5.如权利要求1所述的方法,其特征在于,在所述将所述第二服务类型与所述第一服务类型匹配以获取匹配结果之后,还包括:
6.如权利要求5所述的方法,其特征在于,还包括:
7.如权利要求5或6所述的方法,其特征在于,还包括:
8.一种语音处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-7中任一所述的语音处理方法。
技术总结本公开实施例涉及一种语音处理方法、装置、设备及介质,其中该方法包括:响应于接收到的语音控制指令,确定与语音控制指令对应的语义服务对象以及语义服务对象的第一服务类型;在第一服务类型为多个的情况下,确定当前处于开启状态的应用程序的第二服务类型,并将第二服务类型与第一服务类型匹配以获取匹配结果;在匹配结果为第二服务类型中存在与第一服务类型匹配成功的第一目标服务类型时,通过第一目标服务类型对应的应用程序提供与语义服务对象对应的语音服务。在本公开的实施例中,在存在多语义的情况下,可以根据开启的应用程序的服务类型在多语义中确定正确的语义,减少了与用户进行语义澄清的交互,降低了语义澄清的耗时,提升了语音处理效率。技术研发人员:张斌受保护的技术使用者:北京罗克维尔斯科技有限公司技术研发日:技术公布日:2024/6/11本文地址:https://www.jishuxx.com/zhuanli/20240618/24717.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表