一种语音交互的方法、装置、系统、电子设备及存储介质与流程
- 国知局
- 2024-06-21 11:33:49
本技术涉及语音交互领域,更具体的说,是涉及一种语音交互的方法、装置、系统、电子设备及存储介质。
背景技术:
1、自上世纪90年代起,人们可以通过拨号打电话的方式向亲朋好友通话,也可以通过写信邮递的方式向对方传达信息,随着通讯技术的不断发展,人们不再局限于拨号和邮递的方式。如今,当用户想了解某种app如何使用,或咨询使用中遇到的问题时,可以以文本的方式向app客服发送咨询请求,也可以通过app里的智能客服的语音交互方式进行咨询。
2、然而,当用户存在关于应用软件的语音交互的需求时,需要先打开该应用软件的多级跳转页面,直至语音交互的界面才能进行语音交互,花费了大量时间在进入语音交互的界面中,导致人机交互的效率不高。
技术实现思路
1、鉴于上述问题,提出了本技术以便提供一种语音交互的方法、装置、系统、电子设备及存储介质,以提高人机交互的效率。
2、为了实现上述目的,现提出具体方案如下:
3、一种语音交互的方法,应用于触控显示设备,包括:
4、当检测到预设的图标被触控超过第一预设时间的操作时,对所述图标所对应的目标软件执行目标语音交互意图信息的查询操作;
5、当确认查询到所述目标软件存在已注册的目标语音交互意图信息时,激活语音交互模块;
6、驱动所述语音交互模块在所述目标语音交互意图信息的限定下,通过语音控制系统完成对所述目标软件的语音交互。
7、可选的,所述驱动所述语音交互模块在所述目标语音交互意图信息的限定下,通过语音控制系统完成对所述目标软件的语音交互,包括:
8、在确认所述语音交互模块被激活后,将所述目标语音交互意图信息传递至所述语音交互模块,并建立所述语音交互模块与语音控制系统的通信连接;
9、生成含有目标语音交互意图信息的语音交互触发指令,并向所述语音控制系统发送所述语音交互触发指令,以使所述语音控制系统将所述目标软件在语音交互过程中所产生的意图信息上下文,限定在所述目标语音交互意图信息的范围内,直至所述目标软件完成语音交互。
10、可选的,该方法还包括:
11、当确认所述语音交互模块接收到所述目标语音交互意图信息后,驱动所述语音交互模块设定与所述目标语音交互意图信息相匹配的语音识别参数,以启动针对所述目标软件的语音识别流程;
12、在所述目标软件的语音识别流程中,获取针对所述目标软件的语音数据;
13、将所述语音数据发送至所述语音控制系统,以使所述语音控制系统配合所述语音交互模块并在所述目标语音交互意图信息的限定下,引导所述目标软件完成语音交互。
14、可选的,该方法还包括:
15、当检测到所述图标被触控超过第二预设时间且不超过所述第一预设时间的操作时,显示询问是否进行语音交互的询问信息,所述第二预设时间小于所述第一预设时间;
16、当接收到进行语音交互的应答信息时,对所述图标所对应的目标软件执行目标语音交互意图信息的查询操作,并返回执行所述当确认查询到所述目标软件存在已注册的目标语音交互意图信息时,激活语音交互模块。
17、可选的,该方法还包括:
18、当确认查询到所述目标软件不存在已注册的目标语音交互意图信息时,显示不存在语音交互功能的提示信息。
19、可选的,所述驱动所述语音交互模块在所述目标语音交互意图信息的限定下,通过语音控制系统完成对所述目标软件的语音交互,包括:
20、所述驱动所述语音交互模块在所述目标语音交互意图信息的限定下,通过语音控制系统完成对所述目标软件的语音交互,包括:
21、确认所述目标语音交互意图信息归属的类别;
22、查询与所述类别匹配的目标语义数据库;
23、建立所述语音交互模块、语音控制系统及所述目标语义数据库之间的通信连接;
24、驱动所述语音交互模块配合所述语音控制系统从所述目标语义数据库中提取对所述目标软件使用的语音交互信息,以完成对所述目标软件的语音交互。
25、一种语音交互的方法,应用于语音控制系统,包括:
26、在接收到触控显示设备的语音交互触发指令后,获取语音数据,所述语音交互触发指令为触控显示设备中被激活的语音交互模块在接收到目标语音交互意图信息后生成的,所述目标语音交互意图信息为查询所述目标软件得到的;
27、识别所述语音数据,得到语音识别结果;
28、对所述语音识别结果执行语音理解操作,得到语音理解结果;
29、在所述语音交互触发指令内包含的目标语音交互意图信息的限定下,提取所述语音理解结果中的目标对话语义信息;
30、判断所述目标对话语义信息是否表征对话完成;
31、若否,则向所述触控显示设备反馈与所述目标对话语义信息匹配的应答回复信息,和/或,向所述触控显示设备反馈与所述目标对话语义信息匹配的进一步引导信息,并返回执行所述获取语音数据;
32、若是,则向所述触控显示设备反馈所述目标软件的语音交互结束指令和对话完成的提示信息。
33、一种语音交互的装置,应用于触控显示设备,包括:
34、交互意图查询单元,用于当检测到预设的图标被触控超过第一预设时间的操作时,对所述图标所对应的目标软件执行目标语音交互意图信息的查询操作;
35、语音交互激活单元,用于当确认查询到所述目标软件存在已注册的目标语音交互意图信息时,激活语音交互模块;
36、语音交互驱动单元,用于驱动所述语音交互模块在所述目标语音交互意图信息的限定下,通过语音控制系统完成对所述目标软件的语音交互。
37、可选的,所述语音交互驱动单元,包括:
38、第一语音交互驱动子单元,用于在确认所述语音交互模块被激活后,将所述目标语音交互意图信息传递至所述语音交互模块,并建立所述语音交互模块与语音控制系统的通信连接;
39、第二语音交互驱动子单元,用于生成含有目标语音交互意图信息的语音交互触发指令,并向所述语音控制系统发送所述语音交互触发指令,以使所述语音控制系统将所述目标软件在语音交互过程中所产生的意图信息上下文,限定在所述目标语音交互意图信息的范围内,直至所述目标软件完成语音交互。
40、可选的,该装置还包括:
41、参数设定单元,用于当确认所述语音交互模块接收到所述目标语音交互意图信息后,驱动所述语音交互模块设定与所述目标语音交互意图信息相匹配的语音识别参数,以启动针对所述目标软件的语音识别流程;
42、目标语音获取单元,用于在所述目标软件的语音识别流程中,获取针对所述目标软件的语音数据;
43、数据传输单元,用于将所述语音数据发送至所述语音控制系统,以使所述语音控制系统配合所述语音交互模块并在所述目标语音交互意图信息的限定下,引导所述目标软件完成语音交互。
44、可选的,该装置还包括:
45、触控询问单元,用于当检测到所述图标被触控超过第二预设时间且不超过所述第一预设时间的操作时,显示询问是否进行语音交互的询问信息,所述第二预设时间小于所述第一预设时间;
46、询问应答单元,用于当接收到进行语音交互的应答信息时,对所述图标所对应的目标软件执行目标语音交互意图信息的查询操作,并返回执行所述当确认查询到所述目标软件存在已注册的目标语音交互意图信息时,激活语音交互模块。
47、可选的,该装置还包括:
48、非语音交互提示单元,用于当确认查询到所述目标软件不存在已注册的目标语音交互意图信息时,显示不存在语音交互功能的提示信息。
49、可选的,所述语音交互驱动单元,包括:
50、类别确认单元,用于确认所述目标语音交互意图信息归属的类别;
51、数据库查询单元,用于查询与所述类别匹配的目标语义数据库;
52、通信连接建立单元,用于建立所述语音交互模块、语音控制系统及所述目标语义数据库之间的通信连接;
53、交互信息提取单元,用于驱动所述语音交互模块配合所述语音控制系统从所述目标语义数据库中提取对所述目标软件使用的语音交互信息,以完成对所述目标软件的语音交互。
54、一种语音交互的装置,应用于语音控制系统,包括:
55、语音数据获取单元,用于在接收到触控显示设备的语音交互触发指令后,获取语音数据,所述语音交互触发指令为触控显示设备中被激活的语音交互模块在接收到目标语音交互意图信息后生成的,所述目标语音交互意图信息为查询所述目标软件得到的;
56、语音识别单元,用于识别所述语音数据,得到语音识别结果;
57、语音理解单元,用于对所述语音识别结果执行语音理解操作,得到语音理解结果;
58、语义提取单元,用于在所述语音交互触发指令内包含的目标语音交互意图信息的限定下,提取所述语音理解结果中的目标对话语义信息;
59、对话完成判断单元,用于判断所述目标对话语义信息是否表征对话完成,若否,执行反馈提示单元,若是,执行结束提示单元;
60、反馈提示单元,用于向所述触控显示设备反馈与所述目标对话语义信息匹配的应答回复信息,和/或,向所述触控显示设备反馈与所述目标对话语义信息匹配的进一步引导信息,并返回执行所述语音数据获取单元;
61、结束提示单元,用于向所述触控显示设备反馈所述目标软件的语音交互结束指令和对话完成的提示信息。
62、一种语音交互的系统,包括触控显示设备和语音控制系统,其中,所述触控显示设备用于实现如上所述语音交互的方法的各个步骤,所述语音控制系统用于实现如上所述的语音交互的方法的各个步骤。
63、一种语音交互的电子设备,包括存储器和处理器;
64、所述存储器,用于存储程序;
65、所述处理器,用于执行所述程序,实现如上所述语音交互的方法的各个步骤。
66、一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述语音交互的方法的各个步骤。
67、借由上述技术方案,本技术通过当检测到预设的图标被触控超过第一预设时间的操作时,对所述图标所对应的目标软件执行目标语音交互意图信息的查询操作,当确认查询到所述目标软件存在已注册的目标语音交互意图信息时,激活语音交互模块,驱动所述语音交互模块在所述目标语音交互意图信息的限定下,通过语音控制系统完成对所述目标软件的语音交互。由此可见,只需要响应用户对应用软件的图标触控超过第一预设时间的操作,即可触发语音交互功能,用户可即刻进行语音交互,大大减少了人机交互时间,提高了人机交互效率。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22262.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表