语音交互方法、语音交互装置和电子设备与流程
- 国知局
- 2024-06-21 11:46:30
本技术实施例涉及电子设备领域,并且更具体地,涉及一种语音交互方法、语音交互装置和电子设备。
背景技术:
1、随着语音技术的发展,用户通过语音交互系统进行人机交互的场景越来越普遍。
2、多轮对话是人机交互的典型应用场景,通过与用户多个轮次对话,语音交互系统能够判断出用户的真实意图,从而执行相应的动作。
3、但是在多轮对话场景中,语音交互过程耗费时间过长,影响用户体验感。
技术实现思路
1、本技术实施例提供一种语音交互方法、语音交互装置和电子设备,能够减少用户进行语音交互所耗费的时间,较快地确定用户的真正意图,提高用户体验感。
2、第一方面,提供了一种语音交互方法,应用于电子设备,包括:接收用户的第一语音输入,所述第一语音输入包括第一槽位;在所述第一槽位包括至少两个候选项的情况下,将收音倒计时时长从第一时间延长为第二时间,所述收音倒计时时长是接收用户的第一语音输入后,所述电子设备持续处于收音状态的时间;在第一界面显示第一卡片,所述第一卡片用于提示用户确定第一槽位的目标候选项,所述第一卡片包括所述至少两个候选项;根据所述至少两个候选项确定所述目标候选项或者在第一收音时段根据用户的第二输入确定所述目标候选项,所述第一收音时段是接收用户的第一语音输入后,所述电子设备持续处于收音状态的时间段。
3、在该实施例中,电子设备在确定用户的第一语音输入的第一槽位包括至少两个候选项时,能够将收音倒计时时长延长,并向用户显示第一卡片,用于提示用户确定目标候选项,从而允许用户在延长的收音时间内(第一收音时段)确定目标候选项。这样,无需开启下一轮对话并且向用户播报,而是允许用户在该轮对话中就能实现目标候选项的确定,减少了语音交互的总时长,提高了用户的体验感。
4、结合第一方面,在第一方面的某些实现方式中,所述至少两个候选项包括默认候选项。
5、在该实施例中,电子设备向用户提供的至少两个候选项中包括默认候选项。示例性的,该默认候选项可以是根据至少两个候选项的热度确定的。这样,默认候选项有可能为用户真正意图对应的目标候选项,减少了用户操作的复杂性。
6、结合第一方面,在第一方面的某些实现方式中,所述根据所述至少两个候选项确定所述目标候选项,包括:在所述电子设备在所述第一收音时段未接收到用户的输入的情况下,根据所述默认候选项,确定所述目标候选项。
7、在该实施例中,电子设备向用户提示的第一卡片上有对应第一槽位的默认候选项,如果用户在延长的收音时间内进行输入,可以认为用户认可电子设备提供的默认候选项为用户真正意图的候选项,则电子设备可以将默认候选项作为目标候选项,进而为用户提供相应的服务。
8、结合第一方面,在第一方面的某些实现方式中,所述第二输入用于从所述至少两个候选项中选择所述目标候选项;或者,所述第二输入用于输入所述目标候选项,所述目标候选项不属于所述至少两个候选项。
9、在该实施例中,如果用户在延长的收音时间内(第一收音时段)进行了第二输入,电子设备可以根据用户的第二输入,确定目标候选项。例如,电子设备提供的至少两个候选项中包括用户真正意图的目标候选项,则用户可以通过语音输入“第x项”、直接语音输入该候选项、点击屏幕上的该候选项、文字输入等方式确定该候选项为第一槽位的目标候选项。或者,电子设备提供的至少两个候选项不包括用户真正意图的目标候选项,用户可以直接通过语音输入、文字输入等方式输入该目标候选项。从而电子设备可以根据该目标候选项为用户提供相应的服务。这样,用户可以通过多种方式确定目标候选项,由于默认候选项的存在,减少了用户操作的复杂性。
10、结合第一方面,在第一方面的某些实现方式中,所述第一语音输入后有第一停顿,所述方法还包括:在所述电子设备检测到所述第一停顿的时间大于预设阈值后,确定所述第一槽位包括所述至少两个候选项。
11、在该实施例中,电子设备在检测到第一语音输入后的第一停顿的时间大于预设阈值时,即对第一语音输入的第一槽位进行查询,从而确定第一槽位包括至少两个候选项。这样,无需在用户的语音输入完成后查询对应的第一槽位是否包括多个候选项,能够及时调整收音倒计时时长,避免电子设备开启第二轮对话便于用户补充第一槽位的相关信息,减少了电子设备与用户的语音交互时间,提高了用户的体验感。
12、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:在所述第一界面上显示提示信息,用于向用户提示默认候选项对应的默认动作。
13、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:在第一收音时段接收用户的第四输入,所述第四输入对应第二指令,所述第二指令用户确定所述默认候选项不是目标候选项。
14、在该实施例中,电子设备还会在第一界面上显示提示默认动作的提示信息,该默认动作与默认候选项对应,用户可以直观的看到电子设备在收音结束后默认执行的操作,当该默认动作与用户的意图不符时,用户可以立即补充输入,例如用户可以通过输入“取消”、“不执行”等语音触发取消指令,使得电子设备获知该默认候选项不是用户真正意图的目标候选项,从而不执行该默认动作,用户还可以补充输入真正意图的目标候选项,从而电子设备会根据目标候选项,为用户提供相应的服务。
15、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:在所述第一界面显示控件,所述控件用于向用户提示收音倒计时时长的剩余值。
16、在该实施例中,电子设备会在界面上显示对应收音倒计时时长的剩余值的控件,从而当用户认为剩余收音倒计时时长不够补充输入时,可以通过指令延长收音倒计时时长,从而避免由于超时收音结束,需要下一轮对话补充输入,减少用户的操作的复杂性和交互总时间。
17、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:在所述第一收音时段接收到用户的第三输入,所述第三输入对应第一指令,所述第一指令用于延长所述收音倒计时时长;根据所述第三输入,将所述收音倒计时时长从所述第二时间延长到第三时间。
18、在该实施例中,用户可以在收音倒计时时长的剩余值不够的时候,通过含有例如“稍等”、“等等”等词汇的语句触发稍候指令延长收音倒计时时长,操作便捷。可选的,电子设备可以允许用户自己编辑对应稍候指令的词汇,从而符合用户的习惯,提升用户的体验感。结合第一方面,在第一方面的某些实现方式中,所述方法还包括:根据所述目标候选项,发送第一请求,所述第一请求用于请求提供与所述目标候选项对应的服务。
19、在该实施例中,电子设备在确定第一槽位对应的目标候选项后,可以按照目标候选项向与该第一语音输入的意图对应的应用发送第一请求,从而第一应用可以向用户提供相应的服务。
20、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:在第一收音时段接收用户的第五输入,所述第五输入对应第三指令,所述第三指令用于结束执行所述第一语音输入对应的动作。
21、在该实施例中,电子设备接收到用户的第五输入时,可以停止执行第一语音输入对应的动作并停止收音。例如第五输入可以包括“结束”等词语,对应结束指令,表明用户不需要提供与第一语音输入对应的服务。用户有其他需求时,可以通过例如第二语音输入请求提供相应的服务。
22、结合第一方面,在第一方面的某些实现方式中,所述第二输入、第三输入、第四输入和第五输入为以下任一项:语音输入、点击输入和文字输入。
23、本技术实施例提供的技术方案允许用户根据实际情况选择合适的输入方式,增加了本技术实施例适用的场景。
24、第二方面,提供了一种电子设备,包括收音组件,用于接收用户的第一语音输入;语音分析组件,用于根据所述第一语音输入确定第一槽位;即时响应组件,用于在确定所述第一槽位包括至少两个候选项的情况下,将收音倒计时时长从第一时间延长到第二时间,所述收音倒计时时长是接收用户的第一语音输入后,所述电子设备持续处于收音状态的时间;所述即时响应组件,还用于调用所述电子设备的显示组件在第一界面显示第一卡片,所述第一卡片用于提示用户确定所述第一槽位的目标候选项,所述第一卡片包括所述至少两个候选项;所述即时响应组件,还用于根据所述至少两个候选项确定所述目标候选项或者在所述第一收音时段根据用户的第二输入确定所述目标候选项,所述第一收音时段是接收用户的第一语音输入后,所述电子设备持续处于收音状态的时间段。
25、结合第二方面,在第二方面的某些实现方式中,所述至少两个候选项包括默认候选项。
26、结合第二方面,在第二方面的某些实现方式中,所述即时响应组件,具体用于在所述电子设备在所述第一收音时段未接收到用户的输入的情况下,根据所述默认候选项,确定所述目标候选项。
27、结合第二方面,在第二方面的某些实现方式中,所述第二输入用于从所述至少两个候选项中选择所述目标候选项;或者,所述第二输入用于输入所述目标候选项,所述目标候选项不属于所述至少两个候选项。
28、结合第二方面,在第二方面的某些实现方式中,所述第一语音输入后有第一停顿,所述即时响应组件,还用于:在所述电子设备检测到所述第一停顿的时间大于预设阈值后,确定所述第一槽位包括所述至少两个候选项。
29、结合第二方面,在第二方面的某些实现方式中,所述即时响应组件,还用于调用所述电子设备的显示组件在第一界面显示提示信息,所述提示信息用于向用户提示所述默认候选项对应的默认执行动作。
30、结合第二方面,在第二方面的某些实现方式中,所述即时响应组件还用于调用所述显示组件在所述第一界面显示控件,所述控件用于向用户提示所述收音倒计时时长的剩余值。
31、结合第二方面,在第二方面的某些实现方式中,所述收音组件,还用于在所述第一收音时段接收用户的第三输入,所述第三输入对应第一指令,所述第一指令用于延长所述收音倒计时时长;所述即时响应组件,还用于根据所述第三输入,调用所述收音组件将所述收音倒计时时长从所述第二时间延长到第三时间。
32、结合第二方面,在第二方面的某些实现方式中,所述第二输入为以下任一项:语音输入、点击输入和文字输入。
33、结合第二方面,在第二方面的某些实现方式中,所述电子设备还包括对话管理组件,所述对话管理组件用于根据所述目标候选项,发送第一请求,所述第一请求用于请求提供与所述目标候选项对应的服务。
34、第三方面,提供了一种语音交互装置,包括:存储器,用于存储计算机程序;处理器,用于执行所述存储器中存储的计算机程序,以使得所述装置执行如第一方面或第一方面任意一种实现方式所述的方法。
35、第四方面,提供了一种计算机可读介质,所述计算机可读介质存储有程序代码,当所述程序代码在计算机上运行时,使得计算机执行如第一方面或第一方面任意一种实现方式所述的方法。
36、第五方面,提供了一种计算机程序产品,其特征在于,所述计算机程序产品包括:计算机程序代码,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如第一方面或第一方面任意一种实现方式所述的方法。
37、第六方面,提供了一种芯片,所述芯片包括处理器与数据接口,所述处理器通过所述数据接口读取存储器上存储的指令,执行上述第一方面以及第一方面的任一种可能实现方式中的方法。
38、可选地,作为一种实现方式,所述芯片还可以包括存储器,所述存储器中存储有指令,
39、所述处理器用于执行所述存储器上存储的指令,当所述指令被执行时,所述处理器用于执行上述第一方面以及第一方面的任一种可能实现方式中的方法。
40、上述芯片具体可以是现场可编程门阵列或者专用集成电路。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23485.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表