技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音交互方法、系统、设备及存储介质与流程  >  正文

语音交互方法、系统、设备及存储介质与流程

  • 国知局
  • 2024-06-21 11:36:49

本发明涉及智能语音交互,尤其涉及一种语音交互方法、系统、设备及存储介质。

背景技术:

1、智能语音交互是基于语音输入的交互模式,通过说话就可以得到响应结果。常用的语音交互设备,如智能音箱、语音对话智能家电、车载智能后照镜、智能客服、对话机器人等。

2、基于人工智能(artificial intelligence,ai)技术的语音交互系统是语音交互设备功能实现的基础,一般的工作流程如下:声音采集、语音识别、语义理解、播放回复等过程。

3、但是,由于语音识别以及语义理解均是具有一定错误率的过程,这将导致回复的内容不符合用户的预期,使用户的使用体验变差。而且,有时人工智能的语音识别在一段时间没能识别成功时,语音交互系统会基于超时的设定,脱离语音识别的状态,使用者可能需要再度对话唤醒词才能再度辨识,这也会造成使用体验变差。

技术实现思路

1、本发明提供一种语音交互方法、系统、设备及存储介质,用以解决现有技术中存在的缺陷。

2、本发明提供一种语音交互方法,包括:

3、接收当前用户语音;

4、对所述当前用户语音进行语音识别,得到当前识别结果,并确定所述当前识别结果在历史轮次中的重复次数;

5、若所述重复次数大于等于第一次数,则向用户提供引导信息,当接收到所述用户针对所述引导信息的回复信息时,基于所述回复信息,对所述当前识别结果进行更正,得到所述当前用户语音对应的当前文本信息;

6、基于所述当前文本信息,对所述当前用户语音进行响应。

7、根据本发明提供的一种语音交互方法,所述确定所述当前识别结果在历史轮次中的重复次数,之后包括:

8、若所述重复次数小于所述第一次数,则确定并展示所述当前识别结果对应的兜底识别结果;

9、接收所述用户针对所述兜底识别结果的第一选择结果,并将所述第一选择结果作为所述当前文本信息。

10、根据本发明提供的一种语音交互方法,所述确定所述当前识别结果在历史轮次中的重复次数,之后包括:

11、若所述重复次数小于所述第一次数且大于等于第二次数,则对所述当前识别结果进行语义解析,得到当前解析结果;

12、确定并展示所述当前解析结果对应的兜底解析结果,并接收所述用户针对所述兜底解析结果的第二选择结果,将所述第二选择结果作为所述当前文本信息。

13、根据本发明提供的一种语音交互方法,所述基于所述当前文本信息,对所述当前用户语音进行响应,之前包括:

14、对所述当前识别结果以及所述当前文本信息进行记忆。

15、根据本发明提供的一种语音交互方法,所述确定所述当前识别结果在历史轮次中的重复次数,包括:

16、确定所述当前识别结果在预设时长内的历史轮次中的所述重复次数。

17、根据本发明提供的一种语音交互方法,所述确定所述当前识别结果在历史轮次中的重复次数,包括:

18、判断所述当前识别结果是否存在记忆信息;

19、若存在所述记忆信息,则基于所述记忆信息中所述当前识别结果对应的文本信息,对所述当前用户语音进行响应;

20、若不存在所述记忆信息,则确定所述当前识别结果在历史轮次中的重复次数。

21、根据本发明提供的一种语音交互方法,所述向用户提供引导信息,包括:

22、基于语音播报方式和/或显示方式,向所述用户提供所述引导信息。

23、本发明还提供一种语音交互系统,包括:

24、语音接收模块,用于接收当前用户语音;

25、重复次数确定模块,用于对所述当前用户语音进行语音识别,得到当前识别结果,并确定所述当前识别结果在历史轮次中的重复次数;

26、文本信息确定模块,用于若所述重复次数大于等于第一次数,则向用户提供引导信息,当接收到所述用户针对所述引导信息的回复信息时,基于所述回复信息,对所述当前识别结果进行更正,得到所述当前用户语音对应的当前文本信息;

27、响应模块,用于基于所述当前文本信息,对所述当前用户语音进行响应。

28、本发明还提供一种语音交互设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述的语音交互方法。

29、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的语音交互方法。

30、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的语音交互方法。

31、本发明提供的语音交互方法、系统、设备及存储介质,该方法首先接收当前用户语音;然后对当前用户语音进行语音识别,得到当前识别结果,并确定当前识别结果在历史轮次中的重复次数;此后若重复次数大于等于第一次数,则向用户提供引导信息,当接收到用户针对所述引导信息的回复信息时,基于回复信息,对当前识别结果进行更正,得到当前用户语音对应的当前文本信息;最后基于当前文本信息,对当前用户语音进行响应。该方法通过确定当前识别结果在历史轮次中的重复次数,并将重复次数作为判断依据,不仅可以避免用户多次输入导致体验感降低的情况发生,还可以避免因系统超时设定导致脱离语音识别状态的情况发生,提高用户体验感。在重复次数满足大于等于第一次数的情况下,向用户提供引导信息,当接收到用户的回复信息时,基于回复信息,对当前识别结果进行更正,并对当前用户语音进行响应,保证响应结果的准确性,使响应结果更加符合用户的预期,进一步提升用户体验。

技术特征:

1.一种语音交互方法,其特征在于,包括:

2.根据权利要求1所述的语音交互方法,其特征在于,所述确定所述当前识别结果在历史轮次中的重复次数,之后包括:

3.根据权利要求1所述的语音交互方法,其特征在于,所述确定所述当前识别结果在历史轮次中的重复次数,之后包括:

4.根据权利要求1所述的语音交互方法,其特征在于,所述基于所述当前文本信息,对所述当前用户语音进行响应,之前包括:

5.根据权利要求1-4中任一项所述的语音交互方法,其特征在于,所述确定所述当前识别结果在历史轮次中的重复次数,包括:

6.根据权利要求1-4中任一项所述的语音交互方法,其特征在于,所述确定所述当前识别结果在历史轮次中的重复次数,包括:

7.根据权利要求1-4中任一项所述的语音交互方法,其特征在于,所述向用户提供引导信息,包括:

8.一种语音交互系统,其特征在于,包括:

9.一种语音交互设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的语音交互方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的语音交互方法。

技术总结本发明涉及智能语音交互技术领域,提供一种语音交互方法、系统、设备及存储介质,该方法通过确定当前识别结果在历史轮次中的重复次数,并将重复次数作为判断依据,不仅可以避免用户多次输入导致体验感降低的情况发生,还可以避免因系统超时设定导致脱离语音识别状态的情况发生,提高用户体验感。在重复次数满足大于等于第一次数的情况下,向用户提供引导信息,当接收到用户的回复信息时,基于回复信息,对当前识别结果进行更正,并对当前用户语音进行响应,保证响应结果的准确性,使响应结果更加符合用户的预期,进一步提升用户体验。技术研发人员:计超,肖建辉,袁奎受保护的技术使用者:科大讯飞股份有限公司技术研发日:技术公布日:2024/3/17

本文地址:https://www.jishuxx.com/zhuanli/20240618/22416.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。