技术新讯 > 乐器声学设备的制造及制作,分析技术 > 控制方法、装置、设备及存储介质与流程  >  正文

控制方法、装置、设备及存储介质与流程

  • 国知局
  • 2024-06-21 10:39:09

本申请涉及播放,特别地涉及一种控制方法、装置、设备及存储介质。

背景技术:

1、随着大模型的发展和应用,语音功能的回复语将会越来越长,多轮对话的需求日益增加,轮次也增加。而语音设备和语音功能也已经得到长足发展,用语音设备收听音乐、电台资源、故事、新闻等行为已经稀松平常,当前智能语音设备一般只能通过一个语音入口和一个音频输出来与用户进行交互,如果用户移动后,与另外的设备进行交互时,则会出现识别不准确,导致用户体验不佳,当家中有多个语音设备时,往往和每个语音设备的交互都是独立的,在多人的和多设备环境下,使用语音设备的体验不佳。

技术实现思路

1、针对上述问题,本申请提供一种控制方法、装置、设备及存储介质,提高识别用户意图的准确性,从而提高用户播放体验。

2、本申请实施例提供一种控制方法,包括:

3、在获取到第一用户的语音信息的情况下,基于所述语音信息确定所述第一用户的音色;

4、基于所述音色确定所述语音信息的上文对话信息;

5、基于所述上文对话信息和所述语音信息确定所述第一用户的第一意图;

6、基于所述第一意图控制第一播放设备播放第一意图对应的内容。

7、在一些实施例中,所述基于所述音色确定所述语音信息的上文对话信息,包括:

8、将所述音色发送给后台服务器,以使后台服务器基于所述音色确定所述语音信息的上文对话信息;

9、在获取到后台服务器发送的上文对话信息的情况下,确定所述语音信息对应的上文对话信息,其中,所述后台服务器用于存储各个音色与上文对话信息之间的对应关系。

10、在一些实施例中,所述第一用户位于第一区域中,所述第一播放设备设置在所述第一区域中,所述方法还包括:

11、在检测到所述第一用户从第一区域进入第二区域的情况下,确定所述第二区域中的第二播放设备是否在播放第二用户的第二意图对应的内容;

12、在所述第二区域中的第二播放设备没有播放所述第二意图对应的内容的情况下,确定所述第一用户进入所述第二区域的时间;

13、在所述时间小于时间阈值的情况下,控制所述第一播放设备和所述第二区域的第二播放设备同时播放所述第一意图对应的内容。

14、在一些实施例中,所述方法还包括:

15、在所述时间大于时间阈值的情况下,控制所述第一播放设备停止播放,并控制所述第二播放设备播放所述第一意图对应的内容。

16、在一些实施例中,所述第一区域还包括:第三用户,所述方法还包括:

17、在检测到第一用户位于所述第一区域中且所述第三用户从所述第一区域进入所述第二区域的情况下,确定所述第二区域中的第二播放设备是否在播放第二用户的第二意图对应的内容;

18、在所述第二区域中的第二播放设备没有播放所述第二意图对应的内容的情况下,控制所述第二播放设备同时播放所述第一意图对应的内容。

19、在一些实施例中,所述方法还包括:

20、在所述第二区域的第二播放设备在播放第二用户的第二意图对应的内容,且检测到所述第一用户从所述第一区域进入所述第二区域的情况下,控制所述第二播放设备继续播放所述第二用户的第二意图对应的内容。

21、在一些实施例中,所述方法还包括:

22、将所述语音信息上传至后台服务器,以使后台服务器基于所述语音信息更新所述音色对应的上文语音信息。

23、本申请实施例再提供一种控制装置,包括:

24、第一确定模块,用于在获取到第一用户的语音信息的情况下,基于所述语音信息确定所述第一用户的音色;

25、第二确定模块,用于基于所述音色确定所述语音信息的上文对话信息;

26、第三确定模块,用于基于所述上文对话信息和所述语音信息确定所述第一用户的第一意图;

27、控制模块,用于基于所述第一意图控制第一播放设备播放与所述第一意图对应的内容。

28、本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,执行如上述任意一项所述控制方法。

29、本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质存储的计算机程序,能够被一个或多个处理器执行,能够用来实现上述所述控制方法。

30、本申请提供的一种控制方法、装置、设备及存储介质,通过在获取到第一用户的语音信息的情况下,基于所述语音信息确定所述第一用户的音色;基于所述音色确定所述语音信息的上文对话信息;基于所述上文对话信息和所述语音信息确定所述第一用户的第一意图;基于所述第一意图控制第一播放设备播放,如此,能够提高识别用户意图的准确性,从而提高用户播放体验。

技术特征:

1.一种控制方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述音色确定所述语音信息的上文对话信息,包括:

3.根据权利要求1所述的方法,其特征在于,所述第一用户位于第一区域中,所述第一播放设备设置在所述第一区域中,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,所述第一区域还包括:第三用户,所述方法还包括:

6.根据权利要求3所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:

8.一种控制装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,执行如权利要求1至7任意一项所述控制方法。

10.一种存储介质,其特征在于,该存储介质存储的计算机程序,能够被一个或多个处理器执行,能够用来实现如权利要求1至7任意一项所述控制方法。

技术总结本申请提供的一种控制方法、装置、设备及存储介质,通过在获取到第一用户的语音信息的情况下,基于所述语音信息确定所述第一用户的音色;基于所述音色确定所述语音信息的上文对话信息;基于所述上文对话信息和所述语音信息确定所述第一用户的第一意图;基于所述第一意图控制第一播放设备播放,如此,能够提升多人环境下语音设备的使用体验。技术研发人员:周凌翔,崔为之,贾巨涛,吴伟,张瀚霖受保护的技术使用者:珠海格力电器股份有限公司技术研发日:技术公布日:2024/1/15

本文地址:https://www.jishuxx.com/zhuanli/20240618/20941.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。