技术新讯 > 乐器声学设备的制造及制作,分析技术 > 目标对象的交互方法、装置、设备及可读存储介质与流程  >  正文

目标对象的交互方法、装置、设备及可读存储介质与流程

  • 国知局
  • 2024-06-21 11:26:24

本申请实施例涉及人机交互,特别涉及一种目标对象的交互方法、装置、设备及可读存储介质。

背景技术:

1、目前在人机交互领域中,主流是机器人与用户进行会话交互,随着ai技术的发展,机器人与用户侧宠物、警犬等目标对象也可以进行智能交互,通过训练目标对象,使其完成指定的业务查询与办理工作,能够节省用户亲自办理无风险业务的时间和精力。

2、然而,对于用户而言,训练宠物、警犬等目标对象进行专业业务操作是一个费时费力的过程,其训练周期长且训练效果不理想。

技术实现思路

1、本申请实施例提供了一种目标对象的交互方法、装置、设备及可读存储介质,以解决现有技术中目标对象的训练周期长且训练效果不理想的问题。

2、为了解决上述技术问题,本申请是这样实现的:

3、第一方面,本申请实施例提供了一种目标对象的交互方法,包括:

4、在判定目标对象适合进行交互操作的情况下,获取业务操作对应的第一指引话术数据、示范视频和预设的与所述目标对象对应的语音数据;

5、提取所述语音数据的音色特征,根据所述音色特征和第一指引话术数据合成与所述第一指引话术数据对应的第二指引话术数据,以语音形式输出所述第二指引话术数据并播放所述示范视频;

6、在接收到用于表征所述目标对象操作失败的第一标识的情况下,根据所述示范视频和在所述示范视频播放过程中所采集的所述目标对象的模仿视频,确定目标对象操作错误的目标帧图像,重复播放所述目标帧图像直至满足预设条件,重新以语音形式输出所述第二指引话术数据并播放所述示范视频。

7、第二方面,本申请实施例提供了一种目标对象的交互装置,包括:

8、获取模块,用于在判定目标对象适合进行交互操作的情况下,获取业务操作对应的第一指引话术数据、示范视频和预设的与所述目标对象对应的语音数据;

9、输出模块,用于提取所述语音数据的音色特征,根据所述音色特征和第一指引话术数据合成与所述第一指引话术数据对应的第二指引话术数据,以语音形式输出所述第二指引话术数据并播放所述示范视频;

10、交互模块,用于在接收到用于表征目标对象操作失败的第一标识的情况下,根据所述示范视频和在所述示范视频播放过程中所采集的所述目标对象的模仿视频,确定目标对象操作错误的目标帧图像,重复播放所述目标帧图像直至满足预设条件,重新以语音形式输出所述第二指引话术数据并播放所述示范视频。

11、第三方面,本申请实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现上述的目标对象的交互方法的步骤。

12、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现上述的目标对象的交互方法的步骤。

13、本申请提供的技术方案可以包括以下有益效果:

14、在本申请实施例中,在判定目标对象适合进行交互操作的情况下,获取业务操作对应的第一指引话术数据、示范视频和预设的与目标对象对应的语音数据;提取所述语音数据的音色特征,根据所述音色特征和第一指引话术数据合成与所述第一指引话术数据对应的第二指引话术数据,以语音形式输出所述第二指引话术数据并播放所述示范视频;在接收到用于表征所述目标对象操作失败的第一标识的情况下,根据所述示范视频和在所述示范视频播放过程中所采集的目标对象的模仿视频,确定目标对象操作错误的目标帧图像,重复播放所述目标帧图像直至满足预设条件,重新以语音形式输出所述第二指引话术数据并播放所述示范视频。

15、这样,在判定目标对象适合进行交互操作时,根据第二指引话术数据和示范视频对目标对象进行训练,并且在目标对象操作失败的情况下,重复播放目标对象操作错误的目标帧图像,能够对目标对象进行更加有针对性的训练,帮助目标对象快速了解业务操作相关流程,缩短目标对象的训练周期,并且能够减少用户训练目标对象进行专业业务操作和亲自办理无风险业务的时间成本。

技术特征:

1.一种目标对象的交互方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述判定目标对象适合进行交互操作,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述多张帧图像对应的目标对象的情绪特征,确定第一预测指数,包括:

4.根据权利要求2所述的方法,其特征在于,根据所述多个语音片段的音频特征和历史行为视频,确定第二预测指数,包括:

5.根据权利要求2所述的方法,其特征在于,所述获取所述目标对象的历史行为视频,包括:

6.根据权利要求5所述的方法,其特征在于,所述对目标对象回应的应答语音进行语义识别,包括:

7.根据权利要求1所述的方法,其特征在于,所述获取业务操作对应的第一指引话术数据,包括:

8.根据权利要求7所述的方法,其特征在于,所述提取所述业务操作话术的目标语句,包括:

9.根据权利要求1-8任一项所述的方法,其特征在于,所述根据所述示范视频和在所述示范视频播放过程中所采集的所述目标对象的模仿视频,确定目标对象操作错误的目标帧图像,包括:

10.一种目标对象的交互装置,其特征在于,包括:

11.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至9任一项所述的目标对象的交互方法的步骤。

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至9任一项所述的目标对象的交互方法的步骤。

技术总结本申请公开一种目标对象的交互方法、装置、设备及可读存储介质,属于人机交互技术领域。该方法包括:在判定目标对象适合进行交互操作的情况下,获取第一指引话术数据、示范视频和目标对象对应的语音数据;提取语音数据的音色特征,根据音色特征和第一指引话术数据合成第二指引话术数据,以语音形式输出第二指引话术数据并播放示范视频;在接收到用于表征目标对象操作失败的第一标识的情况下,根据示范视频和所采集的模仿视频,确定目标对象操作错误的目标帧图像,重复播放目标帧图像直至满足预设条件,重新以语音形式输出第二指引话术数据并播放示范视频。这样,能够帮助目标对象快速了解业务操作相关流程,缩短目标对象的训练周期。技术研发人员:白安琪,蒋宁,陆全,夏粉,吴海英,肖冰受保护的技术使用者:马上消费金融股份有限公司技术研发日:技术公布日:2024/2/6

本文地址:https://www.jishuxx.com/zhuanli/20240618/21535.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。