交互方法、装置及相关设备与流程
- 国知局
- 2024-08-02 14:18:48
本申请涉及元宇宙,尤其涉及一种交互方法、装置及相关设备。
背景技术:
1、元宇宙应用中,往往需要提供辅助角色的数字人,即非用户角色(non-playercharacter,npc),通过npc与用户互动进行对话,介绍背景故事、任务等。npc在与用户对话时,通常是以播放拟人音频数据和文本弹框的方式同时进行。
2、有些用户时间有限或不想在剧情中浪费时间精力,不能花费大量时间过剧情,但是文本弹框的文本内容以及文本弹框的展示时长均是固定的,与用户的阅读速度匹配度较低,导致数字人交互效果较差。
技术实现思路
1、本申请实施例提供一种交互方法、装置及相关设备,以解决数字人交互效果较差的问题。
2、第一方面,本申请实施例提供了一种交互方法,包括:
3、获取用户在历史时间段内的第一操作数据和待显示文本,所述第一操作数据用于表征用户的目标阅读速度;
4、基于所述第一操作数据确定语音播放速度,并基于所述第一操作数据调整所述待显示文本,得到目标文本,所述目标文本的字数小于所述待显示文本的字数;
5、按照所述语音播放速度播放所述目标文本对应的音频数据,并显示所述目标文本。
6、可选地,所述按照所述语音播放速度播放所述目标文本对应的音频数据,并显示所述目标文本,包括:
7、基于用户的第二操作数据调整所述语音播放速度,得到目标语音播放速度;
8、按照所述目标语音播放速度播放所述目标文本对应的音频数据,并显示所述目标文本。
9、可选地,所述基于所述第一操作数据调整所述待显示文本,得到目标文本,包括:
10、基于所述第一操作数据确定目标播放倍速;
11、基于预先定义的播放倍速和预设文本的对应关系,从多个预设文本中确定所述目标播放倍速对应的目标文本;
12、其中,所述多个预设文本基于所述待显示文本生成,且所述多个预设文本的文本字数少于所述待显示文本。
13、可选地,所述基于所述第一操作数据确定目标播放倍速,包括:
14、基于所述第一操作数据确定用户的目标阅读速度;
15、将所述用户的目标阅读速度和所述待显示文本的文本字数输入预测模型进行处理,得到所述目标播放倍速。
16、可选地,所述基于预先定义的播放倍速和预设文本的对应关系,从所述多个预设文本中确定所述目标播放倍速对应的目标文本之前,所述方法还包括:
17、确定多个播放倍速对应的多个预设文本字数,所述多个预设文本字数均小于待显示文本的文本字数;
18、将所述待显示文本和所述多个预设文本字数输入文本生成模型进行处理,得到所述多个预设文本字数中每一个预设文本字数对应的预设文本。
19、可选地,所述基于所述语音播放速度播放所述目标文本对应的音频数据,并显示所述目标文本,包括:
20、基于所述语音播放速度计算第一重叠率和第二重叠率,所述第一重叠率用于表征分帧处理过程中任意两个分帧单元之间的重叠率,所述第二重叠率用于表征合帧处理过程中任意两个分帧单元之间的重叠率;
21、对所述目标文本对应的音频数据进行分帧处理,得到多个分帧单元,所述分帧处理时所述多个分帧单元的重叠率为所述第一重叠率;
22、对所述多个分帧单元进行合帧处理,得到目标音频,所述合帧处理时所述多个分帧单元的重叠率为所述第二重叠率;
23、播放所述目标音频,并显示所述目标文本。
24、第二方面,本申请实施例还提供一种交互装置,包括:
25、获取模块,用于获取用户在历史时间段内的第一操作数据和待显示文本,所述第一操作数据用于表征用户的目标阅读速度;
26、第一处理模块,用于基于所述第一操作数据确定语音播放速度,并基于所述第一操作数据调整所述待显示文本,得到目标文本,所述目标文本的字数小于所述待显示文本的字数;
27、第二处理模块,用于按照所述语音播放速度播放所述目标文本对应的音频数据,并显示所述目标文本。
28、第三方面,本申请实施例还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如第一方面所述的交互方法中的步骤。
29、第四方面,本申请实施例还提供一种可读存储介质,所述可读存储介质上存储程序,所述程序被处理器执行时实现如第一方面所述的交互方法中的步骤。
30、第五方面,提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如第一方面所述的交互方法的步骤。
31、在本申请实施例中,获取用户在历史时间段内的第一操作数据和待显示文本;基于第一操作数据确定语音播放速度,并基于第一操作数据调整待显示文本,得到目标文本,按照语音播放速度播放目标文本对应的音频数据,并显示目标文本。通过上述方式,基于用户的操作数据动态地调整待显示文本,从而与用户更加匹配地目标文本和语音播放速度,提高了文本内容和语音播放速度的灵活性,达到加快剧情播放的速度并简化文本的复杂度的效果,为用户减少剧情占用的时长,同时不影响用户的剧情体验,提高了用户的交互体验。
技术特征:1.一种交互方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述按照所述语音播放速度播放所述目标文本对应的音频数据,并显示所述目标文本,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述第一操作数据调整所述待显示文本,得到目标文本,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一操作数据确定目标播放倍速,包括:
5.根据权利要求3或4所述的方法,其特征在于,所述基于预先定义的播放倍速和预设文本的对应关系,从所述多个预设文本中确定所述目标播放倍速对应的目标文本之前,所述方法还包括:
6.根据权利要求2所述的方法,其特征在于,所述基于所述语音播放速度播放所述目标文本对应的音频数据,并显示所述目标文本,包括:
7.一种交互装置,其特征在于,包括:
8.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;其特征在于,所述处理器,用于读取存储器中的程序实现如权利要求1至6中任一项所述的交互方法中的步骤。
9.一种可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现如权利要求1至6中任一项所述的交互方法中的步骤。
10.一种计算机程序产品,其特征在于,包括计算机指令,该计算机指令被处理器执行时实现如权利要求1至6中任一项所述的交互方法的步骤。
技术总结本申请公开了一种交互方法、装置及相关设备,涉及交互方法、装置及相关设备技术领域,以解决数字人交互效果较差的问题。该方法包括:获取用户在历史时间段内的第一操作数据和待显示文本,所述第一操作数据用于表征用户的目标阅读速度;基于所述第一操作数据确定语音播放速度,并基于所述第一操作数据调整所述待显示文本,得到目标文本,所述目标文本的字数小于所述待显示文本的字数;按照所述语音播放速度播放所述目标文本对应的音频数据,并显示所述目标文本。本申请实施例可提高交互效果。技术研发人员:陈旻受保护的技术使用者:咪咕文化科技有限公司技术研发日:技术公布日:2024/7/23本文地址:https://www.jishuxx.com/zhuanli/20240801/242355.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。