技术新讯 > 计算推算,计数设备的制造及其应用技术 > 人机交互控制方法、装置、电子设备及可读存储介质与流程 > 正文

人机交互控制方法、装置、电子设备及可读存储介质与流程

国知局
2024-09-05 14:52:56

本申请涉及人机交互，尤其涉及一种人机交互控制方法、装置、电子设备及可读存储介质。

背景技术：

1、数字人(digital human/meta human)，是运用数字技术创造出来的、与人类形象接近的数字化人物形象。目前，用户与数字人可以通过语音、文字或手势的形式进行交互，但是交互的形式通常是由用户提前预设好并固定的。例如，用户预设为语音交互后，无论在公共环境下还是私密环境下，数字人均以语音的形式交互，这导致用户的隐私信息的泄露风险较高。

2、由此可知，现有的用户和数字人交互策略难以根据外界环境自动地进行切换，灵活性较差。

技术实现思路

1、本申请实施例提供一种人机交互控制方法、装置、电子设备及可读存储介质，以解决用户和数字人交互策略难以根据外界环境自动地进行切换，灵活性较差的问题。

2、第一方面，本发明实施例提供了一种人机交互控制方法，包括：

3、获取目标用户所处环境的环境信息；

4、基于所述目标用户所处环境的环境信息确定目标交互策略，所述目标交互策略用于表征数字人与所述目标用户进行交互的形式；

5、基于所述目标交互策略控制所述数字人与所述目标用户进行交互。

6、可选地，所述基于所述目标交互策略控制数字人与所述目标用户进行交互，包括：

7、在所述数字人的展示界面显示提示信息，所述提示信息用于表征所述目标交互策略；

8、接收所述目标用户的输入；

9、在基于所述目标用户的输入确定目标用户接受所述目标交互策略的情况下，基于所述目标交互策略控制数字人与所述目标用户进行交互。

10、可选地，所述基于所述目标交互策略控制数字人与所述目标用户进行交互，包括：

11、判断所述数字人的交互数据中是否包含第一关键词；

12、在所述数字人的交互数据中包含所述第一关键词的情况下，基于所述目标交互策略控制数字人与所述目标用户进行交互。

13、可选地，所述环境信息包括环境人数和声场强度，所述获取目标用户所处环境的环境信息，包括：

14、获取所述目标用户所处区域的图像以及所述目标用户所处区域内的声音数据；

15、将所述目标用户所处区域的图像输入图像识别模型，得到所述环境人数，以及基于所述目标用户所处区域内的声音数据计算所述声场强度，所述环境人数为所述目标用户所处区域内的人数。

16、可选地，所述基于所述目标用户所处环境的环境信息确定目标交互策略，包括：

17、基于所述目标用户所处区域内的声音数据确定所述目标用户所处的声学场景；

18、基于预先定义的所述声学场景下的环境信息与交互策略的对应关系，确定所述目标用户所处环境的环境信息对应的所述目标交互策略。

19、可选地，所述基于所述目标用户所处环境的环境信息确定目标交互策略之前，所述方法还包括：

20、基于所述目标用户所处区域的图像确定目标方向，所述目标方向用于表征所述目标用户所处区域内人数满足预设条件的方向；

21、控制所述数字人指示所述目标用户朝向所述目标方向移动；

22、在所述目标用户朝向所述目标方向移动后，重新获取所述目标用户所处环境的环境信息。

23、可选地，所述控制所述数字人指示所述目标用户朝向所述目标方向移动，包括：

24、将所述目标方向对应的方向向量映射到所述数字人所处虚拟空间，得到目标向量；

25、基于所述目标向量控制所述数字人对所述目标方向进行表征。

26、可选地，所述获取目标用户所处环境的环境信息之后，所述方法还包括：

27、基于所述目标用户所处环境的环境信息判断所述目标用户所处环境内是否包含目标人物；

28、在所述目标用户所处环境包含所述目标人物的情况下，将所述目标人物关联的信息确定为第二关键词；

29、在检测到所述数字人的交互数据包含所述第二关键词的情况下，控制所述数字人以文字形式与所述目标用户进行交互。

30、可选地，所述基于所述目标用户所处环境的环境信息判断所述目标用户所处环境是否包含目标人物，包括：

31、对所述目标用户所处区域的图像进行图像识别，得到多个面部特征向量，和/或对所述目标用户所处区域内的声音数据进行声纹识别，得到多个声纹特征；

32、在所述多个面部特征向量与所述目标人物的面部特征向量匹配，和/或所述多个声纹特征与所述目标人物的声纹特征匹配的情况下，确定所述目标用户所处环境包含所述目标人物。

33、第二方面，本发明实施例提供了一种人机交互控制装置，包括：

34、第一获取模块，用于获取目标用户所处环境的环境信息；

35、第一确定模块，用于基于所述目标用户所处环境的环境信息确定目标交互策略，所述目标交互策略用于表征数字人与所述目标用户进行交互的形式；

36、第一控制模块，用于基于所述目标交互策略控制所述数字人与所述目标用户进行交互。

37、第三方面，本申请实施例还提供一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的程序，所述处理器执行所述程序时实现如上所述的人机交互控制方法中的步骤。

38、第四方面，本申请实施例还提供一种可读存储介质，所述可读存储介质上存储程序，所述程序被处理器执行时实现如上所述的人机交互控制方法中的步骤。

39、第五方面，本申请实施例还提供一种计算机程序产品，包括计算机指令，该计算机指令被处理器执行时实现如第一方面所述的人机交互控制方法的步骤。

40、在本申请实施例中，获取目标用户所处环境的环境信息；基于目标用户所处环境的环境信息确定目标交互策略，目标交互策略用于表征数字人与目标用户进行交互的形式；基于目标交互策略控制数字人与目标用户进行交互。通过上述方法，数字人可以对用户当前所处环境进行感知，根据用户当前所处环境的环境信息确定目标交互策略，从而使得目标交互策略适应交互环境而变化，提高了人机交互的灵活性和安全性。

技术特征：

1.一种人机交互控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述目标交互策略控制所述数字人与所述目标用户进行交互，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述目标交互策略控制所述数字人与所述目标用户进行交互，包括：

4.根据权利要求1-3中任一项所述的方法，其特征在于，所述环境信息包括环境人数和声场强度，所述获取目标用户所处环境的环境信息，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述目标用户所处环境的环境信息确定目标交互策略之前，所述方法还包括：

6.根据权利要求4所述的方法，其特征在于，所述获取目标用户所处环境的环境信息之后，所述方法还包括：

7.一种人机交互控制装置，其特征在于，包括：

8.一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序；其特征在于，所述处理器，用于读取存储器中的程序实现如权利要求1至7中任一项所述的人机交互控制方法中的步骤。

9.一种可读存储介质，用于存储程序，其特征在于，所述程序被处理器执行时实现如权利要求1至7中任一项所述的人机交互控制方法中的步骤。

10.一种计算机程序产品，其特征在于，包括计算机指令，该计算机指令被处理器执行时实现如权利要求1至7中任一项所述的人机交互控制方法的步骤。

技术总结本申请公开了一种人机交互控制方法、装置、电子设备及可读存储介质，涉及人机交互技术领域，以解决用户和数字人交互策略难以根据外界环境自动地进行切换，灵活性较差的问题。该方法包括：获取目标用户所处环境的环境信息；基于所述目标用户所处环境的环境信息确定目标交互策略，所述目标交互策略用于表征数字人与所述目标用户进行交互的形式；基于所述目标交互策略控制所述数字人与所述目标用户进行交互。本申请实施例可提高人机交互的灵活性。技术研发人员：李宗祥,黄琼峰受保护的技术使用者：咪咕文化科技有限公司技术研发日：技术公布日：2024/9/2