技术新讯 > 休闲运动,玩具,娱乐用品的装置及其制品制造技术 > 一种数据处理方法、装置、设备、存储介质及程序产品与流程 > 正文

一种数据处理方法、装置、设备、存储介质及程序产品与流程

国知局
2024-07-11 16:10:38

本技术涉及人工智能领域中的数据处理技术，尤其涉及一种数据处理方法、装置、设备、存储介质及程序产品。

背景技术：

1、在虚拟场景中，常常采用智能体进行虚拟对局，以提升虚拟场景中待操作虚拟角色的虚拟对局效果。在相关技术中，为了控制智能体在虚拟场景中进行虚拟对局，通常采用固定的对局方式控制智能体，如此，影响了智能体与待操作虚拟角色的适配度，从而，影响了智能体的控制效果。

技术实现思路

1、本技术实施例提供一种数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够提升智能体的控制效果。

2、本技术实施例的技术方案是这样实现的：

3、本技术实施例提供一种数据处理方法，所述数据处理方法包括：

4、响应于对局开始请求，获取待对局地图的初始位置拓扑；

5、对所述初始位置拓扑和位置转移关系进行融合，得到目标位置拓扑，所述位置转移关系表示待操作虚拟角色在所述待对局地图上进行虚拟对局所转移的位置；

6、结合所述目标位置拓扑和当前对局信息，预测待对局智能体的待转移信息，所述待转移信息包括待转移位置；

7、基于所述待对局智能体的当前观测信息，预测所述待对局智能体在所述待转移位置的待执行动作；

8、控制所述待对局智能体在所述待对局地图上执行所述待执行动作。

9、本技术实施例提供一种数据处理装置，所述数据处理装置包括：

10、拓扑获取模块，用于响应于对局开始请求，获取待对局地图的初始位置拓扑；

11、拓扑融合模块，用于对所述初始位置拓扑和位置转移关系进行融合，得到目标位置拓扑，所述位置转移关系表示待操作虚拟角色在所述待对局地图上进行虚拟对局所转移的位置；

12、转移预测模块，用于结合所述目标位置拓扑和当前对局信息，预测待对局智能体的待转移信息，所述待转移信息包括待转移位置；

13、动作预测模块，用于基于所述待对局智能体的当前观测信息，预测所述待对局智能体在所述待转移位置的待执行动作；

14、信息控制模块，用于控制所述待对局智能体在所述待对局地图上执行所述待执行动作。

15、在本技术实施例中，所述拓扑获取模块，还用于对所述待操作虚拟角色在所述待对局地图上进行虚拟对局的信息进行采集，得到待处理对局信息；从所述待处理对局信息中，确定发生虚拟对局事件的各个虚拟对局位置之间的转移关系；基于各个所述虚拟对局位置之间的所述转移关系，确定所述位置转移关系。

16、在本技术实施例中，所述拓扑获取模块，还用于获取待执行转移策略，所述待执行转移策略为执行频率大于频率阈值的虚拟对局指示；基于所述待执行转移策略，控制所述待操作虚拟角色在所述待对局地图上进行虚拟对局。

17、在本技术实施例中，所述拓扑获取模块，还用于由每个所述待操作虚拟角色的各个所述虚拟对局位置之间的所述转移关系，得到与多个所述待操作虚拟角色对应的多个所述转移关系；对多个所述转移关系进行整合，得到初始转移关系；基于多个所述转移关系，计算所述初始转移关系中每个所述虚拟对局位置的转移次数；结合所述转移次数和所述初始转移关系，得到所述位置转移关系。

18、在本技术实施例中，所述拓扑获取模块，还用于获取待对局虚拟角色，所述待对局虚拟角色为待与所述待对局智能体进行虚拟对局的所述待操作虚拟角色；获取所述待对局虚拟角色在所述待对局地图上进行虚拟对局的所述位置转移关系。

19、在本技术实施例中，所述拓扑获取模块，还用于获取所述待对局虚拟角色的目标角色属性，所述目标角色属性包括角色等级、角色装配信息和角色时长中的至少一种；对所述目标角色属性进行特征提取，得到目标角色特征；基于所述目标角色特征，预测所述待对局虚拟角色在所述待对局地图上进行虚拟对局的所述位置转移关系。

20、在本技术实施例中，所述拓扑获取模块，还用于获取所述对局开始请求所请求的虚拟对局对应的阶段关联信息，所述阶段关联信息包括以下中的至少一种：已对局时长，对局状态角色数量，虚拟资源剩余量，对局任务完成度；基于所述阶段关联信息确定当前对局阶段；基于对局阶段与阶段转移关系之间的第一对应关系，确定与所述当前对局阶段对应的目标阶段转移关系，所述阶段转移关系表示在对应的所述对局阶段，所述待操作虚拟角色在所述待对局地图上进行虚拟对局所转移的位置；将所述目标阶段转移关系确定为所述位置转移关系。

21、在本技术实施例中，所述拓扑融合模块，还用于针对所述位置转移关系中的每个位置转移路径，在所述初始位置拓扑中确定与所述位置转移路径对应的转移位置序列；在所述初始位置拓扑中标记每个所述位置转移路径的所述转移位置序列，得到所述目标位置拓扑。

22、在本技术实施例中，所述转移预测模块，还用于基于待对局虚拟角色的对局胜负序列，确定对局胜负比例；结合所述目标位置拓扑和所述当前对局信息，预测待对局智能体的多个候选转移位置对应的多个转移概率；从多个所述转移概率中，确定与所述对局胜负比例对应的目标转移概率；将所述目标转移概率对应的所述候选转移位置，确定为所述待转移位置，基于所述待转移位置，得到所述待转移信息。

23、在本技术实施例中，所述转移信息还包括在所述待转移位置的待对局方式，所述待对局方式包括以下信息中的至少一种：虚拟进攻，虚拟防守，分路对局，虚拟支援，虚拟埋伏；所述位置转移关系还包括每个所转移的位置对应的历史对局信息。

24、在本技术实施例中，所述动作预测模块，用于基于所述待对局智能体的所述当前观测信息和所述待对局方式，预测所述待对局智能体在所述待转移位置的所述待执行动作。

25、在本技术实施例中，所述拓扑获取模块，还用于对虚拟地图的网格地图模型进行通行检测，得到可通行位置拓扑；获取所述可通行位置拓扑中每个可通行位置的几何特征；基于所述几何特征，从所述可通行位置拓扑中确定转移位置拓扑；基于所述虚拟地图与所述转移位置拓扑，得到所述虚拟地图与所述转移位置拓扑之间的第二对应关系。

26、在本技术实施例中，所述拓扑获取模块，还用于响应于所述对局开始请求，得到所述待对局地图；基于所述第二对应关系，得到与所述待对局地图对应的目标转移位置拓扑，将所述目标转移位置拓扑确定为所述初始位置拓扑。

27、在本技术实施例中，所述待转移信息和所述待执行动作的预测通过对局预测模型实现，所述数据处理装置还包括模型训练模块，用于采用第一待训练模型对地图样本的初始位置拓扑样本和位置转移关系样本、以及对局信息样本进行预测，得到预估转移信息，获取所述预估转移信息对应的转移奖励值；采用第二待训练模型对所述预估转移信息和智能体样本的观测信息样本进行预测，得到预估动作，获取所述预估动作的动作奖励值；基于所述转移奖励值训练所述第一待训练模型，并基于所述动作奖励值训练所述第二待训练模型，得到与所述第一待训练模型对应的第一目标模型、以及与所述第二待训练模型对应的第二目标模型；将所述第一目标模型和所述第二目标模型确定为所述对局预测模型。

28、本技术实施例提供一种用于数据处理的电子设备，所述电子设备包括：

29、存储器，用于存储计算机可执行指令或者计算机程序；

30、处理器，用于执行所述存储器中存储的计算机可执行指令或者计算机程序时，实现本技术实施例提供的数据处理方法。

31、本技术实施例提供一种计算机可读存储介质，存储有计算机可执行指令或者计算机程序，所述计算机可执行指令或者计算机程序用于被处理器执行时，实现本技术实施例提供的数据处理方法。

32、本技术实施例提供一种计算机程序产品，包括计算机可执行指令或者计算机程序，所述计算机可执行指令或者计算机程序被处理器执行时，实现本技术实施例提供的数据处理方法。

33、本技术实施例至少具有以下有益效果：在响应于对局开始请求控制智能体在虚拟场景进行虚拟对局时，结合待操作虚拟角色进行虚拟对局所转移的位置和待对局地图的初始位置拓扑，预测智能体的待转移位置，并预测智能体转移至该带转移位置的待执行动作；使得智能体执行该待执行动作所转移的位置与待操作虚拟角色所转移的位置相关，进而能够提升智能体与待操作虚拟角色的适配度，提升智能体的控制效果。