技术新讯 > 休闲运动,玩具,娱乐用品的装置及其制品制造技术 > 一种基于扩散模型的游戏关卡内容生成方法  >  正文

一种基于扩散模型的游戏关卡内容生成方法

  • 国知局
  • 2024-07-11 16:22:00

本发明涉及人工智能技术在游戏制作上的应用,特别是涉及一种基于扩散模型的游戏关卡内容生成方法。

背景技术:

1、关卡内容程序性生成,作为游戏与人工智能研究领域的核心问题之一,旨在利用算法自动生成合乎特定要求的游戏关卡。程序化内容生成在商业化的游戏中收到广泛关注,常应用于开放世界游戏的地图生成,如《我的世界》《文明4》《gta》等。其相关研究不仅可以节省人工重复建模游戏内容的成本,还可以激发玩家和设计师的创造力,带来更强更高效的游戏交互体验。

2、传统的关卡内容程序性生成方法,算法主要是基于规则、语法等非神经网络的模型,生成内容多样性有明显局限性。当前基于深度学习的程序性内容生成模型中,主要是以对抗生成网络及其变体为主。其核心思想是采用多组对抗生成网络由粗到细的提高生成结果的分辨率。多阶段对抗生成网络的方法会产生两个主要缺点。第一个缺陷是在多组对抗生成网络交替生成的过程中,生成关卡的分辨率在不断提高的同时错误也在不断累加,因此导致最终生成的关卡中会产生语义错误的结构如飘浮堆块、残缺结构等。第二个缺陷是学习到的对抗生成网络潜在空间很大,这意味生成的结果符合特定要求(机制合理等)的比率偏低,需要进一步用进化搜索的算法去筛选例子。

3、cn114418005b公开了一种基于gan网络的游戏地图自动生成方法、装置、介质及设备,属于游戏地图技术领域。该方法包括如下步骤:根据已知地图区域中出现的物体实例类别和每种类别的实例个数,获取待扩展区域中可能出现的物体实例类别和每种类别的实例个数;获取gan网络模型,所述gan网络模型包括地图生成器g和地图判别器d;将待扩展区域的物体实例类别和每种类别的实例个数输入到所述的gan网络模型中的地图生成器g中,生成待扩展区域的新地图。利用gan网络模型能够自动生成逼真但又与已知地图有所差异的游戏地图,降低游戏地图的开发成本。

4、现有的深度学习方法存在需要大量训练集,占用训练内存大,训练时间长等的缺点。

5、需要说明的是,在上述背景技术部分公开的信息仅用于对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

1、本发明的主要目的在于克服上述现有技术中的缺陷,提供一种基于扩散模型的游戏关卡内容生成方法。

2、为实现上述目的,本发明采用以下技术方案:

3、一种基于扩散模型的游戏关卡内容生成方法,包括如下步骤:

4、s1、收集地图区域内的每个组成块的词元,将所述词元整理成数据集,对所述词元进行分类,并计算各词元类别的概率,用于指导模型的学习和训练;

5、s2、使用词嵌入模型学习词元的嵌入表示,通过所述词嵌入模型预测特定词元作为上下文出现的概率;将收敛后的所述词嵌入模型的隐藏层作为每个词元的嵌入表示;

6、s3、接下来用由词元嵌入向量表示的地图作为训练集,训练一个感受野受限的潜在扩散模型,其预测目标为预测原始数据;

7、s4、模型推理阶段,随机采样高斯噪声,在时间步长t内,将加噪样本反复通过潜在扩散模型的去噪网络去噪,直到输出时间步长t=0时的预测结果,将嵌入表示的预测结果根据步骤s2期间生成的映射表转换为原始地图表示,得到最终的生成结果。

8、进一步地:

9、所述词嵌入模型是skip-gram模型。

10、将收敛后的所述词嵌入模型最后一层隐藏层作为每个词元的嵌入表示,利于加速后续扩散模型训练和收敛。

11、步骤s1中,收集地图区域内每个组成块的词元li,记为数据集l,i∈(0,|l|),计算集合l内不同词元类别出现的概率,词元概率p(li)定义为:

12、

13、其中,f(li)表示词元li在数据集l中出现的频率。

14、步骤s2中,采用两层的词嵌入模型得到嵌入的词向量,训练后的隐藏层即是各个词元的嵌入表示,步骤s2执行结束后,数据集l内各个词元li均由32维嵌入向量表示,记由嵌入向量表示的地图为

15、步骤s3中,对于所述潜在扩散模型,处理其去噪网络结构中所有可能增大网络感受野的模块,包括:对上下采样模块和中间注意力层进行了减小其感受野范围的处理,将所有残差模块改为全连接形式,以及将每个残差模块内的激活函数改为leaky relu。

16、步骤s3中,每一轮训练过程包括:

17、(1)在(1,t)内采样一个时间步长t,对输入进行随机裁剪,裁剪比率由超参数γ控制;

18、(2)将时间步长t对应的高斯噪声加入到输入上,其中表示标准正态分布,得到加噪样本

19、

20、这里αi=1-βi,βi是预先定义的超参数,是t=0时经过随机裁剪操作的

21、(3)将和t作为输入训练去噪网络,去噪网络的目标是预测原始数据则模型的损失函数定义为:

22、

23、其中表示t时刻参数为θ的去噪网络对目标的预测。

24、(4)不断重复(1)(2)(3)步骤直至模型收敛。

25、步骤s4中,模型推理阶段,随机采样一个高斯噪声在时间步长t∈t内,将加噪样本反复通过去噪网络去噪,表示如下:

26、

27、其中βi也是预先定义的超参数;

28、直到输出t=0时去噪网络的预测结果将嵌入表示的根据映射表转换为原始数据表示即得到最终的生成结果。

29、一种计算机可读存储介质,存储有计算机程序,所述计算机程序由处理器执行时,实现所述的基于扩散模型的游戏关卡内容生成方法。

30、本发明具有如下有益效果:

31、本发明能够获得更高效的用于程序性生成深度学习模型的关卡表示,从而更节省训练内存并促进模型的拟合,并且,可以利用较少的学习数据,从单个游戏关卡数据中学习扩散模型。本发明能够加速美术建模效率,节省人工成本。

32、与现有的方法相比,本发明的优势主要包括:

33、1.本发明克服了用深度学习方法需要大量训练集的缺点,仅从一个训练样本中即可学习一个关卡生成器。

34、2.本发明适用于2d、3d所有基于词元构造的游戏,所设计的关卡紧凑嵌入式表征模块有益于神经网络训练时的收敛,缩短训练时长,节省人工成本。

35、3.相比于gan网络的方法,本发明提出的扩散模型学习到的潜在空间更小,捕捉到的关卡分布更准确,所以生成的关卡结果更合理、语义结构更丰富。

36、本发明实施例中的其他有益效果将在下文中进一步述及。

技术特征:

1.一种基于扩散模型的游戏关卡内容生成方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于扩散模型的游戏关卡内容生成方法,其特征在于,所述词嵌入模型是skip-gram模型。

3.如权利要求1或2所述的基于扩散模型的游戏关卡内容生成方法,其特征在于,将收敛后的所述词嵌入模型最后一层隐藏层作为每个词元的嵌入表示。

4.如权利要求1至3任一项所述的基于扩散模型的游戏关卡内容生成方法,其特征在于,步骤s1中,收集地图区域内每个组成块的词元li,记为数据集l,i∈(0,|l|),计算集合l内不同词元类别出现的概率,词元概率p(li)定义为:

5.如权利要求1至4任一项所述的基于扩散模型的游戏关卡内容生成方法,其特征在于,步骤s2中,采用两层的词嵌入模型得到嵌入的词向量,训练后的隐藏层即是各个词元的嵌入表示,步骤s2执行结束后,数据集l内各个词元li均由32维嵌入向量表示,记由嵌入向量表示的地图为

6.如权利要求1至5任一项所述的基于扩散模型的游戏关卡内容生成方法,其特征在于,步骤s3中,对于所述潜在扩散模型,处理其去噪网络结构中所有可能增大网络感受野的模块,包括:对上下采样模块和中间注意力层进行了减小其感受野范围的处理,将所有残差模块改为全连接形式,以及将每个残差模块内的激活函数改为leaky relu。

7.如权利要求1至6任一项所述的基于扩散模型的游戏关卡内容生成方法,其特征在于,步骤s3中,每一轮训练过程包括:

8.如权利要求1至7任一项所述的基于扩散模型的游戏关卡内容生成方法,其特征在于,步骤s4中,模型推理阶段,随机采样一个高斯噪声在时间步长t∈t内,将加噪样本反复通过去噪网络去噪,表示如下:

9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序由处理器执行时,实现如权利要求1至8任一项所述的基于扩散模型的游戏关卡内容生成方法。

技术总结一种基于扩散模型的游戏关卡内容生成方法,包括:S1、收集地图区域内的每个组成块的词元,将词元整理成数据集,对词元进行分类,并计算各词元类别的概率;S2、使用词嵌入模型预测特定词元作为上下文出现的概率,学习词元的嵌入表示;S3、用由词元嵌入向量表示的地图作为训练集,训练一个感受野受限的潜在扩散模型,其预测目标为预测原始数据;S4、推理阶段,随机采样高斯噪声,在时间步长t内,将加噪样本反复通过潜在扩散模型的去噪网络去噪,直到输出时间步长t=0时的预测结果,将嵌入表示的预测结果根据步骤S2期间生成的映射表转换为原始地图表示,得到最终的生成结果。本发明节省训练内存并促进模型的拟合,可从单个游戏关卡数据中学习扩散模型,加速美术建模效率,节省人工成本。技术研发人员:代诗琦,王智受保护的技术使用者:清华大学深圳国际研究生院技术研发日:技术公布日:2024/5/10

本文地址:https://www.jishuxx.com/zhuanli/20240615/78883.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。