技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种数字人生成方法、装置、设备以及存储介质与流程 > 正文

一种数字人生成方法、装置、设备以及存储介质与流程

国知局
2024-10-09 16:20:16

本公开涉及人工智能，尤其涉及计算机视觉、深度学习等，可应用于基于人工智能的内容生成等场景。

背景技术：

1、随着人工智能(ai，artificial intelligence)技术的发展，生成式人工智能(aigc，artificial intelligence generated content)创作工具已然成为辅助人类的重要技术，极大提高了科技生产力和工作效率。虚拟人(或数字人)技术是aigc的重要一环，它基于深度学习等技术构建虚拟人物形象，具备与人一样的交互能力。

技术实现思路

1、本公开提供了一种数字人生成方法、装置、设备以及存储介质。

2、根据本公开的一方面，提供了一种数字人生成方法，包括：

3、接收用户输入的底板文件和驱动文件；

4、利用至少两个数字人生成模型中的各个数字人生成模型，分别生成该底板文件对应的测试视频；

5、对各个该测试视频进行评分，基于评分结果，从该至少两个数字人生成模型中选取一个数字人生成模型；

6、利用选取的数字人生成模型，生成该底板文件和驱动文件对应的数字人内容。

7、根据本公开的另一方面，提供了一种数字人生成装置，包括：

8、接收模块，用于接收用户输入的底板文件和驱动文件；

9、视频生成模块，用于利用至少两个数字人生成模型中的各个数字人生成模型，分别生成该底板文件对应的测试视频；

10、评分选取模块，用于对各个该测试视频进行评分，基于评分结果，从该至少两个数字人生成模型中选取一个数字人生成模型；

11、内容生成模块，用于利用选取的数字人生成模型，生成该底板文件和驱动文件对应的数字人内容。

12、根据本公开的另一方面，提供了一种电子设备，包括：

13、至少一个处理器；以及

14、与该至少一个处理器通信连接的存储器；其中，

15、该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行本公开实施例中任一的方法。

16、根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

17、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

18、本公开方案中，在接收到用户的请求后，采用至少两个数字人生成模型分别生成一段测试视频，之后对各段测试视频进行评分，再根据评分结果选择最终为该用户提供数字人服务的数字人生成模型，由该数字人生成模型为该用户生成数字人内容。通过这种方式，可以确定出适合为用户提供服务的数字人生成模型，采用该适合的数字人生成模型为用户生成数字人内容，从而提高数字人生成效果。

19、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种数字人生成方法，包括：

2.根据权利要求1所述的方法，其中，所述驱动文件包括文本文件和语音文件中的至少之一。

3.根据权利要求2所述的方法，其中，所述利用至少两个数字人生成模型中的各个数字人生成模型，分别生成所述底板文件对应的测试视频，包括：

4.根据权利要求1-3中任一所述的方法，其中，所述基于评分结果，从所述至少两个数字人生成模型中选取一个数字人生成模型，包括；

5.根据权利要求1-3中任一所述的方法，其中，所述基于评分结果，从所述至少两个数字人生成模型中选取一个数字人生成模型，包括；

6.根据权利要求1-5中任一所述的方法，还包括，

7.根据权利要求6所述的方法，其中，所述底板文件包括视频文件或图片。

8.根据权利要求7所述的方法，其中，所述采用预先设计的数字人生成算法，为所述用户生成所述至少两个数字人生成模型，包括：

9.一种数字人生成装置，包括：

10.根据权利要求9所述的数字人生成装置，其中，所述驱动文件包括文本文件和语音文件中的至少之一。

11.根据权利要求10所述的数字人生成装置，其中，所述视频生成模块用于：

12.根据权利要求9-11中任一所述的数字人生成装置，其中，所述评分选取模块用于；

13.根据权利要求9-11中任一所述的数字人生成装置，其中，所述评分选取模块用于；

14.根据权利要求9-13中任一所述的数字人生成装置，还包括，

15.根据权利要求14所述的数字人生成装置，其中，所述底板文件包括视频文件或图片。

16.根据权利要求14所述的数字人生成装置，其中，所述模型生成模块用于：

17.一种电子设备，包括：

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。

19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。

技术总结本公开提供了一种数字人生成方法、装置、设备以及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习等技术领域。具体实现方案为：接收用户输入的底板文件和驱动文件；利用至少两个数字人生成模型中的各个数字人生成模型，分别生成该底板文件对应的测试视频；对各个该测试视频进行评分，基于评分结果，从该至少两个数字人生成模型中选取一个数字人生成模型；利用选取的数字人生成模型，生成该底板文件和驱动文件对应的数字人内容。本公开能够提高数字人生成效果。技术研发人员：常毅标,王磊,王宇婷,田彪受保护的技术使用者：北京百度网讯科技有限公司技术研发日：技术公布日：2024/9/26