技术新讯 > 计算推算,计数设备的制造及其应用技术 > 图像生成方法、装置、电子设备及存储介质与流程 > 正文

图像生成方法、装置、电子设备及存储介质与流程

国知局
2024-08-05 12:00:03

本公开涉及图像处理，尤其涉及人工智能和深度学习领域，具体涉及一种图像生成方法、装置、电子设备及存储介质。

背景技术：

1、目前基于生成式人工智能(artificial intelligence generated content，aigc)进行绘本生成时，会出现同一绘本中给定角色在画面中呈现的形象不一致的问题，基于固定角色的形象描述词prompt或引入低秩自适应参数矩阵lora解决角色形象不一致问题时，成本较高且无法实时灵活设计角色形象。

技术实现思路

1、本公开提供了一种图像生成方法、装置、电子设备及存储介质。

2、根据本公开的一方面，提供了一种图像生成方法，包括：

3、获取绘本角色的描述提示词prompt；

4、根据所述绘本角色的描述prompt，生成绘本角色的参考图集；

5、根据所述绘本角色的参考图集，获取所述绘本角色的一致性控制信息；

6、基于所述描述prompt和所述一致性控制信息，生成绘本故事图集。

7、根据本公开的第二方面，提供了另一种图像生成方法，包括：

8、客户端接收输入的绘本角色的描述prompt，并发送给处理设备；

9、所述处理设备根据所述描述prompt生成绘本角色的参考图集；

10、所述客户端接收所述绘本角色的参考图集并在显示界面进行展示；

11、所述处理设备根据所述绘本角色的参考图集获取一致性控制信息，并基于所述描述prompt和一致性控制信息生成绘本故事图集；

12、所述客户端接收所述绘本故事图集，并在显示界面进行展示。

13、根据本公开的第三方面，提供了一种图像生成装置，包括：

14、第一获取模块，用于获取绘本角色的描述提示词prompt；

15、第一生成模块，用于根据所述绘本角色的描述prompt，生成绘本角色的参考图集；

16、第二获取模块，用于根据所述绘本角色的参考图集，获取所述绘本角色的一致性控制信息；

17、第二生成模块，用于基于所述描述prompt和所述一致性控制信息，生成绘本故事图集。

18、根据本公开的第四方面，提供了另一种图像生成装置，包括：

19、客户端，用于接收输入的绘本角色的描述prompt，并发送给处理设备、接收所述绘本角色的参考图集并在显示界面进行展示、接收所述绘本故事图集，并在显示界面进行展示；

20、处理设备，用于根据所述描述prompt生成绘本角色的参考图集、根据所述绘本角色的参考图集获取一致性控制信息，并基于所述描述prompt和一致性控制信息生成绘本故事图集。

21、根据本公开的第五方面，提供了一种电子设备，包括：

22、至少一个处理器；以及

23、与所述至少一个处理器通信连接的存储器；其中，

24、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面所述的方法。

25、根据本公开的第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行第一方面所述的方法。

26、根据本公开的第七方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现第一方面所述方法的步骤。

27、本公开实施例至少具有以下有益效果：通过绘本角色的描述prompt生成绘本角色的参考图集，并基于参考图集获取绘本角色的一致性控制信息，以参考图集和一致性控制信息固定角色基本形象，根据一致性控制信息和描述prompt进行绘本故事图集的生成，确保绘本中角色形象的一致性，提升阅读体验。

28、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种图像生成方法，其中，所述方法包括：

2.根据权利要求1所述的方法，其中，所述根据所述绘本角色的描述prompt，生成绘本角色的参考图集，包括：

3.根据权利要求2所述的方法，其中，所述对所述第一潜在空间图像进行解码，得到所述绘本角色的参考图集，包括：

4.根据权利要求1所述的方法，其中，所述根据所述绘本角色的参考图集，获取所述绘本角色的一致性控制信息，包括：

5.根据权利要求4所述的方法，其中，所述根据提取的所述角色形象特征，获取所述绘本角色的一致性控制信息，包括：

6.根据权利要求5所述的方法，其中，所述对提取的所述角色形象特征进行编码，得到所述形象图片的第二编码向量，包括：

7.根据权利要求5所述的方法，其中，所述基于所述第二编码向量，确定所述一致性控制信息，包括：

8.根据权利要求7所述的方法，其中，所述根据每类角色形象特征的所述第三编码向量，生成所述一致性控制信息，包括：

9.根据权利要求2-8中任一项所述的方法，其中，所述基于所述描述prompt和所述一致性控制信息，生成绘本故事图集，包括：

10.根据权利要求9所述的方法，其中，所述对所述第二潜在空间图像进行解码，得到所述绘本故事图集，包括：

11.一种图像生成方法，其中，所述方法包括：

12.根据权利要求11所述的方法，其特征在于，所述客户端接收输入的绘本角色的描述prompt，并发送给处理设备，包括：

13.根据权利要求11所述的方法，其特征在于，所述方法还包括：

14.根据权利要求11所述的方法，其特征在于，所述方法还包括：

15.根据权利要求11所述的方法，其特征在于，所述方法还包括：

16.一种图像生成装置，包括：

17.根据权利要求16所述的装置，其中，所述第一生成模块，包括：

18.根据权利要求17所述的装置，其中，所述第一生成模块，包括：

19.根据权利要求16所述的装置，其中，所述第二获取模块，包括：

20.根据权利要求19所述的装置，其中，所述第二获取模块，包括：

21.根据权利要求20所述的装置，其中，所述第二获取模块，包括：

22.根据权利要求20所述的装置，其中，所述第二获取模块，包括：

23.根据权利要求22所述的装置，其中，所述第二获取模块，包括：

24.根据权利要求17-23中任一项所述的装置，其中，所述第二生成模块，包括：

25.根据权利要求24所述的装置，其中，所述第二生成模块，包括：

26.一种图像生成装置，包括：

27.根据权利要求26所述的装置，其特征在于，所述客户端，包括：

28.根据权利要求26所述的装置，其特征在于，所述装置还包括：

29.根据权利要求26所述的装置，其特征在于，所述装置还包括：

30.根据权利要求26所述的装置，其特征在于，所述装置还包括：

31.一种电子设备，包括：

32.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-10或11-15中任一项所述的方法。

33.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-10或11-15中任一项所述方法的步骤。

技术总结本公开提供了一种图像生成方法、装置、电子设备及存储介质，涉及图像处理技术领域，尤其涉及人工智能和深度学习领域。具体实现方案为：获取绘本角色的描述提示词prompt；根据绘本角色的描述prompt，生成绘本角色的参考图集；根据绘本角色的参考图集，获取绘本角色的一致性控制信息；基于描述prompt和一致性控制信息，生成绘本故事图集。技术研发人员：罗雪妮,刘庆受保护的技术使用者：百度在线网络技术（北京）有限公司技术研发日：技术公布日：2024/8/1