技术新讯 > 计算推算,计数设备的制造及其应用技术 > 图片生成方法、装置、计算机设备、存储介质及程序产品与流程  >  正文

图片生成方法、装置、计算机设备、存储介质及程序产品与流程

  • 国知局
  • 2024-07-31 22:38:13

本申请实施例涉及人工智能领域,特别涉及一种图片生成方法、装置、计算机设备、存储介质及程序产品。

背景技术:

1、在生产生活中,常常需要生成包含文字信息的图片。例如,海报制作、封面制作、产品介绍页面制作等场景中,需要结合图像素材和文字信息生成所需的图片。

2、相关技术中,可以通过关键词进行图像检索,以得到与关键词匹配的图像素材;接着再通过人工确定需要添加至图像素材中的文本信息,组合文本信息与图像素材,以得到所需的图片;同时还需要人工进行排版布局、字体和字号调整等操作,使得图片更加美观。

3、然而,采用上述方式生成包含图像素材和文本信息的图片,需要人工手动执行对文本的选择和添加操作,以及对图片的调整操作,因此,图片的生成效率较低。

技术实现思路

1、本申请实施例提供了一种图片生成方法、装置、计算机设备、存储介质及程序产品。所述技术方案如下:

2、一方面,本申请实施例提供了一种图片生成方法,所述方法包括:

3、通过大语言模型从原始文本中提取结构化文本,所述结构化文本由结构化字段,以及所述结构化字段对应的内容文本组成,所述结构化字段用于表征所述原始文本的内容结构,且所述内容文本基于所述原始文本中符合所述结构化字段的描述的内容生成;

4、基于所述结构化文本,获取所述原始文本所描述实体对应的实体图像素材;

5、基于所述结构化文本中所述结构化字段与图片模板中待填充区域的区域内容描述字段的匹配关系,将所述结构化文本中的所述内容文本以及所述实体图像素材填充至所述图片模板,得到目标图片。

6、另一方面,本申请实施例提供了一种图片生成装置,所述装置包括:

7、文本提取模块,用于通过大语言模型从原始文本中提取结构化文本,所述结构化文本由结构化字段,以及所述结构化字段对应的内容文本组成,所述结构化字段用于表征所述原始文本的内容结构,且所述内容文本基于所述原始文本中符合所述结构化字段的描述的内容生成;

8、图像获取模块,用于基于所述结构化文本,获取所述原始文本所描述实体对应的实体图像素材;

9、模版填充模块,用于基于所述结构化文本中所述结构化字段与图片模板中待填充区域的区域内容描述字段的匹配关系,将所述结构化文本中的所述内容文本以及所述实体图像素材填充至所述图片模板,得到目标图片。

10、另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条计算机指令,所述至少一条计算机指令由所述处理器加载并执行以实现如上述方面所述的方法。

11、另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机指令,所述计算机指令由处理器加载并执行以实现如上述方面所述的方法。

12、另一方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面的各种可选实现方式中提供的方法。

13、本申请实施例中,通过大语言模型从原始文本中提取结构化文本,可以获取到原始文本的各个内容结构的结构化字段,以及原始文本中符合结构化字段的描述的内容文本。通过结构化文本获取原始文本所描述实体对应的实体图像素材,基于结构化文本中结构化字段与图片模板中待填充区域的区域内容描述字段的匹配关系,将结构化文本中的内容文本以及实体图像素材填充至图片模板,得到的目标图片中既包含了反映原始文本的主要内容的内容文本,又包含了反映原始文本所描述实体的实体图像素材,因此用户既可以从目标图片中直观地看出所描述的实体,又可以进一步获取相应的文字信息。同时,采用本申请的方式基于大语言模型生成目标图片,可以对内容文本的自动选择和填充,无需人工操作,提升了图片的生成效率。

技术特征:

1.一种图片生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过大语言模型从原始文本中提取结构化文本,包括:

3.根据权利要求2所述的方法,其特征在于,所述将结构提示信息和所述原始文本输入所述大语言模型,得到所述大语言模型输出的所述结构化文本,包括:

4.根据权利要求2所述的方法,其特征在于,所述结构化字段包含主要点字段和子要点字段,所述主要点字段对应主要点内容文本,所述子要点字段对应子要点内容文本;

5.根据权利要求2所述的方法,其特征在于,所述结构化字段中的实体字段包括主要点实体字段和子要点实体字段,所述主要点实体字段对应主要点实体文本,所述子要点实体字段对应子要点实体文本;

6.根据权利要求2所述的方法,其特征在于,所述基于逻辑优化提示信息,通过所述大语言模型逻辑优化所述结构化文本,得到逻辑优化后的所述结构化文本之前,所述方法还包括:

7.根据权利要求2所述的方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的方法,其特征在于,所述基于所述结构化文本中所述结构化字段与图片模板中待填充区域的区域内容描述字段的匹配关系,将所述结构化文本中的所述内容文本以及所述实体图像素材填充至所述图片模板,得到目标图片,包括:

9.根据权利要求8所述的方法,其特征在于,所述区域内容描述字段包括必要字段和可选字段,所述基于所述结构化文本中所述结构化字段与候选图片模板中所述待填充区域的所述区域内容描述字段的所述匹配关系,确定所述候选图片模版与所述结构化文本的模版匹配度,包括:

10.根据权利要求9所述的方法,其特征在于,所述确定所述内容文本以及所述实体图像素材与所述待填充区域的内容匹配度,包括:

11.根据权利要求9所述的方法,其特征在于,所述结构化字段包括主要点字段和子要点字段,所述待填充区域包括主要点待填充区域和子要点待填充区域,所述在所述候选图片模版中存在至少一个必要字段与所述结构化字段不匹配的情况下,确定所述候选图片模版的所述模版匹配度为最低匹配度,包括:

12.根据权利要求9所述的方法,其特征在于,所述将所述结构化文本中的所述内容文本以及所述实体图像素材,填充至具有最高模版匹配度的所述候选图片模板,得到所述目标图片,包括:

13.根据权利要求8所述的方法,其特征在于,所述将所述结构化文本中的所述内容文本以及所述实体图像素材,填充至具有最高模版匹配度的所述候选图片模板,得到所述目标图片,包括:

14.根据权利要求8所述的方法,其特征在于,所述将所述结构化文本中的所述内容文本以及所述实体图像素材,填充至具有最高模版匹配度的所述候选图片模板,得到所述目标图片,包括:

15.一种图片生成装置,其特征在于,所述装置包括:

16.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器;所述存储器存储有至少一条计算机指令,所述至少一条计算机指令用于被所述处理器执行以实现如权利要求1至14任一所述的图片生成方法。

17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机指令,所述计算机指令由处理器加载并执行以实现如权利要求1至14任一所述的图片生成方法。

18.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中;计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行如权利要求1至14任一所述的图片生成方法。

技术总结本申请实施例公开了一种图片生成方法、装置、计算机设备、存储介质及程序产品,涉及人工智能领域。包括:通过大语言模型从原始文本中提取结构化文本,结构化文本由结构化字段,以及结构化字段对应的内容文本组成,结构化字段用于表征原始文本的内容结构,且内容文本基于原始文本中符合结构化字段的描述的内容生成;基于结构化文本,获取原始文本所描述实体对应的实体图像素材;基于结构化文本中结构化字段与图片模板中待填充区域的区域内容描述字段的匹配关系,将结构化文本中的内容文本以及实体图像素材填充至图片模板,得到目标图片。采用本申请实施例的方法,可以提升图片生成效率,得到包含内容文本以及实体图像素材的目标图片。技术研发人员:杨政骥,何中华,王晨阳,张倩,廖俊豪,李尔男,彭凯池,张灿,邱杨受保护的技术使用者:腾讯科技(深圳)有限公司技术研发日:技术公布日:2024/7/25

本文地址:https://www.jishuxx.com/zhuanli/20240730/193938.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。