一种文本布局方法、装置、电子设备及存储介质
- 国知局
- 2024-07-31 23:16:04
本发明涉及文本布局,尤其涉及一种文本布局方法、装置、电子设备及存储介质。
背景技术:
1、随着文本布局技术的发展,智能生成文本布局算法也引起了广泛的关注,文本布局在图像设计和场景生成应用中越来越重要。在智能文本布局过程中,特别是当需要生成特定的设计特征时,如何灵活有效的控制文本布局的生产,成了亟待解决的问题。
2、现有技术中对文本布局的方法包括:深度学习模型对抗网络gans以及textlogolayout工具。深度学习模型对抗网络gans是通过训练后的对抗网络模型生成与文本内容相对应的图像,该模型的可控性差且创作能力有限;textlogolayout是将字符语义信息与布局信息融合在一起,对文字做风格、形状变化,生成了符合文本内容的布局,布局结果随机,可控性差,处理中文文本时会有偏差。
3、因此,为了确保文本布局的灵活性和可控性,急需一种文本布局的方法,对文本布局进行灵活可控的参数化的控制。
技术实现思路
1、有鉴于此,有必要提供一种文本布局方法、装置、电子设备及存储介质,用以解决现有技术中因文本布局不精确而存在的文本布局过于随机的技术问题。
2、为了解决上述问题,第一方面,本发明提供了一种文本布局方法,包括:
3、获取文本内容以及布局控制参数,所述布局控制参数包括方向参数、曲率参数、分割参数以及字体大小参数;
4、根据所述布局控制参数对所述文本内容进行编码排版布局,得到排版文本编码,生成文本边界框;
5、根据所述文本边界框生成文本布局图像。
6、在一种可能的实现方式中,根据所述布局控制参数对所述文本内容进行编码排版布局,得到排版文本编码,生成文本边界框,包括:
7、将所述文本内容转换成数据集合,并对数据集合进行位置嵌入生成第一数据集合;
8、根据所述方向参数和曲率参数对第一数据集合通过独热编码进行方向嵌入和曲率嵌入生成第二数据集合;
9、根据所述分割参数对第二数据集合进行分割嵌入生成第三数据集合;
10、根据所述字体大小参数对第三数据集合进行宽度嵌入生成最终嵌入表示层;
11、根据transfomer模型编码器和transfomer模型解码器对所述最终嵌入表示层进行编码和解码,生成文本边界框。
12、在一种可能的实现方式中,将所述文本内容转换成数据集,并对数据集进行位置嵌入,包括:结合bert模型和两个线性层对所述文本内容进行转换处理,提取所述文本内容的特征表示,生成数据集合,结合深度学习模型对数据集合进行位置嵌入。
13、在一种可能的实现方式中,将所述最终嵌入表示层根据编码器和解码器生成文本边界框,包括:
14、使用transfomer模型编码器对所述最终嵌入表示层进行编码,生成编码表示层;
15、使用transfomer模型解码器将所述编码表示层内容解码成图像格式的边界框;
16、对边界框进行优化,生成最终边界框。
17、在一种可能的实现方式中,所述数据集合包括顺序文本内容;根据所述文本边界框,生成文本布局图像,包括:
18、将所述顺序文本内容嵌入所述最终边界框中,生成布局文本;
19、通过python模块pillow库将所述布局文本渲染到图像上,生成布局文本图像;
20、对所述布局文本图像进行风格迁移,生成最终文本布局图像。
21、在一种可能的实现方式中,对所述布局文本图像进行风格迁移,生成最终文本布局图像,包括:
22、根据最终嵌入表示层中的宽度嵌入,调整所述布局文本图像上字体的相对大小;
23、对所述布局文本图像进行局部的修改和控制,对布局文本图像进行整体风格迁移。
24、在一种可能的实现方式中,所述方向参数包括:水平参数和垂直参数;所述曲率参数包括:无曲率参数和弯曲参数;所述分割参数包括:分割段数和分割段字符数。
25、第二方面,本发明还提供了一种文本布局装置,包括:
26、获取模块,用于获取文本内容以及布局控制参数,所述布局控制参数包括方向参数、曲率参数、分割参数以及字体大小参数;
27、布局控制模块,用于根据所述布局控制参数对所述文本内容进行编码排版布局,得到排版文本编码,生成文本边界框;
28、图像生成模块,用于根据所述文本边界框生成文本布局图像。
29、第三方面,本发明还提供一种电子设备,包括存储器和处理器,其中,所述存储器,用于存储程序和数据;所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,实现如上文所述的文本布局方法。
30、第四方面,本发明还提供一种计算机存储介质,用于存储计算机可读取的程序或指令,所述程序或指令被处理器执行时,能够实现如上文所述的文本布局方法。
31、本发明的有益效果包括:首先,本发明根据布局控制参数对文本内容进行方向、曲率、分割和字体大小的编码的排版布局,得到排版文本编码,通过指定文本的方向参数、曲率参数、分割参数和字体大小参数来控制文本排版布局,这种参数化的控制方法提供了更高的灵活性,能够根据需求生成具有特定特征的排版文本布局。然后,根据transfomer模型编码器和transfomer模型解码器生成文本边界框,确保生成的文本布局遵循正确的阅读顺序,保证了文本布局的可读性,更提高了文本布局的准确性和自然性。最后,将顺序文本内容嵌入最终边界框中,并将布局文本渲染到图像上,生成布局文本图像,根据最终嵌入表示层中的宽度嵌入,调整文本图像上字体的相对大小,对布局文本图像进行局部的修改和控制,对布局文本图像进行整体风格迁移,通过对布局文本图像的风格迁移,更能够在视觉上丰富图像的细节和背景,使得合成的布局文本图像更加真实和具有吸引力。
技术特征:1.一种文本布局方法,其特征在于,包括:
2.根据权利要求1所述的一种文本布局方法,其特征在于,根据所述布局控制参数对所述文本内容进行编码排版布局,得到排版文本编码,生成文本边界框,包括:
3.根据权利要求2所述的一种文本布局方法,其特征在于,将所述文本内容转换成数据集,并对数据集进行位置嵌入,包括:
4.根据权利要求3所述的一种文本布局方法,其特征在于,所述数据集合包括文本真实边界框;将所述最终嵌入表示层根据编码器和解码器生成文本边界框,包括:
5.根据权利要求4所述的一种文本布局方法,其特征在于,所述数据集合包括顺序文本内容;根据所述文本边界框,生成文本布局图像,包括:
6.根据权利要求5所述的一种文本布局方法,其特征在于;对所述布局文本图像进行风格迁移,生成最终文本布局图像,包括:
7.根据权利要求1所述的一种文本布局方法,其特征在于,
8.一种文本布局装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括存储器和处理器,其中,所述存储器,用于存储程序和数据;所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述程序,以实现上述权利要求1至7中任一项所述一种文本布局方法的步骤。
10.一种存储介质,其特征在于,用于存储计算机可读取的程序或指令,所述程序或指令被处理器执行时,能够实现上述权利要求1至7中任一项所述一种文本布局方法的步骤。
技术总结本发明提供了一种文本布局方法、装置、电子设备及存储介质,属于文本布局技术领域,其方法包括:获取文本内容以及布局控制参数,所述布局控制参数包括方向参数、曲率参数、分割参数以及字体大小参数;根据所述布局控制参数对所述文本内容进行编码排版布局,得到排版文本编码,生成文本边界框;根据所述文本边界框生成文本布局图像。本发明根据可控的布局参数,通过指定文本的方向参数、曲率参数、分割参数和字体大小参数来控制生成的文本布局图像。这种参数化的控制方法根据需求生成具有特定特征的文本布局图像,更具灵活性,可控性更强。技术研发人员:朱安娜,何江洋,陈虎恩,宋文博,林玮琦受保护的技术使用者:武汉理工大学技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/196708.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。