技术新讯 > 计算推算,计数设备的制造及其应用技术 > 图像处理方法、装置和电子设备与流程  >  正文

图像处理方法、装置和电子设备与流程

  • 国知局
  • 2024-07-31 22:37:59

本申请属于人工智能,具体涉及一种图像处理方法、装置和电子设备。

背景技术:

1、人工智能(artificial intelligence,ai)以人类智能相似的方式做出反应,随着人工智能的发展,应用的方式越来与广泛。人工智能的应用例如与用户进行对话、生成绘图等。其中,利用人工智能进行绘图为用户带来了极大的便利,但由于在图像绘制之前,若用户提供的文字描述不够准确,或者原始图像包含的杂物过多,极易影响人工智能的图像绘制效果,反而需要用户重复操作,才能可能获得满足用户需求的图像。

技术实现思路

1、本申请实施例的目的是提供一种图像处理方法、装置和电子设备,可以有效提高第一图像的绘制效果与用户输入的提示词对应含义之间的符合度,无需用户反复操作,即可满足用户的图像处理需求。

2、第一方面,本申请实施例提供了一种图像处理方法,该方法包括:

3、接收用户输入的提示词;

4、将提示词和至少一张对象图像输入图像处理模型,输出第一图像;

5、其中,至少一张对象图像为预先从至少一张图像中抠取的至少一个对象的对象区域的图像,第一图像包括至少一张对象图像中的对象。

6、第二方面,本申请实施例提供了一种图像处理装置,该装置包括:

7、接收用户输入的提示词;

8、将提示词和至少一张对象图像输入图像处理模型,输出第一图像;

9、其中,至少一张对象图像为预先从至少一张图像中抠取的至少一个对象的对象区域的图像,第一图像包括至少一张对象图像中的对象。

10、第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。

11、第四方面,本申请实施例提供了一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。

12、第五方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的方法。

13、第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面的方法。

14、在本申请实施例中,通过接收用户输入的提示词,并将提示词和至少一种对象图像输入图像处理模型,进而得到图像处理模型输出的第一图像。其中,由于输入图像处理模型的至少一张对象图像是用户从预先从至少一张图像中抠取的至少一个对象的对象区域得到的图像,因此,图像处理模型可以结合用户输入的提示词,在对象图像的基础上生成第一图像,且在生成的第一图像中既可以保留抠取的对象,还能够有效提高第一图像的绘制效果与用户输入的提示词对应含义之间的符合度,此外,由于用户可以自定义文生图得到的图像中保留的对象,以及通过提示词可以方便地描述文生图得到的图像中对象的显示效果,无需用户反复操作,即可满足用户的图像处理需求,提高了文生图的灵活性。

技术特征:

1.一种图像处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述将所述提示词和至少一张对象图像输入图像处理模型,输出第一图像之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述更新所述至少一张对象图像,包括以下至少一项:

6.根据权利要求3所述的方法,其特征在于,所述图像编辑界面还包括背景图像设置控件;所述方法还包括:

7.根据权利要求1至6中任一项所述的方法,其特征在于,所述将所述提示词和至少一张对象图像输入图像处理模型,输出第一图像,包括:

8.根据权利要求7所述的方法,其特征在于,在所述对象包括动态对象,所述语义信息包括所述动态对象的活动状态信息的情况下,所述第一图像中所述动态对象的动作为与所述活动状态信息匹配的动作;

9.一种图像处理装置,其特征在于,包括:

10.根据权利要求9所述的装置,其特征在于,所述处理模块,还用于在所述接收模块接收到用户对第二图像中的第一对象的第一输入的情况下,抠取所述第一对象的对象区域的图像,得到第一对象图像;

11.根据权利要求9或10所述的装置,其特征在于,所述处理模块,还用于识别第二图像中的所有对象,所述第二图像包括至少两个对象;

12.根据权利要求9所述的装置,其特征在于,所述装置还包括:

13.根据权利要求12所述的装置,其特征在于,所述处理模块具体用于更新以下至少一项:

14.根据权利要求11所述的装置,其特征在于,所述图像编辑界面还包括背景图像设置控件;

15.根据权利要求9至14中任一项所述的装置,其特征在于,所述处理模块,还用于将所述提示词和所述至少一张对象图像输入所述图像处理模型;

16.根据权利要求15所述的装置,其特征在于,在所述对象包括动态对象,所述语义信息包括所述动态对象的活动状态信息的情况下,所述第一图像中所述动态对象的动作为与所述活动状态信息匹配的动作;

17.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至8任一项所述的图像处理方法的步骤。

技术总结本申请公开了一种图像处理方法、装置和电子设备,属于图像处理技术领域。图像处理方法包括:接收用户输入的提示词;将提示词和至少一张对象图像输入图像处理模型,输出第一图像;其中,至少一张对象图像为预先从至少一张图像中抠取的至少一个对象的对象区域的图像,第一图像包括至少一张对象图像中的对象。技术研发人员:孙运东受保护的技术使用者:维沃移动通信有限公司技术研发日:技术公布日:2024/7/25

本文地址:https://www.jishuxx.com/zhuanli/20240730/193905.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。