技术新讯 > 计算推算,计数设备的制造及其应用技术 > 图片内容自动结构化提取方法、装置及电子设备与流程  >  正文

图片内容自动结构化提取方法、装置及电子设备与流程

  • 国知局
  • 2024-07-31 23:13:55

本申请属于图像数据处理,具体涉及一种图片内容自动结构化提取方法、装置及电子设备。

背景技术:

1、在数字化转型的浪潮中,图像数据的爆炸性增长对自动化图像处理技术提出了更高的要求。

2、传统的图像内容结构化的处理方法,如ocr+bert模型,通常依赖于大量的标注数据,这不仅效率低下,增加更多的人力成本。此外,这些方法在处理跨领域任务时,泛化能力和可扩展性往往表现较差。

技术实现思路

1、本申请的目的是提供一种图片内容自动结构化提取方法、装置及电子设备以提高图像内容结构化处理效率,并增强泛化能力和可扩展性。

2、根据本申请实施例的第一方面,提供了一种图片内容自动结构化提取方法,该方法可以包括:

3、获取目标图片;

4、对目标图片进行ocr处理,得到目标图片中的文字信息;

5、对文字信息进行标准化处理,得到标准化文字信息;

6、识别标准化文字信息的信息领域;

7、根据信息领域确定提示词,并利用提示词引导信息结构化抽取模型从标准化文字信息中提取结构化信息。

8、在本申请的一些可选实施例中,获取目标图片,包括:

9、检测传输网络的网络带宽;

10、根据网络带宽调整目标图片的图像质量;

11、通过传输网络获取目标图片。

12、在本申请的一些可选实施例中,对目标图片进行ocr处理,得到目标图片中的文字信息,包括:

13、对目标图片进行去噪处理、对比度调整处理及二值化处理,得到待识别图片;

14、利用训练好的文字识别模型识别待识别图片,得到目标图片中的文字信息,文字识别模型是通过迁移学习训练得到。

15、在本申请的一些可选实施例中,对文字信息进行标准化处理,得到标准化文字信息,包括:

16、去除文字信息中的无用符号;

17、纠正文字信息中的错误信息;

18、统一文字信息中的标点格式。

19、在本申请的一些可选实施例中,提示词是通过下述方法提取的:

20、确定文本信息的信息领域;

21、根据信息领域,并利用关键词提取模型从文本信息中提取关键信息,得到提示词。

22、在本申请的一些可选实施例中,在根据信息领域,并利用关键词提取模型从文本信息中提取关键信息,得到提示词之后,还包括:

23、利用提示词引导信息结构化抽取模型从标准化文字信息中提取结构化信息;

24、利用结构化信息反馈调整关键信息。

25、在本申请的一些可选实施例中,结构化抽取模型是chatglm-6b模型通过训练和lora微调得到的。

26、根据本申请实施例的第二方面,提供一种图片内容自动结构化提取装置,该装置可以包括:

27、获取模块,用于获取目标图片;

28、ocr处理模块,用于对目标图片进行ocr处理,得到目标图片中的文字信息;

29、文本处理模块,用于对文字信息进行标准化处理,得到标准化文字信息;

30、提示词设计模块,用于识别标准化文字信息的信息领域;

31、大模型抽取模块,用于根据信息领域确定提示词,并利用提示词引导信息结构化抽取模型从标准化文字信息中提取结构化信息。

32、根据本申请实施例的第三方面,提供一种电子设备,该电子设备可以包括:

33、处理器;

34、用于存储处理器可执行指令的存储器;

35、其中,处理器被配置为执行指令,以实现如第一方面的任一项实施例中所示的图片内容自动结构化提取方法。

36、根据本申请实施例的第四方面,提供一种存储介质,当存储介质中的指令由信息处理装置或者服务器的处理器执行时,以使信息处理装置或者服务器实现如第一方面的任一项实施例中所示的图片内容自动结构化提取方法。

37、本申请的上述技术方案具有如下有益的技术效果:

38、本申请实施例方法通过利用提示词引导信息结构化抽取模型从标准化文字信息中提取结构化信息。可以减少对大量标注数据的依赖,意味着可以减少人工标注的成本和时间,从而降低整体项目成本,加快模型开发和部署的速度。此外,提示词可以增强模型的泛化能力,使其不仅在特定领域内表现良好,也能够适应新的或跨领域的任务,从而提高模型的适用性和灵活性。

技术特征:

1.一种图片内容自动结构化提取方法,其特征在于,包括:

2.根据权利要求1所述的图片内容自动结构化提取方法,其特征在于,所述获取目标图片,包括:

3.根据权利要求1所述的图片内容自动结构化提取方法,其特征在于,所述对所述目标图片进行ocr处理,得到所述目标图片中的文字信息,包括:

4.根据权利要求1所述的图片内容自动结构化提取方法,其特征在于,所述对所述文字信息进行标准化处理,得到标准化文字信息,包括:

5.根据权利要求1所述的图片内容自动结构化提取方法,其特征在于,所述提示词是通过下述方法提取的:

6.根据权利要求5所述的图片内容自动结构化提取方法,其特征在于,在根据所述信息领域,并利用关键词提取模型从所述文本信息中提取关键信息,得到所述提示词步骤之后,还包括:

7.根据权利要求1所述的图片内容自动结构化提取方法,其特征在于,所述结构化抽取模型是chatglm-6b模型通过训练和lora微调得到的。

8.一种图片内容自动结构化提取装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7任一项所述的图片内容自动结构化提取方法的步骤。

10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7任一项所述的图片内容自动结构化提取方法的步骤。

技术总结本申请公开了一种图片内容自动结构化提取方法、装置及电子设备,属于图像数据处理领域,其中,图片内容自动结构化提取方法包括:获取目标图片;对目标图片进行OCR处理,得到目标图片中的文字信息;对文字信息进行标准化处理,得到标准化文字信息;识别标准化文字信息的信息领域;根据信息领域确定提示词,并利用提示词引导信息结构化抽取模型从标准化文字信息中提取结构化信息。通过提示词可以减少对大量标注数据的依赖,意味着可以减少人工标注的成本和时间,从而降低整体项目成本,加快模型开发和部署的速度。此外,提示词可以增强模型的泛化能力,使其不仅在特定领域内表现良好,也能够适应新的或跨领域的任务,从而提高模型的适用性和灵活性。技术研发人员:田永谦受保护的技术使用者:艾莎医学科技(潍坊)有限公司技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/196551.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。