技术新讯 > 计算推算,计数设备的制造及其应用技术 > 信息处理方法、装置、电子设备及存储介质与流程  >  正文

信息处理方法、装置、电子设备及存储介质与流程

  • 国知局
  • 2024-10-15 09:33:36

本公开涉及计算机,具体涉及自然语言处理、深度学习等人工智能,尤其涉及一种信息处理方法、装置和电子设备及存储介质。

背景技术:

1、当前在基于答题卡的阅卷系统中,只能自动化的识别选择类的客观题,对于主观题和填空类型的客观题目无法实现自动化的识别过程,例如初高中的生物、地理、化学科目中存在大量的填空题目,只能依靠对应科目的老师进行阅卷,比较耗费人力。

技术实现思路

1、本公开提供了一种用于信息处理方法、装置、电子设备及存储介质。

2、根据本公开的第一方面,提供了一种信息处理方法,包括:对目标文档进行信息类型的识别,获取第一类信息集合和第二类信息集合,其中,所述第一信息集合包括对应有标准参考信息的第一类信息,所述第二类信息集合包括未对应有标准参考信息的第二类信息;基于所述目标文档的标准参考信息集,对所述第一类信息进行信息匹配;基于预训练的目标大语言模型,对所述第二类信息进行信息匹配;基于所述第一类信息的匹配结果和所述第二类信息的匹配结果,确定所述目标文档的目标匹配结果。

3、根据本公开的第二方面,提供了一种信息处理装置,包括:识别模块,用于对目标文档进行信息类型的识别,获取第一类信息集合和第二类信息集合,其中,所述第一信息集合包括对应有标准参考信息的第一类信息,所述第二类信息集合包括未对应有标准参考信息的第二类信息;确定模块,用于基于所述目标文档的标准参考信息集,对所述第一类信息进行信息匹配;匹配模块,用于基于预训练的目标大语言模型,对所述第二类信息进行匹配,得到所述第二类信息的匹配结果;打分模块,用于基于所述第一类信息的匹配结果和所述第二类信息的匹配结果,确定所述目标文档的目标匹配结果。

4、根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述一方面实施例所述的信息处理方法。

5、根据本公开第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其上存储有计算机程序/指令,所述计算机指令用于使所述计算机执行上述一方面实施例所述的信息处理方法。

6、根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现上述一方面实施例所述的信息处理方法。

7、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

8、通过对目标文档进行信息类型的识别,分别采用标准参考信息集对有标准参考信息的第一类信息进行信息匹配,以及采用目标大语言模型对未对应有标准参考信息的第二类信息进行信息匹配,提升信息匹配的准确率和效率,同时通过目标大语言模型对未有标准参考信息的第二类信息进行信息匹配,可以降低主观因素对信息匹配结果的影响。

技术特征:

1.一种信息处理方法,其中,所述方法包括:

2.根据权利要求1所述的方法,其中,所述基于预训练的目标大语言模型,对所述第二类信息进行信息匹配,包括:

3.根据权利要求2所述的方法,其中,所述由所述目标大语言模型对所述第二类信息的答复信息进行匹配,得到所述第二类信息的匹配结果,包括:

4.根据权利要求2所述的方法,其中,所述目标大语言模型的训练过程,包括:

5.根据权利要求4所述的方法,其中,所述基于不同信息类型的样本信息集,对初始的大语言模型进行训练,得到所述目标大语言模型,包括:

6.根据权利要求5所述的方法,其中,所述在所述模型训练节点上根据所述信息类型的样本信息集,对初始的大语言模型进行训练,得到所述目标大语言模型,包括:

7.根据权利要求4所述的方法,其中,所述根据所述信息类型对应的从所述历史文档中提取的第二类信息,确定所述信息类型的样本信息集,包括:

8.根据权利要求6或7所述的方法,其中,所述信息类型为开放型填空类,所述样本信息集中包括所述开放型填空类的第一样本信息,所述方法还包括:

9.根据权利要求6或7所述的方法,其中,所述信息类型为逻辑推理类,所述样本信息集中包括所述逻辑推理类的第二样本信息,所述方法还包括:

10.根据权利要求6或7所述的方法,其中,所述信息类型为主观类,所述样本信息集中包括所述主观类的第三样本信息,所述方法还包括:

11.根据权利要求4所述的方法,其中,所述基于不同信息类型的样本信息集,对初始的大语言模型进行训练,得到所述目标大语言模型之后,还包括:

12.根据权利要求4所述的方法,其中,所述基于不同信息类型的样本信息集,对初始的大语言模型进行训练,得到所述目标大语言模型之后,还包括:

13.根据权利要求4所述的方法,其中,所述方法还包括:

14.根据权利要求1所述的方法,其中,所述基于所述目标文档的标准参考信息集,对所述第一类信息进行信息匹配,包括:

15.一种信息处理装置,包括:

16.一种电子设备,包括:

17.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-14中任一项所述的信息处理方法。

18.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-14中任一项所述的信息处理方法。

技术总结本公开提供了一种信息处理方法、装置、电子设备及存储介质,包括:对目标文档进行识别,获取第一类信息集合和第二类信息集合;基于目标文档的标准参考信息集,对第一类信息进行信息匹配;基于目标大语言模型,对第二类信息进行信息匹配;基于第一类信息的匹配结果和第二类信息的匹配结果,确定目标文档的目标匹配结果。通过对对目标文档进行信息类型的识别,分别采用标准参考信息集对有标准参考信息的第一类信息进行信息匹配,以及采用目标大语言模型对未对应有标准参考信息的第二类信息进行信息匹配,提升信息匹配的准确率和效率,同时通过目标大语言模型对未有标准参考信息的第二类信息进行信息匹配,可以降低主观因素对信息匹配结果的影响。技术研发人员:肖超超受保护的技术使用者:北京百度网讯科技有限公司技术研发日:技术公布日:2024/10/10

本文地址:https://www.jishuxx.com/zhuanli/20241015/314574.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。