信息提取方法、电子设备及计算机可读存储介质与流程
- 国知局
- 2024-11-21 12:15:57
本发明涉及自然语言处理,尤其涉及一种信息提取方法、电子设备及计算机可读存储介质。
背景技术:
1、随着社会的快速发展,事件信息量也在急剧增加。事件信息在舆情检测、文本摘要、自动摘要、事件抽取和事理图谱自动构建等领域有着重要应用。因此需要从大量的非结构化文本信息中提取关键的事件信息,方便社会快速了解事件本质。
2、传统的信息提取方法主要以预先标注的事件信息进行事件抽取,然而现实世界事件信息多样,预先标注的事件通常无法达到全覆盖,导致无法准确提取不存在于预先标注中的新事件。
技术实现思路
1、本申请主要解决的技术问题是提供一种信息提取方法、电子设备及计算机可读存储介质,能够提升信息提取的全面性。
2、为解决上述技术问题,本申请采用的一个技术方案是:提供了一种信息提取方法、电子设备及计算机可读存储介质,所述信息提取方法包括:获取待处理文本,所述待处理文本中包括目标事件;根据所述目标事件中的事件对象构造所述事件对象的信息样本库,所述信息样本库包括所述事件对象的至少一个对象描述信息;根据所述待处理文本和所述信息样本库中各对象描述信息对所述待处理文本进行信息提取处理,得到所述待处理文本中目标事件的事件信息。
3、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,包括存储器和处理器,所述存储器存储有程序指令,所述处理器从所述存储器调取所述程序指令以执行上述的信息提取方法。
4、为解决上述技术问题,本申请采用的另一个技术方案是:提供一种计算机可读存储介质包括储存有程序数据,所述程序数据被处理器执行时用于实现上述的信息提取方法。
5、上述方案,相较于传统主要以预先标注的事件信息进行信息提取,导致检测新增事件信息的泛化能力较差的问题,本申请提出了一种信息提取方法,该方法包括:获取待处理文本,待处理文本中包括目标事件;根据目标事件中的事件对象构造事件对象的信息样本库,信息样本库包括事件对象的至少一个对象描述信息;根据待处理文本和信息样本库中各对象描述信息对待处理文本进行信息提取处理,得到待处理文本中目标事件的事件信息。由此根据待处理文本中目标事件的事件对象构造信息样本库,不仅可以减少数据的预先标注量,而且在面对目标事件是预先未训练过的事件类型时,通过构造该目标事件对应的事件对象的信息样本库,以实现对未训练过的目标事件的事件信息提取,提高信息提取的准确性。
技术特征:1.一种信息提取方法,其特征在于,所述信息提取方法包括:
2.根据权利要求1所述的信息提取方法,其特征在于,所述对象描述信息包括事件类型信息,所述事件信息包括目标事件类型,所述根据所述待处理文本和所述信息样本库中各对象描述信息对所述待处理文本进行信息提取处理,得到所述待处理文本中目标事件的事件信息的步骤,包括:
3.根据权利要求1所述的信息提取方法,其特征在于,所述对象描述信息包括事件类型信息和事件元素信息,所述事件信息包括目标事件类型和目标事件元素,所述根据所述待处理文本和所述信息样本库中各对象描述信息对所述待处理文本进行信息提取处理,得到所述待处理文本中目标事件的事件信息的步骤,包括:
4.根据权利要求2-3任一项所述的信息提取方法,其特征在于,所述根据所述提示事件类型信息对所述待处理文本进行事件类型检测,得到所述待处理文本中目标事件的目标事件类型的步骤,包括:
5.根据权利要求2-3任一项所述的信息提取方法,其特征在于,所述根据所述提示事件类型信息对所述待处理文本进行事件类型检测,得到所述待处理文本中目标事件的目标事件类型的步骤,包括:
6.根据权利要求5所述的信息提取方法,其特征在于,所述事件类型信息包括预设事件类型,所述根据所述信息样本库中各事件类型信息对所述问答大模型输出的所述事件类型进行校验处理,得到所述待处理文本中目标事件的目标事件类型的步骤,包括:
7.根据权利要求3所述的信息提取方法,其特征在于,所述根据所述提示事件元素信息和所述目标事件类型对所述待处理文本进行事件元素检测,得到所述目标事件类型对应的目标事件元素的步骤,包括:
8.根据权利要求7所述的信息提取方法,其特征在于,所述事件元素信息包括预设事件元素,所述根据所述信息样本库中各事件元素信息对所述问答大模型输出的所述目标事件类型对应的事件元素进行校验处理,得到所述待处理文本的目标事件元素的步骤,包括:
9.一种电子设备,其特征在于,包括:存储器和处理器,其中,所述存储器存储有程序指令,所述处理器从所述存储器调取所述程序指令以执行如权利要求1-8任一项所述的信息提取方法。
10.一种计算机可读存储介质,其特征在于,包括:存储有程序数据,所述程序数据被处理器执行时用于实现如权利要求1-8任一项所述的信息提取方法。
技术总结本申请公开了一种信息提取方法、电子设备及计算机可读存储介质,该信息提取方法包括:获取待处理文本,待处理文本中包括目标事件;根据目标事件中的事件对象构造事件对象的信息样本库,信息样本库包括事件对象的至少一个对象描述信息;根据待处理文本和信息样本库中各对象描述信息对待处理文本进行信息提取处理,得到待处理文本中目标事件的事件信息。由此提高了信息提取的准确性。技术研发人员:秦龙,周玉鑫,钱佳佳,周建华受保护的技术使用者:浙江大华技术股份有限公司技术研发日:技术公布日:2024/11/18本文地址:https://www.jishuxx.com/zhuanli/20241120/335069.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表