一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于异质图注意力网络的文档级关系抽取方法

2022-06-22 23:00:35 来源:中国专利 TAG:

技术特征:
1.一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:它包括以下步骤:s1、获取文档文本;s2、建立文档级关系抽取模型,将s1中获取的文档文本输入文档级关系抽取模型内进行训练,输出所述文档文本的关系,得到训练好的文档级关系抽取模型;s3、将待抽取文档级关系的文档文本输入s2中训练好的文档级关系抽取模型内,得到对应的文档文本的关系。2.根据权利要求1中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:所述s2中建立的文档级关系抽取模型依次包括向量表示层、上下文表示层、图表示层、分类层。3.根据权利要求2中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:所述s2中建立文档级关系抽取模型,将s1中获取的文档文本输入文档级关系抽取模型内进行训练,输出所述文档文本的关系,得到训练好的文档级关系抽取模型,具体过程为:s21、将s1中获取的文档文本输入文档级关系抽取模型的向量表示层内,输出对应的文档文本编码表示;s22、将s21中得到的文档文本编码表示输入文档级关系抽取模型的上下文表示层内,输出文档文本的上下文表示;s23、将s1中获取的文本文档输入文档级关系抽取模型的图表示层内构建对应的文档图,所述文档图包含多个节点,根据s22中得到的文档文本的上下文表示分别对文档图中的多个节点进行编码表示,将编码表示后的多个节点输入异质图注意力网络内,得到实体节点的编码表示;s24、将s23中得到的实体节点的编码表示输入文档级关系抽取模型的分类层内,输出所述文档文本的关系,得到训练好的文档级关系抽取模型。4.根据权利要求3中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:所述s22中上下文表示层采用bert编码器进行上下文表示。5.根据权利要求4中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:所述s23中将s1中获取的文本文档输入图表示层内构建对应的文档图,所述文档图包含多个节点,根据s22中得到的文档文本的上下文表示分别对文档图中的多个节点进行编码表示,利用异质图注意力网络对编码表示后的多个节点进行处理,得到实体节点的编码表示,具体过程为:s231、将s1中获取的文本文档输入文档级关系抽取模型的图表示层内构建对应的文档图,所述文档图包含句子节点、提及节点和实体节点;s232、根据s22中得到的文档文本的上下文表示分别对文档图中的句子节点、提及节点和实体节点进行编码表示;s233、将s232中编码表示后的多个节点输入异质图注意力网络内,得到实体节点的编码表示。6.根据权利要求5中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:所述s232中根据s22中得到的文档文本的上下文表示分别对文档图中的句子节点、提及节点和实体节点进行编码表示,具体过程为:
提及节点其中,表示第a个提及节点的编码表示;x
i
表示文档文本中的第i个单词;m
a
表示第a个提及节点;h
i
表示文档文本中第i个单词的上下文表示;实体节点其中,表示第b个实体节点的编码表示;e
b
表示第b个实体节点;句子节点其中,表示第c个实体节点的编码表示;s
c
第c个句子节点。7.根据权利要求6中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:所述s233中将s232中编码表示后的多个节点输入异质图注意力网络内,得到实体节点的编码表示,具体过程为:s2331、基于启发式规则对s232中编码表示后的多个节点构建多种类别的无向边;s2332、将s2331中构建的无向边输入异质图注意力网络内,得到实体节点的编码表示。8.根据权利要求7中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:所述s2331中构建的无向边的类别为七种。9.根据权利要求8中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:七种无向边分别包括:第一提及边:在一个句子中的两个不同实体的提及之间建立一个边;第二提及边:若一个句子中两个提及节点表示同一实体,则在所述两个提及节点之间建立一条边;第一提及实体边:若一个句子中包含多个实体,则在其中一个实体与其他实体的提及之间建立一个边;第二提及实体边:若句子一中包含实体,句子二中包含所述实体的提及,则在实体和提及之间建立一条边;提及句子边:若一个句子中包含一个提及,则在提及和句子之间建立一条边;实体句子边:若句子一中包含实体,句子二中至少包含所述实体的一个提及,则在实体和句子二之间建立一条边;句子边:若有四个句子,则在每两个句子之间建立一条边。10.根据权利要求9中所述的一种基于异质图注意力网络的文档级关系抽取方法,其特征在于:所述异质图注意力网络依次包括节点级注意力层、第一类型级注意力层、第二类型级注意力层。

技术总结
一种基于异质图注意力网络的文档级关系抽取方法,具体涉及一种基于异质图注意力网络的文档级实体关系的抽取方法,本发明为了解决现有的图神经网络在获取节点表示时忽略了图中节点和边,导致关系抽取的准确率低的问题,它包括以下步骤:S1、获取文档文本;S2、建立文档级关系抽取模型,将S1中获取的文档文本输入文档级关系抽取模型内进行训练,输出所述文档文本的关系,得到训练好的文档级关系抽取模型;S3、将待抽取文档级关系的文档文本输入S2中训练好的文档级关系抽取模型内,得到对应的文档文本的关系。属于计算机技术领域。文档文本的关系。属于计算机技术领域。文档文本的关系。属于计算机技术领域。


技术研发人员:王念滨 陈田田 张政超 何鸣 周连科 王勇 王红滨 孙彧
受保护的技术使用者:哈尔滨工程大学
技术研发日:2022.04.13
技术公布日:2022/6/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献