技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种关系交叉融合注意力辅助网络优化的医疗知识图谱问答方法及系统  >  正文

一种关系交叉融合注意力辅助网络优化的医疗知识图谱问答方法及系统

  • 国知局
  • 2024-08-22 14:19:17

本发明涉及自然语言处理,具体涉及一种关系交叉融合注意力辅助网络优化的医疗知识图谱问答方法及系统。

背景技术:

1、目前互联网上的电子病历、网上问诊、医疗科普网站等已经积累了海量的电子医疗数据,而知识图谱相关技术的成熟与广泛应用,为问答系统的精准化构建起到了关键作用。知识图谱具有对海量知识独特表示与管理优势,为推荐、智能问答等多种下游知识感知工程任务提供了高品质的结构化知识。

2、知识图谱问答系统可以帮助用户精准的从知识图谱中检索所需知识,并且该系统以自然语言作为输入输出,对各类用户均具有友好性。现有的知识图谱问答系统已经能够准确直接地回答简单问题,满足人们日常生活中的一些简单要求,但用户咨询问题时更倾向于在复杂问题中表达具体的信息,现有方法主要依赖于问题表示进行关系推理,但无法准确得到具体的关系分布,在处理这类复杂问句上仍表现不佳。近年来,众多研究人员一直在寻找合适的方法来提高系统性能。

技术实现思路

1、本发明的目的在于,提出一种可解释性的辅助框架,其充分利用关系嵌入和问题语义,通过交叉融合两者的相关信息来辅助获得每一跳的关系分布。

2、根据本公开实施例的第一个方面,提供了一种关系交叉融合注意力辅助网络优化的医疗知识图谱问答方法,包括以下步骤:

3、采用预训练的bert模型得到问题的[cls]令牌hcls和隐藏状态hq,其中和n表示问题的长度,dbert表示bert的维数;基于问题的[cls]令牌hcls和隐藏状态hq得到注意词特征

4、通过多头自注意机制构建gcn网络中的语义图:将问题的隐藏状态hq作为多头自注意机制输入,初始化语义图adj;使用初始化语义图adj和注意词特征作为gcn网络的输入,得到句子的语义特征

5、采用预训练的bert模型得到语义关系特征hr:在每一跳,将语义关系特征hr作为输入,并通过线性层捕获特定的关系嵌入rt,同理通过线性层捕获上一步得到的问题语义ht;将问题语义ht和关系嵌入rt使用交叉融合关注机制获得交叉融合注意特征attnt,通过此特征更新融合关系嵌入

6、利用卷积神经网络捕获融合关系嵌入中准确的关系特征并且通过语义特征和关系特征得到辅助信息

7、基于注意词特征和辅助信息获得关系分布pt;

8、通过关系分布pt在知识图谱上逐跳推理,收集关系谓词概率:

9、利用关系谓词概率模拟“跨边跳跃”,得到实体分布构成的列表e_list;

10、基于实体分布构成的列表e_list和[cls]令牌hcls的整体线性表示h作为权重得到每个问题的跳跃概率a,选择最佳跳跃的实体分布作为问题的答案。

11、进一步地,利用线性层获得[cls]令牌hcls线性表示在每一跳,利用当前线性表示和最后一个隐藏状态hq得到包含关系信息的单词注意矩阵其中t为当前跳数;使用单词注意矩阵得到相关的注意词特征具体表示为:

12、

13、

14、。

15、进一步地,句子的语义特征表示为:

16、

17、

18、

19、其中,k为多头自注意机制中头的数量,dhead是多头自注意机制中头的维数,wq和是可训练参数。

20、进一步地,更新融合关系嵌入表示为:

21、rt=linear[t](hr),ht=linear[t](hq)

22、attnt=linear((rt*wq)*(ht*wk)t)

23、

24、式中,t为当前跳数,t为转置符号,wq,wk和wv是可训练的权重矩阵。

25、进一步地,所述辅助信息表示为:

26、

27、。

28、更进一步地,关系分布pt表示为:

29、

30、式中为第t跳的关系分布,nrel表示知识图中关系的总数。

31、更进一步地,收集关系谓词概率时,首先获取每一跳的关系得分,如果谓词不互斥,则用sigmoid函数替换softmax函数同时激活多个谓词,设b表示一对实体之间关系的最大个数,是知识图谱中关系谓词的集合,则关系谓词概率为:

32、

33、式中

34、更进一步地,利用关系谓词概率模拟“跨边跳跃”,得到实体分布方式为:

35、et=et-1wt.

36、式中et是第t跳的实体分布,et-1是上一跳的实体分布,表示每一跳的实体概率,其中初始实体e0为1。

37、更进一步地,基于实体分布构成的列表e_list和[cls]令牌hcls的整体线性表示h作为权重得到每个问题的跳跃概率a,方式为:

38、e_list=[e1;...;et+1],

39、h=linear(hcls),

40、

41、式中t表示当前跳数,t为步长,限定了多跳问答中的最大跳数。

42、根据本公开实施例的第二个方面,提供了一种关系交叉融合注意力辅助网络优化的医疗知识图谱问答系统,包括:

43、注意词特征获取模块,采用预训练的bert模型得到问题的[cls]令牌hcls和隐藏状态hq,其中和n表示问题的长度,dbert表示bert的维数;基于问题的[cls]令牌hcls和隐藏状态hq得到注意词特征

44、语义特征获取模块,通过多头自注意机制构建gcn网络中的语义图:将问题的隐藏状态hq作为多头自注意机制输入,初始化语义图adj;使用初始化语义图adj和注意词特征作为gcn网络的输入,得到句子的语义特征

45、更新模块,采用预训练的bert模型得到语义关系特征hr:在每一跳,将语义关系特征hr作为输入,并通过线性层捕获特定的关系嵌入rt,同理通过线性层捕获上一步得到的问题语义ht;将问题语义ht和关系嵌入rt使用交叉融合关注机制获得交叉融合注意特征attnt,通过此特征更新融合关系嵌入

46、辅助信息获取模块,利用卷积神经网络捕获融合关系嵌入中准确的关系特征并且通过语义特征和关系特征得到辅助信息

47、关系分布获取模块,基于注意词特征和辅助信息获得关系分布pt;

48、关系谓词概率获取模块,通过关系分布pt在知识图谱上逐跳推理,收集关系谓词概率:

49、列表获取模块,利用关系谓词概率模拟“跨边跳跃”,得到实体分布构成的列表e_list;

50、答案获取模块,基于实体分布构成的列表e_list和[cls]令牌hcls的整体线性表示h作为权重得到每个问题的跳跃概率a,选择最佳跳跃的实体分布作为问题的答案。

51、根据本公开实施例的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种关系交叉融合注意力辅助网络优化的医疗知识图谱问答方法。

52、根据本公开实施例的第四个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种关系交叉融合注意力辅助网络优化的医疗知识图谱问答方法。

53、本发明采用的以上技术方案,与现有技术相比,具有的优点是:1)准确性。可以利用问题表示和关系嵌入的交互信息来帮助计算每一跳的准确关系分布。2)有效性。优于之前模型,在两个广泛使用的复杂问答数据集上提高了多跳问答准确率。3)透明度。与transfernet相似,是完全基于注意力的,因此它的中间步骤很容易被人类可视化和理解。

本文地址:https://www.jishuxx.com/zhuanli/20240822/278112.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。