一种基于图神经架构搜索的知识图谱关系预测方法
- 国知局
- 2024-07-31 23:13:05
本申请涉及智能方法和图计算,具体涉及一种基于图神经架构搜索的知识图谱关系预测方法。
背景技术:
1、面对现实世界中错综复杂的关系和互动,图网络成为一种强大的建模工具,用于将这些复杂性呈现得清晰有序。在图网络模型中,现实实体被抽象成节点,实体之间的联系则以边的形式表示。这种方法在理解和分析各种现实世界系统的结构和动态方面发挥着重要作用。
2、链接预测是图网络研究中的焦点之一,其目的在于预测网络中节点间可能存在的连边。该项技术在现实世界具有广泛的应用场景,例如社交网络中不同用户间具有复杂多变的关系和交互方式,利用链接预测技术,可以分析社交网络的数据特征和传播规律,预测出用户间潜在的通讯交互。又例如,生物医学领域中不同药物之间具有不同的相互作用,利用药物相互作用的典型场景是联合治疗,通过联合用药,不同药物之间可能具有协同作用,增强治疗效果,但同时也存在药物间不良反应的风险,利用图网络的链接预测技术预测药物间的相互作用可避免传统实验测试耗钱耗时的问题,极大加快药物相互作用的发现研究。
3、目前已经有一些方法使用图神经网络架构搜索来发现最优架构用于预测图网络中可能存在的链路。其中有些集中于设计gnn中的聚合层,如graphnas,auto-gnn,autogm等,这些方法中设计了多个gnn的微观维度,如聚合函数,注意力函数,注意力头数,嵌入大小等;有些去设计gnn的深度,如gnas、deep-gnas和policy-gnn;有些还对gnn的层跳连接操作进行了设计,如sane,snag,autograph和f2gnn。
4、然而,现有方法仍然存在局限性,包括:从提取传播范围的角度来看,现有方法通常假设不同查询的传播范围是相同的,即使用一个固定的超参数k来为每个查询获得一个k跳的封闭子图。但在实际应用中,不同的节点对偏好不同大小的传播范围,且不同的传播范围对预测性能的影响很大。因此,传播范围选择过程应该是特定于节点对的;另外,现有方法一般仅使用固定的传播函数来处理不同的数据集(图网络),不利于处理各种图网络上复杂的交互模式以及捕捉图网络自身特有的数据特征。因此,为链接预测设计特定于图网络的传播函数也至关重要。
5、然而解决以上问题及缺陷,若采用基于梯度的方法训练整个超网需要为传播范围和传播函数的搜索空间提供巨大的gpu内存,并且存在不稳定性;若显式地对实体对的候选传播范围进行采样的计算和时间,则成本非常高。
技术实现思路
1、针对现有技术存在的上述不足,本发明的目的在于提供一种基于图神经架构搜索的知识图谱关系预测方法。
2、为实现以上目的,本发明采用如下技术方案:
3、一种基于图神经架构搜索的知识图谱关系预测方法,包括以下步骤:
4、s1:判断当前图网络g=(v,e)是否已确定最优网络架构,若已确定,则执行步骤s7;否则执行步骤s2;
5、s2:对超网中的权重参数进行初始化;
6、s3:均匀采样路径进行超网权重训练:使用随机均匀采样策略选取单一架构进行超网权重训练,直至超网收敛;
7、s4:对超网中传播函数的消息计算模块进行拆分,从而将超网拆分为多个子超网;
8、s5:多个子超网分别继承父超网的权重,并在此基础上以s3相同的方法对子超网分别进行权重训练;
9、s6:在多个子超网权重训练之后,通过随机采样单路径架构进行搜索确定最优网络架构,包括传播范围选择与传播函数架构;
10、s7:后续步骤将利用确定的最优网络架构进行链接预测,首先初始化图网络g=(v,e)的权重参数;
11、s8:依据图神经架构搜索获得的最优网络架构确定传播范围和传播函数架构;
12、s9:基于确定的关系预测模型架构前向传播计算传播范围的嵌入表示;
13、s10:利用mlp作为分类器进行预测,从而实现图网络的链接预测任务。
14、优选的,所述s2中的所述超网的框架包含两个可搜索部分,即传播范围和传播函数。
15、优选的,定义传播范围选择器h(f(su,v))如下:
16、
17、其中是具有最大传播范围η的传播范围搜索空间,是节点对(u,v)的可选传播范围,i,j,i′,j′表示节点的邻域大小,f(·)是用于编码具有不同传播范围的子图的传播函数,g(·)是用于对表征进行评分的函数,它可以由多个线性层实现,gi,j=-log(-log(ui,j))是gumbel随机变量,ui,j是一个均匀随机变量,τ表示softmax函数的温度参数。
18、优选的,所述传播函数fw,α的统一形式如下:
19、
20、
21、
22、其中和是特定关系变换矩阵,λ(r)表示关系r的类型,包括出边和入边两种类型,self表示自环类型的边,表示一个可行的lmax层传播函数结构,和分别表示节点v在第l+1层的消息表示和节点隐藏表示,表示节点r在第l+1层的消息表示,表示节点u在第l层的节点隐藏表示,表示节点v在第l层的节点隐藏表示,表示边r在第l层的边隐藏表示。
23、优选的,所述s2中超网的搜索目标定义为:给定可选的传播函数结构和传播范围选择器,搜索的双层目标函数如下:
24、
25、
26、其中a表示所有可行传播函数的集合,dval和dtra分别表示验证集和训练集,θ和φ分别是传播函数和传播范围选择器的可学习参数,用于使所有节点交互上的分类损失函数l期望最小化,而性能度量m期望最大化。
27、优选的,用表示应用于gddi的传播函数产生的节点u的i层隐藏表示,则具体表示如下:
28、
29、优选的,所述s2中超网的权重参数即传播范围选择器的可学习参数φ和传播函数的可学习参数θ。
30、优选的,所述s4中对超网中传播函数的消息计算模块进行拆分包括:对应于消息计算模块中的一个操作产生一个子超网,从而将超网拆分为四个子超网。
31、优选的,所述s6中确定最优网络架构,包括:
32、在超网训练之后,问题可以简化为:
33、
34、
35、对于传播函数的搜索,采用随机松弛和自然策略梯度策略得到了最优的传播函数;
36、对于传播范围的选择,从预先搜索到的传播范围中选择嵌入表示具有最大得分的传播范围。
37、与现有技术相比,本发明具有以下有益效果:
38、本申请方法通过在选定的传播范围上执行选定的可行传播函数以获得传播范围的嵌入表示,之后将该嵌入表示输入mlp预测器进行节点对的关系预测;通过超网搜索确定特定于节点对的传播范围,以及特定于图网络的传播函数架构,使得信息在图网络中的传播更加准确和高效,从而提高图网络中节点关系预测的准确率。
技术特征:1.一种基于图神经架构搜索的知识图谱关系预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于图神经架构搜索的知识图谱关系预测方法,其特征在于,所述s2中的所述超网的框架包含两个可搜索部分,即传播范围和传播函数。
3.根据权利要求2所述的基于图神经架构搜索的知识图谱关系预测方法,其特征在于,定义传播范围选择器h(f(su,v))如下:
4.根据权利要求2所述的基于图神经架构搜索的知识图谱关系预测方法,其特征在于,所述传播函数fw,α的统一形式如下:
5.根据权利要求2所述的基于图神经架构搜索的知识图谱关系预测方法,其特征在于,所述s2中超网的搜索目标定义为:给定可选的传播函数结构和传播范围选择器,搜索的双层目标函数如下:
6.根据权利要求2所述的基于图神经架构搜索的知识图谱关系预测方法,其特征在于,用表示应用于gddi的传播函数产生的节点u的i层隐藏表示,则具体表示如下:
7.根据权利要求1所述的基于图神经架构搜索的知识图谱关系预测方法,其特征在于,所述s2中超网的权重参数即传播范围选择器的可学习参数φ和传播函数的可学习参数θ。
8.根据权利要求1所述的基于图神经架构搜索的知识图谱关系预测方法,其特征在于,所述s4中对超网中传播函数的消息计算模块进行拆分包括:对应于消息计算模块中的一个操作产生一个子超网,从而将超网拆分为四个子超网。
9.根据权利要求1所述的基于图神经架构搜索的知识图谱关系预测方法,其特征在于,所述s6中确定最优网络架构,包括:
技术总结本申请涉及智能方法和图计算技术领域,公开了一种基于图神经架构搜索的知识图谱关系预测方法,包括:判断是否确定图网络的最优预测网络架构;若没有,初始化超网权重,均匀采样路径进行超网训练,超网拆分为多个子超网,子超网分别进行权重训练,架构搜索确定最优网络架构;若有,初始化图网络权重,确定传播范围和函数架构,计算传播范围的嵌入表示,利用分类器预测节点关系。本申请方法使得信息在图网络中的传播更加准确和高效,从而提高图网络中节点关系预测的准确率。技术研发人员:王震,杜昊桐,刘洋,高超,李向华受保护的技术使用者:西北工业大学技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/196480.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。