一种基于对比学习框架的多视图异构图神经网络模型
- 国知局
- 2024-10-21 14:19:39
本发明涉及对异构图中节点嵌入表示学习,尤其是在异构图中使用多视图和元路径进行图增强方法。
背景技术:
1、图表示学习是一个活跃的研究学科,主要对图中的信息进行有效的利用并进行学习,将得到的嵌入表示用于下游任务中,在现有的研究中已经存在很多方法,但是只是利用元路径对图中节点进行实例化,将得到的实例化节点进行编码聚合操作。目前对庞大的异构图结构的一个有效的策略是使用元路径对异构图进行一阶和高阶邻居的探索,能够更深层次的挖掘到节点信息。然而,在复杂的异构图中往往出现图结构稀疏以及节点特征存在噪声特点,在训练后的节点嵌入表示存在较大误差以及过平滑现象。本发明中的一种基于对比学习框架的多视图异构图神经网络模型通过对元路径内外节点以及不同视图间进行对比学习增强节点特征,而不是重新实施现有的发现方法,提高了节点嵌入表示的准确率。
技术实现思路
1、本发明的第一目的在于克服现有技术的缺点与不足,提供了一种基于对比学习框架的多视图异构图神经网络模型,突破传统的异构图表示学习方法,能处理图结构稀疏,节点特征存在噪声以及现有模型训练后得到的节点特征出现过平滑的问题,提高节点的嵌入表示的准确性。
2、本发明的第二目的通过下述技术方案实现:一种基于对比学习框架的多视图异构图神经网络模型,包括以下步骤:
3、1)在异构图中,对图中的节点进行初始化,使用多条元路径对中心节点进行一阶邻居和高阶邻居信息探索;
4、2)根据步骤1)获取中心节点在不同元路径上的邻居,分别对中心节点进行图卷积聚合;
5、3)根据步骤2)获得中心节点在某一条元路径上的嵌入表示,采用基于元路径内的对比学习,增强中心节点嵌入表示。其中正样例为元路径内部节点,负样例为节点之外的节点;
6、4)根据步骤2)获得的中心节点在不同元路径上的特征表示,采用基于元路径间的对比学习,再次增强中心节点的特征表示。其中正样本为中心节点在不同元路径上的嵌入表示,负样本为节点之外的节点嵌入;
7、5)根据步骤2)获得的中心节点在不同元路径上的嵌入表示,使用图注意力网络对不同的嵌入表示进行聚合;
8、6)在原异构图中使用图注意力神经网络对中心节点进行聚合;
9、7)根据步骤5)和步骤6)得到的中心节点嵌入表示,进行跨视图间的对比学习,其中正样例为中心节点的不同嵌入表示,负样例为其他的节点,其中负样例采用的嵌入是通过元路径间的聚合得到的;
10、8)根据步骤5)和步骤6)对中心节点的嵌入表示进行相加操作得到中心节点的最终嵌入表示,并利用设计好的损失函数进行反向传播优化提出的模型,该嵌入表示可以应用与常见的下游任务中。
11、在步骤1)中,所述的异构图是由不同类型的节点和边组成。所述的元路径是连接不同或相同节点类型的有有序符合关系序列。所述的一阶邻居和高阶邻居分别指与中心节点直接相联系的节点和与中心节点间接联系的节点。
12、a、异构图节点特征初始化的计算公式如下:
13、
14、其中表示节点 i的类型,表示映射矩阵,表示节点 i的特征向量。
15、在步骤2)中对中心节点进行图卷积聚合的计算公式如下:
16、
17、其中,表示邻接矩阵,表示单位矩阵,为可训练的权重矩阵,表示节点特征,表示聚合的层数,其中,表示非线性激活函数。
18、在步骤3)中,所述的对比学习是指拉近正样本之间的嵌入表示距离,推远与负样本之间的嵌入表示距离。根据步骤2)得到每一条元路径内节点的嵌入表示,,其中表示第一条元路径,表示元路径游走的长度。将同一条元路径实例后得到的序列作为正样本,其他节点作为负样本。
19、a、在元路径内的对比学习计算如下:
20、
21、其中表示目标节点,表示目标节点在某一条元路径下的特征,表示在该元路径下的正样本对,表示超参数。
22、在步骤4)中,根据步骤2)得到的中心节点在不同元路径上嵌入表示,其中表示含有中心节点 i的所有元路径集合,其中作为正样例,其他节点作为负样例。
23、a、为增强节点的嵌入表示,进行元路径间对比学习计算方式如下:
24、
25、其中表示节点 u和节点 v向量之间的余弦相似度, 表示节点在不同元路径下的特征集合。
26、在步骤5)中,所述的图注意力网络对同一节点不同元路径上的嵌入表示进行聚合,如下所示。
27、a、计算同一节点在不同元路径的嵌入表示之间的相似度如下:
28、
29、为权重矩阵进行线性转换。将目标节点在第条元路径上嵌入表示与第 j条元路径上的嵌入表示进行线性转换并进行拼接,经过计算得到影响系数。
30、为了使区别不同元路径的影响,使用进行数据归一化如下所示
31、
32、c、计算节点的嵌入表示如下所示:
33、
34、其中表示节点在元路径 i和 j之间的注意力系数,表示节点在元路径 j下的嵌入表示。
35、在步骤6)中,在原异构图中对节点进行图注意力聚合方式如下:
36、
37、为权重矩阵进行线性转换。将节点与节点进行线性转换并进行拼接,经过计算得到影响系数。为了使区别不同节点的影响,使用进行数据归一化如下所示:
38、
39、
40、在于步骤7): 所述跨视图为基于元路径聚合的语义视图和结构视图。
41、a、为增强节点的嵌入表示,进行跨视图间的对比学习,计算方式如下:
42、
43、其中表示节点 u和节点 v向量之间的余弦相似度, 表示节点 i在元路径下的特征。
44、b、利用设计好的损失函数进行反向传播优化提出的模型
45、
46、其中表示所有节点的聚合。利用反向传播优化提出的模型。最后利用训练后的节点特征来执行下游任务。
47、本发明与现有技术相比,具有如下优点与有益效果:
48、1、本发明首次实现了在元路径内,元路径间以及不同视图间进行对比学习增强了节点嵌入表示,提高了节点嵌入表示,有效的解决了异构图稀疏,节点特征存在噪声的问题;
49、2、本发明可以结合大数据领域,部署在分布式系统上,能更高效地处理大规模的异构图,并得到高效的节点嵌入表示;
50、3、本发明方法在图节点嵌入表示方面具有广泛的使用空间,实用性强,在推荐系统,链接预测,节点分类有广阔前景。
本文地址:https://www.jishuxx.com/zhuanli/20241021/317735.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表