分布外节点检测方法、装置、设备、计算机存储介质和程序产品
- 国知局
- 2024-11-21 12:01:15
本申请属于分布外节点检测领域,尤其涉及一种分布外节点检测方法、装置、设备、计算机存储介质和程序产品。
背景技术:
1、图数据广泛存在于生活中,例如。社交网络以及金融交易网络中存在图数据。对于某些安全至关重要的应用场景中,需要检测图数据中的节点是否为分布外节点。分布外节点指的是与图数据中大部分节点不一致的节点。
2、示例性技术中,检测图数据中未知节点是否为分布外节点,是通过分类模型进行检测。分类模型的训练是通过图数据中节点的类别训练得到。
3、由上可知,分类模型训练依赖于图数据中节点的类别信息,使得分类模型检测不具备类别信息的图数据中的未知节点,是否为分布外节点的准确性较低,也即现有的分布外节点检测方法通用性较低。
技术实现思路
1、本申请实施例提供一种分布外节点检测方法、装置、设备、计算机存储介质和程序产品,用于解决现有的分布外节点检测方法通用性较低的问题。
2、一方面,本申请实施例提供一种分布外节点检测方法,包括:
3、获取待检测图数据中各个第一节点的第一属性信息以及第一结构信息;
4、将所述第一结构信息与所述第一属性信息输入至能量模型,得到所述能量模型输出的每个所述第一节点的第一能量值,所述能量模型基于训练图数据中第二节点的属性信息以及结构信息训练得到;
5、将大于预设阈值的所述第一能量值对应的第一节点,确定为分布外节点。
6、在一实施例中,所述将所述第一结构信息与所述第一属性信息输入至能量模型之前,还包括:
7、获取训练图数据中各个第二节点的第二属性信息以及第二结构信息;
8、根据每个所述第二节点的第二属性信息以及所述第二结构信息,构建多个训练样本;
9、根据各个所述训练样本,对预设模型进行训练,得到所述能量模型。
10、在另一实施例中,所述根据每个所述第二节点的第二属性信息以及所述第二结构信息,构建多个训练样本,包括:
11、根据各个所述第二属性信息,确定所述训练图数据上待生成的第三节点的第三属性信息,并根据所述第三属性信息确定所述第三节点的第三结构信息;
12、在各个所述第二节点中确定第四节点,所述第四节点是作为分布内节点的所述第二节点;
13、根据所述第四节点的第二属性信息以及第二结构信息,构建分布内节点的训练样本,并根据所述第三节点的第三属性信息以及第三结构信息,构建分布外节点的训练样本。
14、在另一实施例中,所述预设模型的损失函数根据第二能量值以及第三能量值进行更新;所述第二能量值基于所述第三属性信息以及所述第三结构信息确定;所述第三能量值基于第二属性信息以及所述第二结构信息确定。
15、在另一实施例中,所述损失函数基于正则化处理后的第二能量值以及正则化处理后的第二能量值,进行更新。
16、在另一实施例中,所述第二能量值或所述第三能量值作为目标能量值,所述目标能量值的确定流程具体如下:
17、根据第一目标节点的第一目标结构信息以及第二目标节点的第二目标结构信息,确定所述第一目标节点与所述第二目标节点之间的连通参数,所述连通参数用于指示所述第一目标节点与所述第二目标节点之间的相连的概率,所述第一目标节点与所述第二目标节点是所述训练图数据上相邻的节点;
18、根据所述第一目标节点的第一目标属性信息确定第一目标节点的线性参数;
19、根据所述线性参数以及所述连通参数,确定所述第一目标节点,在图神经网络中每个网络层所对应的表征参数;
20、根据各个所述表征参数确定所述第一目标节点对应的目标能量值。
21、在另一实施例中,所述根据各个所述第二属性信息,确定所述训练图数据上待生成的第三节点的第三属性信息,包括:
22、根据各个所述第二属性信息确定所述第三节点的初始化属性信息;
23、基于设定的噪声参数,对所述初始化属性信息进行迭代,得到所述第三属性信息。
24、在另一实施例中,所述根据各个所述第二属性信息确定所述第三节点的初始化属性信息,包括:
25、响应于各个所述第二节点中包含作为分布外节点的第五节点;
26、根据各个所述第五节点的属性信息,确定所述训练图数据中待生成的第三节点的初始化属性信息。
27、在另一实施例中,所述根据各个所述第二属性信息确定所述第三节点的初始化属性信息,包括:
28、响应于各个所述第二节点中不包含作为分布外节点的第五节点;
29、根据各个所述第二节点的第二属性信息,确定所述训练图数据中待生成的第三节点的初始化属性信息。
30、在另一实施例中,所述将所述第一结构信息与所述第一属性信息输入至能量模型之后,还包括:
31、将小于或等于预设阈值的所述第一能量值对应的第一节点,确定为分布内节点。
32、另一方面,本申请实施例提供了一种分布外节点检测装置,包括:
33、获取模块,用于获取待检测图数据中各个第一节点的第一属性信息以及第一结构信息;
34、输入模块,用于将所述第一结构信息与所述第一属性信息输入至能量模型,得到所述能量模型输出的每个所述第一节点的第一能量值,所述能量模型基于训练图数据中第二节点的属性信息以及结构信息训练得到;
35、确定模块,用于将大于预设阈值的所述第一能量值对应的第一节点,确定为分布外节点。
36、再一方面,本申请实施例提供了一种分布外节点检测设备,
37、所述分布外节点检测设备包括:处理器以及存储有计算机程序指令的存储器;
38、所述处理器执行所述计算机程序指令时实现如上所述的方法。
39、再一方面,本申请实施例提供了一种计算机存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如上所述的方法。
40、再一方面,本申请实施例提供了一种计算机程序产品,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如上所述的方法
41、本申请实施例的分布外节点检测方法、装置、设备、计算机存储介质和程序产品,通过训练图数据中节点的属性信息以及结构信息训练得到能够计算出节点的能量值的能量模型,使得能量模型基于待检测图数据中各个节点的属性信息以及结构信息,确定每个节点的能量值,从而通过能量值确定待检测图数据中节点是否为分布外节点,也即分布外节点的检测适用于具备类别信息以及不具备类别信息的图数据,提高了分布外节点检测方法的通用性。
技术特征:1.一种分布外节点检测方法,其特征在于,包括:
2.根据权利要求1所述的分布外节点检测方法,其特征在于,所述将所述第一结构信息与所述第一属性信息输入至能量模型之前,还包括:
3.根据权利要求2所述的分布外节点检测方法,其特征在于,所述根据每个所述第二节点的第二属性信息以及所述第二结构信息,构建多个训练样本,包括:
4.根据权利要求3所述的分布外节点检测方法,其特征在于,所述预设模型的损失函数根据第二能量值以及第三能量值进行更新;所述第二能量值基于所述第三属性信息以及所述第三结构信息确定;所述第三能量值基于第二属性信息以及所述第二结构信息确定。
5.根据权利要求4所述的分布外节点检测方法,其特征在于,所述损失函数基于正则化处理后的第二能量值以及正则化处理后的第二能量值,进行更新。
6.根据权利要求4所述的分布节点检测方法,其特征在于,所述第二能量值或所述第三能量值作为目标能量值,所述目标能量值的确定流程具体如下:
7.根据权利要求3所述的分布外节点检测方法,其特征在于,所述根据各个所述第二属性信息,确定所述训练图数据上待生成的第三节点的第三属性信息,包括:
8.根据权利要求7所述的分布外节点检测方法,其特征在于,所述根据各个所述第二属性信息确定所述第三节点的初始化属性信息,包括:
9.根据权利要求7所述的分布外节点检测方法,其特征在于,所述根据各个所述第二属性信息确定所述第三节点的初始化属性信息,包括:
10.根据权利要求1-9中任一项所述的分布外节点检测方法,其特征在于,所述将所述第一结构信息与所述第一属性信息输入至能量模型之后,还包括:
11.一种分布外节点检测装置,其特征在于,包括:
12.一种分布外节点检测设备,其特征在于,所述分布外节点检测设备包括:处理器以及存储有计算机程序指令的存储器;
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-10中任意一项所述的方法。
14.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-10中任意一项所述的方法。
技术总结本申请公开了一种分布外节点检测方法、装置、设备、计算机存储介质和程序产品,该方法包括:获取待检测图数据中各个第一节点的第一属性信息以及第一结构信息;将所述第一结构信息与所述第一属性信息输入至能量模型,得到所述能量模型输出的每个所述第一节点的第一能量值,所述能量模型基于训练图数据中第二节点的属性信息以及结构信息训练得到;将大于预设阈值的所述第一能量值对应的第一节点,确定为分布外节点。本申请中,分布外节点的检测适用于具备类别信息以及不具备类别信息的图数据,提高了分布外节点检测方法的通用性。技术研发人员:龚政,孙莹,熊辉受保护的技术使用者:香港科技大学(广州)技术研发日:技术公布日:2024/11/18本文地址:https://www.jishuxx.com/zhuanli/20241120/333884.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。