技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种群组的挖掘方法、装置及设备与流程  >  正文

一种群组的挖掘方法、装置及设备与流程

  • 国知局
  • 2024-10-09 15:11:35

本文件涉及计算机,尤其涉及一种群组的挖掘方法、装置及设备。

背景技术:

1、随着人们对自己的隐私数据越来越重视,为了保护用户隐私、保证数据的安全性,往往需要对存在指定风险的群组进行挖掘。在许多应用场景中,特别是在高风险行业(如支付业务中的风险防控的专案处理环节等),对群组挖掘的准确性要求非常严格,这是因为在这些行业中,发现和理解群组之间的关联和行为模式对于预防欺诈、识别异常交易以及保障网络安全至关重要。对群组挖掘的准确性要求超过99%的准确率,以确保尽可能减少误判的情况。

2、因此,在团伙挖掘的准确性要求非常高的场景中,尽可能降低误判对正常用户的打扰非常重要。这需要算法和模型在判断风险群组成员时更加准确和可靠,以减少将正常用户误判为群组成员的风险。然而,通常的单阶段群组挖掘算法往往无法满足这种高准确性的需求。为此,需要提供一个全面的群组挖掘的解决方案,能够显著提升群组挖掘的准确性。

技术实现思路

1、本说明书实施例的目的是提供一个全面的群组挖掘的解决方案,能够显著提升群组挖掘的准确性。

2、为了实现上述技术方案,本说明书实施例是这样实现的:

3、本说明书实施例提供的一种群组的挖掘方法,所述方法包括:获取基于预设的社区挖掘算法对预先构建的关联图谱进行挖掘而得到的一个或多个不同的挖掘群组,所述关联图谱是针对存在预设风险的目标用户构建的图谱,所述关联图谱中包括节点和边,所述节点由用户的信息构建,所述边由不同用户使用的介质的信息和/或不同用户之间的交易信息构建。获取每个挖掘群组中的每个节点的属性信息,并基于每个挖掘群组中的每个节点的属性信息,通过预先训练的属性图模型,确定每个节点对应的节点表征。基于每个节点对应的节点表征和每个挖掘群组中的每个节点的属性信息,确定每个挖掘群组中的离群节点,并基于所述每个挖掘群组中的离群节点对相应的挖掘群组进行提纯处理,得到提纯后的群组。获取所述提纯后的群组的属性信息,并基于所述提纯后的群组的属性信息,从所述提纯后的群组中获取存在预设风险的目标群组。

4、本说明书实施例提供的一种群组的挖掘装置,所述装置包括:挖掘群组获取模块,获取基于预设的社区挖掘算法对预先构建的关联图谱进行挖掘而得到的一个或多个不同的挖掘群组,所述关联图谱是针对存在预设风险的目标用户构建的图谱,所述关联图谱中包括节点和边,所述节点由用户的信息构建,所述边由不同用户使用的介质的信息和/或不同用户之间的交易信息构建。节点表征确定模块,获取每个挖掘群组中的每个节点的属性信息,并基于每个挖掘群组中的每个节点的属性信息,通过预先训练的属性图模型,确定每个节点对应的节点表征。提纯模块,基于每个节点对应的节点表征和每个挖掘群组中的每个节点的属性信息,确定每个挖掘群组中的离群节点,并基于所述每个挖掘群组中的离群节点对相应的挖掘群组进行提纯处理,得到提纯后的群组。群组确定模块,获取所述提纯后的群组的属性信息,并基于所述提纯后的群组的属性信息,从所述提纯后的群组中获取存在预设风险的目标群组。

5、本说明书实施例提供的一种群组的挖掘设备,所述群组的挖掘设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取基于预设的社区挖掘算法对预先构建的关联图谱进行挖掘而得到的一个或多个不同的挖掘群组,所述关联图谱是针对存在预设风险的目标用户构建的图谱,所述关联图谱中包括节点和边,所述节点由用户的信息构建,所述边由不同用户使用的介质的信息和/或不同用户之间的交易信息构建。获取每个挖掘群组中的每个节点的属性信息,并基于每个挖掘群组中的每个节点的属性信息,通过预先训练的属性图模型,确定每个节点对应的节点表征。基于每个节点对应的节点表征和每个挖掘群组中的每个节点的属性信息,确定每个挖掘群组中的离群节点,并基于所述每个挖掘群组中的离群节点对相应的挖掘群组进行提纯处理,得到提纯后的群组。获取所述提纯后的群组的属性信息,并基于所述提纯后的群组的属性信息,从所述提纯后的群组中获取存在预设风险的目标群组。

6、本说明书实施例还提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:获取基于预设的社区挖掘算法对预先构建的关联图谱进行挖掘而得到的一个或多个不同的挖掘群组,所述关联图谱是针对存在预设风险的目标用户构建的图谱,所述关联图谱中包括节点和边,所述节点由用户的信息构建,所述边由不同用户使用的介质的信息和/或不同用户之间的交易信息构建。获取每个挖掘群组中的每个节点的属性信息,并基于每个挖掘群组中的每个节点的属性信息,通过预先训练的属性图模型,确定每个节点对应的节点表征。基于每个节点对应的节点表征和每个挖掘群组中的每个节点的属性信息,确定每个挖掘群组中的离群节点,并基于所述每个挖掘群组中的离群节点对相应的挖掘群组进行提纯处理,得到提纯后的群组。获取所述提纯后的群组的属性信息,并基于所述提纯后的群组的属性信息,从所述提纯后的群组中获取存在预设风险的目标群组。

7、本说明书实施例还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下流程:获取基于预设的社区挖掘算法对预先构建的关联图谱进行挖掘而得到的一个或多个不同的挖掘群组,所述关联图谱是针对存在预设风险的目标用户构建的图谱,所述关联图谱中包括节点和边,所述节点由用户的信息构建,所述边由不同用户使用的介质的信息和/或不同用户之间的交易信息构建。获取每个挖掘群组中的每个节点的属性信息,并基于每个挖掘群组中的每个节点的属性信息,通过预先训练的属性图模型,确定每个节点对应的节点表征。基于每个节点对应的节点表征和每个挖掘群组中的每个节点的属性信息,确定每个挖掘群组中的离群节点,并基于所述每个挖掘群组中的离群节点对相应的挖掘群组进行提纯处理,得到提纯后的群组。获取所述提纯后的群组的属性信息,并基于所述提纯后的群组的属性信息,从所述提纯后的群组中获取存在预设风险的目标群组。

技术特征:

1.一种群组的挖掘方法,所述方法包括:

2.根据权利要求1所述的方法,所述方法还包括:

3.根据权利要求1所述的方法,所述获取基于预设的社区挖掘算法对预先构建的关联图谱进行挖掘而得到的一个或多个不同的挖掘群组,包括:

4.根据权利要求3所述的方法,所述介质信息包括预设证件号码类的信息、手机号码类的信息、设备标识类的信息、地理信息类的信息、交易类的信息中的一种或多种,所述社区挖掘算法包括louvain算法或谱聚类算法。

5.根据权利要求1所述的方法,所述每个节点的属性信息包括危害性指标信息、活跃性指标信息、交易形态信息、静态信息、图结构信息,所述危害性指标信息包括与预设风险的交易相关的信息,所述活跃性指标信息包括被确定为存在预设风险到当前时刻的时长相关的信息,所述交易形态信息包括与交易相关的信息,所述图结构信息包括关联的存在预设风险的节点的相关信息;所述提纯后的群组的属性信息包括群组危害性指标信息、群组活跃性指标信息和群组描述性指标信息,所述群组危害性指标信息包括所述提纯后的群组的与预设风险的交易相关的信息,所述群组活跃性指标信息包括所述提纯后的群组中节点被确定为存在预设风险到当前时刻的时长相关的信息。

6.根据权利要求5所述的方法,所述基于每个挖掘群组中的每个节点的属性信息,通过预先训练的属性图模型,确定每个节点对应的节点表征之前,所述方法还包括:

7.根据权利要求6所述的方法,所述属性图模型是基于包含注意力模块的图神经网络构建的图模型,所述属性图模型是基于自监督训练和对比学习的方式进行模型训练后得到。

8.根据权利要求1所述的方法,所述基于每个节点对应的节点表征和每个挖掘群组中的每个节点的属性信息,确定每个挖掘群组中的离群节点,包括:

9.一种群组的挖掘装置,所述装置包括:

10.一种群组的挖掘设备,所述群组的挖掘设备包括:

技术总结本说明书实施例公开了一种群组的挖掘方法、装置及设备,该方法包括:获取基于预设的社区挖掘算法对预先构建的关联图谱进行挖掘而得到的一个或多个不同的挖掘群组,关联图谱是针对存在预设风险的目标用户构建的图谱,关联图谱中的边由介质的信息和/或交易信息构建;获取每个挖掘群组中的每个节点的属性信息,并基于属性信息,通过属性图模型,确定每个节点对应的节点表征;基于每个节点对应的节点表征和每个挖掘群组中的每个节点的属性信息,确定每个挖掘群组中的离群节点,并基于每个挖掘群组中的离群节点对相应的挖掘群组进行提纯处理,得到提纯后的群组;基于提纯后的群组的属性信息,从提纯后的群组中获取存在预设风险的目标群组。技术研发人员:周璟,彭凤超,李金膛,但家旺,田胜,刘云飞,王宝坤,孟昌华,王维强受保护的技术使用者:支付宝(杭州)信息技术有限公司技术研发日:技术公布日:2024/9/29

本文地址:https://www.jishuxx.com/zhuanli/20241009/308002.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。