技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种目标群体挖掘装置及系统的制作方法  >  正文

一种目标群体挖掘装置及系统的制作方法

  • 国知局
  • 2024-09-14 14:34:24

本说明书涉及目标挖掘,尤其涉及一种目标群体挖掘装置及系统。

背景技术:

1、目标挖掘是指在一个特定领域或项目中,通过系统性的方法和策略,识别核心目标的过程,确保项目或活动的方向明确、针对性强,从而提高效率和效果。通过目标挖掘,可以识别出特定的目标对象,目标对象具有相似的特征、需求和偏好,因此可以针对他们制定更加精准的策略和计划。然而,得到的目标对象虽具备相似的特征,但是忽视了目标对象之间的关联性。现有的挖掘方法大都采用的程序、算法等方式进行挖掘,但是由于没有体现目标对象之间的关联性,导致挖掘到的目标群体存在不准确的问题。

技术实现思路

1、本说明书一个或多个实施例提供了一种目标群体挖掘装置及系统,用于解决如下技术问题:现有的挖掘方法大都采用的程序、算法等方式进行挖掘,但是由于没有体现目标对象之间的关联性,导致挖掘到的目标群体存在不准确的问题。

2、本说明书一个或多个实施例采用下述技术方案:

3、本说明书一个或多个实施例提供一种目标群体挖掘装置,所述装置包括:信息接收模块,用于接收目标群体挖掘请求信息,其中,所述目标群体挖掘请求信息包括挖掘属性信息;实体检索模块,用于通过所述目标群体挖掘请求信息,在预先构建的基础信息检索库中进行用户实体检索,确定目标群体对应的待选用户列表,其中,所述待选用户列表包括至少一个待选用户;网络图构建模块,用于根据所述目标群体对应的待选用户列表,以每个所述待选用户为起点在预先构建的基础图数据库中进行查询,确定多度关联实体信息,以构建对应的网络图;群体初筛模块,用于基于社区结构优化算法,对所述网络图进行社区划分,确定多个初始划分群体,通过预设算法对每个所述初始划分群体的联通程度进行分析,以对每个所述初始划分群体中的指定节点进行剪裁,确定对应的当前划分群体;群体过滤模块,通过预设的可能性校验方式,对多个所述当前划分群体进行过滤,以在多个所述当前划分群体中确定至少一个目标群体,其中,所述可能性校验方式包括轨迹校验、用户身份校验和用户数量校验中的任意一项或多项。

4、进一步地,通过所述目标群体挖掘请求信息,在预先构建的基础信息检索库中进行用户实体检索,确定目标群体对应的待选用户列表,具体包括:基于所述目标群体挖掘请求信息中的挖掘属性信息,确定对应的至少一个目标检索敏感词;通过每个所述目标检索敏感词,在所述基础信息检索库中进行词条检索,以确定多个命中词条的命中词条信息;利用倒排索引技术,根据每个所述命中词条的命中词条信息进行用户实体检索,确定目标群体对应的待选用户列表。

5、进一步地,所述装置还包括检索库构建模块;所述检索库构建模块用于待选用户获取多个指定记录数据,其中,每个所述指定记录数据包括多个记录项和每个所述记录项对应的文本信息;确定预先设置的多个挖掘属性,以获取每个所述挖掘属性对应的至少一个记录项参考权重;按照每个所述记录项参考权重,在所述多个记录项中进行记录项筛选,确定每个所述挖掘属性对应的多个重点记录项;通过每个所述挖掘属性对应的多个重点记录项,确定每个所述重点记录项对应的重点文本信息;对所述重点文本信息设置文本字段索引,以构建每个所述挖掘属性对应的基础信息检索库。

6、进一步地,所述装置还包括图数据库构建模块;所述图数据库构建模块用于获取多个指定实体数据,其中,所述指定实体数据包括多个实体的实体身份信息和实体交互信息,所述实体包括用户实体和对应的多个虚拟账号实体;通过所述多个指定实体数据中的多个实体,确定点数据;根据所述实体身份信息,将所述用户实体和对应的多个虚拟账号实体进行关联,并基于所述实体的交互联系,对所述多个虚拟账号实体进行通联,确定交互频次和对应的边数据,其中,所述交互频次包括通联频次和交易频次;按照所述交互频次,对每个所述边数据设置边属性数据,以通过所述点数据、所述边数据和所述边属性数据,构建基础图数据库。

7、进一步地,根据所述目标群体对应的待选用户列表,以每个所述待选用户为起点在预先构建的基础图数据库中进行查询,确定多度关联实体信息,具体包括:确定预先设置的参考查询维度;按照所述参考查询维度,以所述待选用户列表中的每个所述待选用户为起点,在所述基础图数据库中进行查询,以确定所述参考查询维度对应的指定维度关联实体信息;确定所述指定维度关联实体信息中的关联实体数量,当所述关联实体数量不小于预设实体数量阈值时,对所述参考查询维度进行单位降维,确定当前查询维度,以获取所述当前查询维度对应的多度关联实体信息,其中,所述多度关联实体信息包括多个关联实体和多个关联实体之间的关联实体关系信息。

8、进一步地,通过预设算法对每个所述初始划分群体的联通程度进行分析,以对每个所述初始划分群体中的指定节点进行剪裁,确定对应的当前划分群体,具体包括:通过预设算法对每个所述初始划分群体的联通程度进行分析,以确定每个实体节点的节点值;获取每个所述初始划分群体中的多个边属性数据,其中,所述边属性数据包括通联频次和交易频次;根据所述多个边属性数据和每个所述实体节点的节点值,确定至少一个指定节点,以对所述指定节点进行剪裁,确定每个所述初始划分群体对应的剪裁划分群体;获取所述剪裁划分群体中的多个当前用户实体,以在所述基础信息检索库中,对所述当前用户实体进行多维度文本检索;当存在第一当前用户实体对应的文本检索结果中不存在指定关键词时,对所述第一当前用户实体进行裁剪,以确定当前划分群体。

9、进一步地,通过预设的可能性校验方式,对多个所述当前划分群体进行过滤,以在多个所述当前划分群体中确定至少一个目标群体,具体包括:确定每个所述当前划分群体中的多个用户实体,并获取预先构建的基础轨迹分析数据库,其中,所述基础轨迹分析数据库包括终端基站定位信息、虚拟账号实体定位信息和行程轨迹信息;根据每个所述当前划分群体中的多个用户实体和所述基础轨迹分析数据库,利用动态时间规整算法,确定每个所述当前划分群体中的至少一个相似轨迹;通过所述至少一个相似轨迹,匹配每个所述相似轨迹对应的多个第一用户实体,以确定所述第一用户实体的匹配用户实体数量;基于所述匹配用户实体数量和所述当前划分群体中用户实体的用户实体数量,确定每个所述当前划分群体对应的轨迹相似比例;将所述多个用户实体的用户信息与预先构建的重点用户数据库进行信息对比,确定每个所述当前划分群体中是否存在重点挖掘用户;当所述轨迹相似比例大于预设阈值,且存在所述重点挖掘用户时,确定所述当前划分群体为准目标群体,并确定每个所述准目标群体的准目标用户实体的数量;当所述准目标用户实体的数量大于预设数量阈值时,确定所述准目标群体为所述目标群体。

10、进一步地,根据所述多个边属性数据和每个所述实体节点的节点值,确定至少一个指定节点,具体包括:根据多个边属性数据和每个实体节点的节点值,对每个所述实体节点进行节点评估,生成每个所述实体节点的节点评估因子;基于每个所述实体节点的节点评估因子,在多个所述实体节点中进行筛选,以确定至少一个指定节点;或,通过所述多个边属性数据、预先设置的交互频次阈值、每个所述实体节点的节点值和预先设置的节点参考阈值,在多个所述实体节点中进行筛选,以确定至少一个指定节点。

11、本说明书一个或多个实施例提供一种目标群体挖掘系统,包括:

12、至少一个处理器;以及,

13、与所述至少一个处理器通信连接的存储器;其中,

14、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行:接收目标群体挖掘请求信息,其中,所述目标群体挖掘请求信息包括挖掘属性信息;通过所述目标群体挖掘请求信息,在预先构建的基础信息检索库中进行用户实体检索,确定目标群体对应的待选用户列表,其中,所述待选用户列表包括至少一个待选用户;根据所述目标群体对应的待选用户列表,以每个所述待选用户为起点在预先构建的基础图数据库中进行查询,确定多度关联实体信息,以构建对应的网络图;基于社区结构优化算法,对所述网络图进行社区划分,确定多个初始划分群体,通过预设算法对每个所述初始划分群体的联通程度进行分析,以对每个所述初始划分群体中的指定节点进行剪裁,确定对应的当前划分群体;通过预设的可能性校验方式,对多个所述当前划分群体进行过滤,以在多个所述当前划分群体中确定至少一个目标群体,其中,所述可能性校验方式包括轨迹校验、用户身份校验和用户数量校验中的任意一项或多项。

15、本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:通过上述技术方案,通过预先构建的基础信息检索库和图数据库,可以满足目标群体挖掘的数据需求,保证了数据与挖掘场景的关联性,为后续的挖掘过程提供了准确的数据来源,可以自动检索和查询待选用户及相关实体信息,减少了人工搜索和筛选的繁琐过程,大大提高了处理效率和准确性;利用社区结构优化算法和可能性校验方式,能够迅速从海量数据中筛选出目标群体,增加了挖掘方式与场景的联系,进一步保证了得到的目标群体与场景的适配性和准确性。

本文地址:https://www.jishuxx.com/zhuanli/20240914/294817.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。