技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种融合深度学习与社会推荐的异构网络社区发现方法  >  正文

一种融合深度学习与社会推荐的异构网络社区发现方法

  • 国知局
  • 2024-09-14 15:08:27

本发明涉及网络推荐系统,特别是一种融合深度学习与社会推荐的异构网络社区发现方法。

背景技术:

1、在知识社会中,信息共享和发现非常重要,最终共享经济的接受和信息技术的进步,越来越多的知识贡献和发现活动正从线下转为线上。鉴于在线社区在打破地理和时间障碍方面的优势,有助于信息共享和发现,一个典型的社区将人们聚集在一个共同感兴趣的话题周围,在这些感兴趣的社区中,用户可以轻松地相互互动,共享知识、想法或其他相关信息。由于需要交换信息、建立友谊和建立声誉,用户有强烈的动机参与社区。社交网络平台培养社区,因为它们对在线广告、精准营销和品牌管理很有用,一方面,在线社区中的用户从彼此共享信息中受益,与其他成员建立联系,促进在线服务;另一方面,随着在线社交网络中社区的迅速发展,用户很难选择合适的社区加入,因此,从业者和研究人员都试图设计出实现社区发现的方法。

2、早期的社区推荐尝试采用相似性搜索策略为用户推荐社区,随后协同过滤在推荐系统中发挥着重要的作用,用户可能属于多个社区。现有技术大多需要辅助信息,如用户项目交互或评级历史,并进一步假设每个用户至少加入了一个社区,这在真实场景中过于理想化。此外,由于明确的约束,用户和社区之间的交互比传统的社区/项目推荐问题极其稀疏。最近图神经网络的成功吸引了研究人员为推荐任务设计基于gnn的方法,如项目推荐和组推荐,这些方法主要关注用户项目二分图,而忽略了用户之间的社交互动。事实证明,用户之间的社交互动有助于推荐系统,因为用户的选择很可能受到周围其他人的影响。因此,最近的社会推荐方法进一步考虑了用户之间的社交关系。

3、鉴于异构信息网络hin在获取丰富语义方面的优势,其已成为分析真实世界数据的流行工具。hin将实体及其关系分别表示为网络中不同类型的节点和边。它已经被引入推荐模型,如电影和引文。为了有效地挖掘和搜索信息,提出了表示hin结构的元路径,用以捕捉不同类型节点之间的语义关系。元路径是通过网络模式的简单连接,并为挖掘hin提供指导。然而以元路径为推荐目的的hin挖掘存在信息噪声或领域知识偏差,并不是hin中的每一条信息都是有用的,枚举所有可能的元路径会给推荐带来太多噪音。目前元路径的选择主要依赖于领域知识,因此推荐性能取决于专家,选择有效的元路径,如何有效、高效地进行推荐,仍未解决。目前很少有研究使用hin对社区进行建模,并专注于挖掘用户和社区之间的信息联系以获得推荐,传统的方法很难根据推荐的历史数据对用户和社区之间的异构连接进行建模,深度学习提供了通过捕捉实体之间的非线性和非平凡关系来提高推荐性能的机会。

技术实现思路

1、本发明的目的在于提供一种算法简单、资源开销小、准确度高的融合深度学习与社会推荐的异构网络社区发现方法。

2、本发明的技术方案为:一种融合深度学习与社会推荐的异构网络社区发现方法,包括以下步骤:

3、步骤1:通过网络模式将异构数据排列为异构信息网络,选择有效元路径,构建用户-用户社交网络和用户-社区二分网络;

4、步骤2:通过图神经网络和标记机制训练优化用户-用户社交网络和用户-社区二分网络,并融合所述用户-用户社交网络和用户-社区二分网络,构建用户-社区扩展图;

5、步骤3:基于用户-社区扩展图,选择元路径,度量基于元路径的目标用户与目标社区之间的相似性,获取目标用户-目标社区节点对;

6、步骤4:将所述目标用户-目标社区节点对输入全连接前馈神经网络中进行训练,输出目标用户加入目标社区的概率,将得到的预测结果应用于异构网络社区发现。

7、优选的,步骤1中所述元路径的表达式如下:

8、

9、其中:pm为元路径,an+1为第n+1种类型节点,rl为第l种语义关系类型。

10、优选的,步骤1中,构建用户-用户社交网络选择的有效元路径具体为起始节点与结束节点均为用户实体的元路径。

11、优选的,步骤1中,构建用户-社区二分网络,包括如下两种情形:

12、①若存在社区实体类型,则选择从起始节点为用户实体到结束节点为社区实体的元路径,构建用户-社区二分网络;

13、②若不存在社区实体类型,则需将异构信息网络划分初始社区后,再构建用户-社区二分网络。

14、优选的,若不存在社区实体类型,则需将异构信息网络划分初始社区后,再构建用户-社区二分网络,包括如下步骤:

15、s1,将异构网络转化为同构网络;

16、s2,选择初始种子节点,得到初始种子节点集;

17、s3,基于初始种子节点集,对同构网络中的种子节点进行动态调整;

18、s4,将调整后的种子节点及其邻域作为初始社区进行社区划分,再选择从起始节点为用户实体到结束节点为社区实体的元路径,构建用户-社区二分网络。

19、优选的,步骤s3中还包括利用邻域标签熵en(s)度量节点集s的邻域n(s)内社区标签的一致性,计算公式如下:

20、

21、

22、其中,i′为社区的类别标签,l′(u′)为s中节点类别标签集合,δ(·)为指示函数。

23、优选的,步骤3中,所述目标用户为未分配社区的用户。

24、优选的,步骤3中,所述度量基于元路径的目标用户与目标社区之间的相似性,具体步骤如下:

25、步骤3.1:度量目标用户和目标社区的社区用户之间的相似性,具体为:

26、①确定目标用户和社区用户之间连接的元路径,表达式如下:

27、

28、②利用avgsim计算目标用户和目标社区的社区用户之间的相似性,公式如下:

29、

30、其中,是pm的反向元路径,ui为第i个目标用户,uj为第j个社区用户,label(ui,uj|pm)为ui通过pm到达uj的概率,表示uj通过到达ui的概率,o(ui|rl)表示ui通过rl到达的邻居集合,|o(ui|rl)|为所述邻居集合的大小,oq(ui|rl)为所述邻居集合中的第q个邻居,sim(ui,uj|pm)对称地度量ui和uj之间的相似性。

31、步骤3.2:基于目标用户与目标社区的社区用户之间的相似性,通过目标社区最相似的社区用户和元路径pm度量目标用户ui和目标社区c之间的相似性。

32、

33、其中,uc,i为与目标用户ui最相似的社区用户的聚合。

34、优选的,步骤3中,利用avgsim度量基于元路径的目标用户与目标社区之间的相似性,具体为:

35、①确定目标用户和目标社区之间连接的元路径,表达式如下:

36、

37、②计算目标用户与目标社区之间的相似性,计算公式如下:

38、

39、其中,cj为第j个目标社区。

40、优选的,步骤4中,根据top-k对所述预测结果进行排序,选取阈值,将具有top-k预测概率的目标社区推荐给目标用户进行匹配,得出目标社区是否重叠,实现异构网络社区发现。

41、与现有技术相比,本发明的有益效果是:在异构信息网络中,通过元路径的选择,构建用户-用户社交网络和用户-社区二分网络,能够准确表达异构信息网络的结构,捕捉实体之间的非线性关系,提高社区推荐的准确性;通过深度学习中的消息传递图神经网络和标记机制训练优化用户-用户社交网络和用户-社区二分网络,捕捉节点之间深层次的复杂连接关系,并将用户-用户社交网络与用户-社区二分网络相融合,既能捕获不同社区的结构,也能捕获用户之间潜在的互动关系,生成更具信息性的表示,实现用户之间的深度互联;利用avgsim度量基于元路径的目标用户与目标社区之间的相似性,更为简单、方便;通过top-k筛选技术处理预测结果,对于大规模的数据处理至关重要,能够提高社区推荐的速度。本发明能够在大规模社交网络上进行社区推荐,提高了社区推荐的准确性和稳定性。

本文地址:https://www.jishuxx.com/zhuanli/20240914/297106.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。