技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种跨平台的社交网络溯源方法  >  正文

一种跨平台的社交网络溯源方法

  • 国知局
  • 2024-07-31 22:43:38

本发明涉及网络空间安全信息溯源;尤其涉及一种跨平台的社交网络溯源方法。

背景技术:

1、互联网技术的迅猛发展促进了社交平台的日渐盛行,也给人类社会的生产、生活方式带来了前所未有的深刻变化。社交媒体软件逐渐成为了网民获取、传播信息的主要渠道。基于社交媒体中所建立的复杂社交网络关系,信息传播表现出了速度快、交互性强、范围广等特征。人们在信息交换上享受了巨大的便利、促进了社会经济发展的同时,也给网络有害信息的传播带来了可乘之机。例如网络病毒的传播严重影响了用户的使用体验,使用户的财产、信息受损。因此,及时有效地定位传播源对于降低有害信息影响、减少损失具有比较重要的意义。

2、国内外学者广泛使用基于传播子图的溯源方法和基于观察点的溯源方法。但观察点有时无法提前有先见之明地部署在将要爆发的现实区域中,并且观察者的部署需要一定的开销,因此应用场景存在局限性。相比较而言,基于传播子图的方法在可访问时间戳下获取易获取或允许获取的网络感染快照信息,适用范围广泛,代价低,因此该类方法得到了广泛的研究。针对现有源定位方法没有考虑事件传播的跨平台属性、只关注模拟的传播动力学,本发明构建了twitter和微博平台的跨平台传播级联数据集,并设计了跨平台事件的双通道传播源定位框架。

技术实现思路

1、本发明的目的是提供了一种跨平台的社交网络溯源方法。

2、本发明是通过以下技术方案实现的:

3、本发明涉及一种跨平台的社交网络溯源方法,包括:

4、s1:收集twitter和weibo两个平台的传播数据;

5、s2:根据传播数据分别构建twitter和weibo每一个平台的有向无环图;

6、s3:分别构造twitter和weibo每一个平台的历史关系网络;

7、s4:分别构造twitter和weibo每一个平台下用户的传播特征;

8、s5:修正信息聚合过程中邻居的特征权重;

9、s6:对时序数据进行传播源预测;

10、s7:使用基于指数采样的变分自编码器生成twitter和weibo每一个平台用户的决策空间分布;

11、s8:使用基于双通道的kl散度约束twitter和weibo两个平台具有相似影响力的用户;

12、s9:输出概率最高的节点为预测源。

13、优选地,所述跨平台的社交网络溯源方法,具体步骤如下:

14、s1:收集twitter和weibo两个平台的传播数据,所述传播数据包括:用户、用户特征以及用户之间的传播关系;

15、s2:根据传播数据构建有向无环图g*,g*=(v*,e*,f*)并初始化;其中,v*表示在平台对应的用户集合,e*表示在平台用户之间的传播关系集合,f*表示在平台对应的用户特征,其中,*为某平台泛化性符号,*包含twitter和weibo平台,两个平台分别执行s2所述操作;

16、s3:基于平台所有的有向无环图构造历史关系网络作为传播源定位的先验信息,其中,*为某平台泛化性符号,*包含twitter和weibo平台,两个平台分别执行s3所述操作;

17、s4:构造在平台下所有用户在时间步ti下的传播特征其中,*为某平台泛化性符号,*包含twitter和weibo平台,两个平台分别执行s4所述操作;

18、s5:使用自循环注意力图卷积神经网络修正每个用户在信息聚合过程中邻居的特征信息权重,时间步ti的用户传播特征修正后为其中,*为某平台泛化性符号,*包含twitter和weibo平台,两个平台分别执行s5所述操作;

19、s6:使用双向lstm分别对twitter和weibo中所有时间戳的时序数据进行粗粒度传播源预测;

20、s7:使用基于指数采样的变分自编码器生成平台,时间步ti的用户的决策空间其中,*为某平台泛化性符号,*包含twitter和weibo平台,两个平台分别执行s7所述操作;

21、s8:使用基于双通道的kl散度约束twitter和weibo具有相似影响力的用户;

22、s9:输出概率最高的节点为预测的传播源。

23、优选地,所述步骤s3包括:通过在不同拓扑图中对相同节点进行联合的方式,对离散的拓扑图进行整合,使得多个独立的网络变为一个联合网络。

24、优选地,所述步骤s4包括:

25、所述为构造的在平台*、时间步ti下构造的特征,其维度为|v*|行15列的矩阵,其中,|v*|为用户数量,15代表为每个用户构造的特征数量,包含在时间步ti下的8个传播特征以及7个用户自身的属性;

26、

27、其中,为构造的在平台*、时间步ti下,用户vj的第一个特征;为在ti时刻下从历史关系网络中抽取的先验拓扑网络;为用户vj在中的邻居,为vj的邻居vk在平台*、时间步ti下的状态信息;

28、其中,状态信息有两种,为用户vk在时间步ti下参与了传播的状态信息,为用户vk在时间步ti下没有参与传播的状态信息;

29、

30、其中,为构造的在平台*、时间步ti下,用户vj的第一个特征,为构造的在平台*、时间步ti下,用户vj的第二个特征;

31、

32、其中,为构造的在平台*、时间步ti下,用户vj的第三个特征;为在ti时刻下从历史关系网络中抽取的先验拓扑网络;为用户vj在中的邻居;为中的用户节点;为vj的邻居vk在平台*、时间步ti下的状态信息;

33、其中,状态信息有两种,为用户vk在时间步ti下参与了传播的状态信息;为用户vk在时间步ti下没有参与传播的状态信息;

34、

35、其中,为构造的在平台*、时间步ti下,用户vj的第四个特征;为在ti时刻下从历史关系网络中抽取的先验拓扑网络;为用户vj在中的邻居;为中的用户节点;代表vj的邻居vk在平台*、时间步ti下的状态信息;

36、其中,状态信息有两种,为用户vk在时间步ti下参与了传播的状态信息;为用户vk在时间步ti下没有参与传播;

37、和共同代表用户vj在平台*、时间步ti下,用户vj是否参与了传播;和代表用户vj参与传播,和代表用户vj没有参与传播;

38、为用户vj的参与时间步信息;为用户vj的度中心性,即其中代表用户vj在平台对应的邻居,v*代表平台的所有用户;为用户vj的归一化发帖数量;为用户vj的归一化粉丝数量;为用户vj的归一化关注数量;为用户vj的归一化注册时间;为用户vj的归一化粉丝-关注比;和共同代表用户vj是否在平台认证;和代表用户vj已经在平台进行认证,和代表用户vj没有在平台进行认证。

39、优选地,所述步骤s5包括:

40、s51:根据用户自身特征计算用户的权重修正系数,具体如下:

41、

42、其中,φ(vj)为用户vj的权重修正系数,为在ti时刻下从历史关系网络中抽取的先验拓扑网络;为中的用户节点;为构造的在平台*、时间步ti下,用户vj的15个构造特征;和分别为可学习参数,relu为激活函数;

43、s52:基于s51得到的权重修正系数,使用图卷积机制重新调整每个用户的特征,具体如下:

44、

45、其中,为构造的在平台*、时间步ti下构造的特征,λ为将s51中得到的用户权重修正系数φ(vj)转化的对角矩阵,为邻接矩阵,为对应的对角矩阵,w为可学习参数,为修正后的在平台*、时间步ti下的特征。

46、优选地,所述步骤s7包括:

47、

48、其中,z为用户vj的潜在变量;为双向lstm对平台*、时间步ti下用户vj的传播源粗粒度预测结果,用于确定潜在变量z的指数形式的参数;为由φ参数化的潜在变量z的近似后验分布;为用户vj对应的指数分布的速率参数,为速率参数为的指数分布的概率密度函数的自然对数。

49、优选地,所述步骤s8包括:

50、

51、其中,为基于指数采样的变分自编码器生成的在twitter平台,时间步ti的用户的决策空间;为基于指数采样的变分自编码器生成的在weibo平台,时间步ti的用户的决策空间;kl(*||*)为两个分布的kl散度。

52、本发明具有以下优点:

53、(1)本发明所涉及的跨平台的社交网络溯源方法,包括:收集twitter和weibo两平台传播数据;根据传播数据构建有向无环图;为每一个平台构造历史关系网络;构造每一个平台下所有用户的传播特征;修正每个用户在信息聚合过程中邻居的特征信息权重;使用双向lstm对时序数据进行传播源预测;使用基于指数采样的变分自编码器生成用户的决策空间分布;使用基于双通道的kl散度约束两个平台具有相似影响力的用户;输出概率最高的节点为预测的传播源。本发明提高了多层网络传播源定位模型的预测准确率和效率。

54、(2)跨平台数据集与框架创新:本发明首次开发了一个融合twitter和weibo用户资料的跨平台事件内容对齐的传播级联数据集,有效地缩小了模拟与现实之间的差距;同时,提出了一个双通道事件源定位框架,在复杂网络环境下验证了其实用性,为源定位研究提供了新的视角和方法。

55、(3)自循环注意力机制增强的图卷积网络:本发明通过设计一种自循环注意力机制的图卷积网络(gcn),本发明能够更精细地调整邻域聚合策略,学习图结构和用户资料的高质量表示,显著提高了在实际场景中的源检测准确性。

56、(4)双结构基于kl正则化的模型鲁棒性提升:设计了一种基于双结构的kl正则化方法,专注于平台间源概率的潜在分布空间中的隐性联合特征;通过实现类似事件中具有相似资料水平的用户行为分布特征的对齐,增强了模型的鲁棒性。这一方法为跨平台数据分析和模型泛化提供了新的策略。

57、(5)传播特征的创新设计:本发明设计了15个传播特征,这些特征综合考虑了用户行为、网络结构和内容传播的动态性,从而显著增强了对现实场景下用户的表示质量;这不仅提高了源定位的准确性,也为理解和分析复杂网络中的信息传播机制提供了新的工具,进一步提升了模型在处理真实世界数据时的有效性和适应性。

58、(6)用户潜在行为决策空间的准确评估:使用和传播图特征更相符的e-vae学习图的潜在向量表示用户的决策空间,能够更好地捕捉到不同平台上用户行为特征和传播机制的方法,有助于研究者和分析师更好地理解和预测信息的流动和扩散模式。

本文地址:https://www.jishuxx.com/zhuanli/20240730/194325.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。