一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多消息和多维复合博弈的谣言传播控制方法与流程

2022-02-20 16:02:44 来源:中国专利 TAG:


1.本发明属于网络舆情分析领域,具体涉及一种基于多消息和多维复合博弈的谣言传播控制方法。


背景技术:

2.谣言是指没有经过官方确认,与事实不符的信息或言论;辟谣消息是指有关部门通过官方媒体做出的澄清和反馈。网络谣言已经成为了信息爆炸时代引发舆论的导火索。网络谣言发布后,在短时间内谣言就会通过社交网络进行广泛的传播,网络谣言往往比普通谣言传播的更快更广,而谣言的广泛传播将极大的影响社会秩序、妨碍重大公共大事件的处理。因此,对于公共部门而言,如何通过相关的技术手段来对谣言的传播进行分析和预测,及时发现和化解谣言问题以及引导正确的舆论导向都至关重要。
3.近年来,学者们对社交网络上的谣言传播进行了广泛的研究。研究方向主要集中在宏观和微观两个层面:在宏观层面,学者们借鉴传染病模型的思想在复杂网络上对谣言传播动力学进行研究。在微观层面,一部分学者从用户行为模式角度出发,通过分析用户特征具体地预测用户传播行为,另有一部分学者从谣言消息本身出发,通过检测消息的真实性来揭穿散布在社交媒体上的虚假谣言。
4.在实际生活中,社交谣言话题在爆发的同时,同一时间段内一个谣言话题下会产生多对不同的谣言消息和辟谣消息。围绕谣言话题,一对谣言消息和辟谣消息之间相互竞争,同时这对谣言消息和辟谣消息的传播也会影响其他谣言消息和辟谣消息的传播;消息传播空间是复杂性的,而传统的传播模型只是针对谣言辟谣本身,没有充分考虑到网络中其他消息对谣言传播的影响,而其他消息对谣言传播有一定的抑制或者促进关系,如何量化这种多层次的关系对谣言传播的影响力,是个新的挑战;由于多消息的多维复杂性,多条消息传播的网络十分庞大,并且多条谣言传播过程中实际有效数据的不平衡性,训练模型的精确度是个需要解决的问题。综上所述,现有的谣言传播模型存在忽略了其他消息对谣言传播的影响问题和多条谣言传播过程中实际有效数据的不平衡性问题。


技术实现要素:

5.鉴于以上现有技术问题,本发明提出了一种基于多消息和多维复合博弈的谣言传播控制方法,该方法包括:获取数据信息,获取的信息包括话题信息和用户信息,对话题数据信息和用户数据信息进行预处理;将预处理后的数据信息输入到基于多消息和多维复合博弈的谣言传播模型中,预测用户传播谣言的趋势;根据预测的用户谣言传播趋势对谣言传播的用户进行控制,阻止谣言的传播;
6.优选的,采用基于多消息和多维复合博弈的谣言传播模型对预处理后的数据信息进行处理的过程包括:
7.s1:提取预处理后的数据信息的相关属性;该相关属性包括用户内容兴趣特征、用户活跃度、消息活跃度和用户结构特征;根据用户内容兴趣特征和用户结构特征构建特征
矩阵;
8.s2:利用用户活跃度和消息活跃度计算消息影响力;
9.s3:采用基于消息影响力的融合多维复合博弈算法计算转发多消息的驱动力;
10.s4:将转发多消息的驱动力融入用户结构特征中的多消息网络拓扑边权中,对多消息网络边权进行重构,获得多维演化博弈后的用户结构特征,根据多维演化博弈后的用户结构特征构建邻接矩阵;
11.s5、将特征矩阵和邻接矩阵输入到建立的基于图神经网络模型构建的谣言传播模型中,预测用户传播谣言的趋势。
12.进一步的,提取用户内容兴趣特征的过程包括:
13.获得用户转发消息的候选关键词;
14.计算候选关键词节点权重;
15.根据用户活跃度设置阙值;根据设置的阈值筛选出权重高的关键词;
16.利用doc2vec算法将每个用户筛选出的关键词映射成词向量,该向量为用户内容兴趣特征向量。
17.进一步的,提取用户结构特征的过程包括:
18.利用mm2vec算法对用户结构特征进行表示学习,得到用户结构特征;mm2vec算法为对node2vec算法中的游走策略进行改进后的算法,改进后的游走策略公式为:
[0019][0020]
其中,α(u
i-1
,ui,x)表示游走概率,uvac(x)表示用户x的用户活跃度,uvac(u
i-1
)表示,d(u
i-1
,x)表示用户u
i-1
到用户x的距离,p、q表示超参数。
[0021]
优选的,定义用户活跃度uvac(ui)为:
[0022][0023]
其中,degree(ui)是此用户的出度与入度之和,|v|是全网节点的总数目;
[0024]
优选的,定义消息活跃度mac(mi)为:
[0025]
mac(mi)=(α*num[fans(u0)] β*num[ret(mi)])*k
[0026]
其中,num[fans(u0)]为消息mi发布者的粉丝数量,代表消息发布者的影响力,num[ret(mi)]代表目前消息的转发总数量,代表目前消息的热度,α,β∈[0,1]是可调参数,k代表根据消息从发布到现在的时间进行衰变的参数。
[0027]
进一步的,消息影响力计算方式为:
[0028]
imp(m)=σ1 σ2uvac(ui) σ3mac(m)
[0029]
其中,imp(m)表示消息m的消息影响力,σ1、σ2、σ3是偏回归系数,uvac(ui)表示用户ui的用户活跃度,mac(m)表示消息m的消息活跃度。
[0030]
优选的,采用基于消息影响力的多维复合博弈算法计算转发多消息的驱动力的过程包括:
[0031]
多维复合博弈算法为定义当前用户节点转发消息类型与当前用户节点的上游用户节点转发消息类型的不同组合的收益,当前用户转发的上一条消息类型和当前用户转发的当前消息类型的不同组合的收益;跟据不同组合的收益、当前用户节点转发不同类型消息的消息影响力和上游用户节点转发不同类型消息的数量计算用户转发不同类型消息的驱动力;所有不同组合的收益包括:当前用户节点的上游用户节点选择转发谣言消息,当前用户节点选择转发谣言消息的收益fsmirr、当前用户节点的上游用户节点选择转发谣言消息,当前用户节点选择转发辟谣消息的收益fsmira、当前用户节点的上游用户节点选择转发辟谣消息,当前用户节点选择转发辟谣消息的收益fsmiaa、当前用户节点的上游用户节点选择转发辟谣消息,当前用户节点选择转发谣言消息的收益fsmiar、当前用户节点转发的上一条消息为谣言消息,转发的当前消息为谣言消息的收益ssmirr、当前用户节点转发的上一条消息为谣言消息,转发的当前消息为辟谣消息的收益ssmira、当前用户节点转发的上一条消息为辟谣消息,转发的当前消息为辟谣消息的收益ssmiaa和当前用户节点转发的上一条消息为辟谣消息,转发的当前消息为谣言消息的收益ssmiar。
[0032]
进一步的,用户节点ui转发多消息的驱动力计算公式为:
[0033][0034][0035]
其中,psuh
mi-r
(ui)表示当前用户节点ui转发谣言消息的驱动力,psuh
mi-a
(ui)表示当前用户节点ui转发辟谣消息的驱动力,imp(m
i-r
)表示当前用户节点ui转发的谣言消息的消息影响力,imp(m
i-a
)表示当前用户节点转发的辟谣消息的消息影响力,表示上游用户节点ui转发辟谣消息的数量,degree(ui)表示当前用户节点ui的度。
[0036]
优选的,用户结构特征中的多消息网络拓扑边权的权值的定义为:
[0037][0038]
其中,fat(i)表示用户i的所有直接关注集,c(ui,x)表示用户ui转发来自x的消息数量,c(y,m
t
)表示关注节点在t时间内已转发的消息数量,此数量越高,说明ui更容易转发上一节点转发的消息,表示用户ui从所有关注的节点所转发的历史消息总数量。
[0039]
进一步的,对多消息网络边权进行重构的边权值为:
[0040][0041]
其中,e(ui,u,mi)表示多消息网络边权的边权值,psuh
mi-a
(ui)表示用户节点ui转发辟谣消息的驱动力,psuh
mi-r
(ui)表示用户节点ui转发谣言消息的驱动力。
[0042]
优选的,基于图神经网络模型构建的谣言传播模型的公式为:
[0043][0044]
其中,z表示用户三类标签的概率,三类标签分别为用户转发谣言消息、用户转发辟谣消息和用户不转发消息;x表示特征矩阵,a表示邻接矩阵,f(x,a)表示模型输入为特征矩阵x和邻接矩阵a,表示邻接矩阵加上一个单位矩阵,w(i)为第i层网络的权重。在softmax之后的概率值用z=p(r,a,d|ui)表示,具体的定义为:
[0045][0046]
其中,y表示根据概率最终确定此用户转发谣言或辟谣或不转发的结果;z=p(r,a,d|ui)表示用户ui转发谣言消息,转发辟谣消息和不转发消息的概率,p(r|ui)表示用户ui转发谣言的概率,p(d|ui)表示用户不转发消息的概率,p(a|ui)表示用户转发辟谣消息的概率;r表示谣言消息,a表示辟谣消息,d表示不转发消息。
[0047]
优选的,为缓解输入到基于图神经网络模型构建的谣言传播模型中数据样本不平衡,定义一个新的模型训练损失函数来学习得到每个类的权值,所述损失函数为:
[0048]
l=-wdylogp(y=0|x)-wrylogp(y=1|x)-waylogp(y=2|x)
[0049][0050][0051][0052]
其中,num[d]、num[r]、num[a]分别代表训练集中不转发消息、转发谣言消息、转发辟谣消息的数量;p(y=i|x)表示网络输出属于标签的预测概率,y是指示变量。
[0053]
本发明的有益效果为:
[0054]
本发明该方法从多条消息出发,结合演化博弈论的合作与竞争思想,提出了一种基于多消息和多维复合博弈的谣言传播控制方法,该方法通过考虑多条消息之间的促进和抑制关系来描述真实传播环境,对多条消息传播空间进行表示学习,建立一种基于多消息和多维复合博弈的谣言传播模型,同时,为了提高模型的精度,本发明定义了一种新的模型训练损失函数来学习得到每个类的权值,修改样本数据的权重,提高小样本的权重,降低大样本的权重,来缓解数据样本不平衡的问题;通过该模型,系统可以分析出谣言话题的传播趋势,将本发明应用于社交网络中信息传播预测和控制,针对负面信息或谣言,舆情部门可以更及时和精确的对其进行监控和管理,并在合理的时间进行引导和抑制,阻止谣言的传播。
附图说明
[0055]
图1为本发明中基于多消息多维复合博弈的谣言传播模型;
[0056]
图2为本发明中用户转发预测示例;
[0057]
图3为本发明中多消息谣言-辟谣博弈驱动机制。
具体实施方式
[0058]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0059]
一种基于多消息和多维复合博弈的谣言传播控制方法,如图1所示,所述方法包括:获取数据信息,获取的信息包括话题信息和用户信息,对话题数据信息和用户数据信息进行预处理;将预处理后的数据信息输入到基于多消息和多维复合博弈的谣言传播模型中,预测用户传播谣言的趋势;根据预测的用户谣言传播趋势对谣言传播的用户进行控制,阻止谣言的传播。
[0060]
获取话题数据信息和用户数据信息的方式可以是利用网络爬虫从公开的数据网站或成熟的社交网络获取,也可以是从成熟的社交网络的公共api进行获取。获取的数据是多个谣言-辟谣话题在其生命周期内的所有参与者的行为记录、话题参与记录和消息转发情况;其中,话题参与者的行为记录包括该用户历史上所转发和评论的信息;话题参与记录包括话题被转发和评论的时间、参与用户的基本信息和参与用户的好友关系信息,所述用户的好友关系信息包括关注和被关注信息。
[0061]
对获取的话题数据信息和用户数据信息进行预处理,包括:
[0062]
步骤1:对获取的话题信息和用户信息进行数据清洗;通常获取的原始数据都是非结构化的,不能直接用于数据分析;通过简单的数据清洗可以使大部分非结构化数据结构化,使得异常值或空值不再出现,减少对于后续计算带来的不便。
[0063]
步骤2:存储清洗后的数据;优选的,使用数据库对清洗后的数据进行存储,通过表结构对数据进行进一步的规范化,同时通过数据库还能够极大的提高数据的检索效率以及表间关系的映射。
[0064]
采用基于多消息和多维复合博弈的谣言传播模型对预处理后的数据信息进行处理的过程包括:
[0065]
s1:提取预处理后的数据信息的相关属性;该相关属性包括用户内容兴趣特征、用户活跃度、消息活跃度和用户结构特征;根据用户内容兴趣特征和用户结构特征构建特征矩阵;
[0066]
s2:利用用户活跃度和消息活跃度计算消息影响力;
[0067]
s3:采用基于消息影响力的多维复合博弈算法计算转发多消息的驱动力;
[0068]
s4:将转发多消息的驱动力融入用户结构特征中的多消息网络拓扑边权中,对多消息网络边权进行重构,获得多维演化博弈后的用户结构特征,根据多维演化博弈后的用户结构特征构建邻接矩阵;
[0069]
s5、将特征矩阵和邻接矩阵输入到建立的基于图神经网络模型构建的谣言传播模型中,预测用户传播谣言的趋势。
[0070]
提取用户兴趣特征的过程包括:
[0071]
在实际生活中,用户选择转发一条消息一般是根据自己的兴趣和立场去转发,用
户历史发表的内容不仅代表了用户对话题的观点,还代表了用户的兴趣爱好,从用户发布的历史内容出发,将用户的内容兴趣特征表示成低维稠密的向量,本发明使用doc2vec方法使传播节点的表示学习中包含用户的兴趣特征。
[0072]
将用户的内容兴趣特征表示成低维稠密的向量过程为:
[0073]
首先对用户转发消息的每个段落进行jieba分词,词性标注,并对部分无效词汇进行过滤,得到段落候选的关键字,即获得用户转发消息的候选关键词;然后计算候选关键词节点权重,并根据权重降序排列;之后根据用户活跃度设置阙值,根据设置的阈值筛选出权重高的top-k个关键词关键词,top-k表示k个权重高的关键词,活跃度高或者粉丝数量多的用户选取关键词多,反之亦然;最后利用doc2vec算法将每个用户文本段落标识即用户id映射到向量空间中,将每个用户筛选出的关键词映射成词向量,该向量为用户内容兴趣特征向量。
[0074]
用户内容兴趣特征向量的公式如下:
[0075]
xa=n
×
fa(u)
[0076]
其中n是传播空间的用户数量,fa(u)为每个用户的内容兴趣特征维度,内容兴趣特征维度是根据doc2vec算法中设置的维度得到的,一般尽量保证低位又不丢失词与词之间的特征。
[0077]
提取用户结构特征的过程包括:
[0078]
真实的网络环境是复杂且庞大的,影响用户转发的因素不仅与消息的内容是否符合转发人的兴趣和立场有关,还可能受到外界言论的影响,所以谣言的传播不仅仅跟一个用户有关,往往跟一组用户有关,这些用户都是在这条谣言的背景下以复杂的网络结构联系到一起的;本发明设计了一种基于node2vec(半监督学习算法)改进的在多消息下的用户节点网络嵌入算法mm2vec,提出了优化之后的偏置游走策略。
[0079]
对于正在游走的路径,假设当前的节点为ui,前一个结点为ui-1,则下一个节点x的转移概率为
[0080][0081]
其中z是归一化系数,w(ui,x)是点i到点x的边的权重,α(u
i-1
,ui,x)是控制游走策略的偏置,如果两点之间不存在边就不可能转移。
[0082]
其中网络的边权值并不是以用户节点直接关注的点来计算的,而是要通过用户之间的交互程度来决定的。这是因为研究用户和关注节点的交互程度,能够获得用户对此条谣言的谣言传播倾向性。边(ui,x)的权值定义如下:
[0083][0084]
其中,fat(i)表示用户i的所有直接关注集,c(ui,x)表示用户ui转发来自x的消息数量,c(y,m
t
)表示关注节点在t时间内已转发的消息数量,此数量越高,说明ui更容易转发上一节点转发的消息,表示用户ui从所有关注的节点所转发的历史消息总数
量。
[0085]
进一步的,在多消息谣言话题传播网络下,不同的用户节点有着不同的重要程度,同时不同的用户节点对不同谣言话题的影响力也不同,为了控制游走尽量停留在谣言传播影响力大的节点上,利用改进的node2vec算法,即mm2vec算法对用户结构特征进行表示学习,得到用户结构特征;mm2vec算法为对node2vec算法中的游走策略的改进,在游走策略上加上了用户活跃度的影响,具体的游走策略公式为:
[0086][0087]
其中,α(u
i-1
,ui,x)表示游走概率,uvac(x)表示用户x的用户活跃度,uvac(u
i-1
)表示用户u
i-1
的用户活跃度,d(u
i-1
,x)表示用户u
i-1
到用户x的距离,p、q表示超参数,用来引导游走,通过设置不同的p和q,来达到保留不同信息的目的,p越小,越容易跳回上一个节点,q越小,越容易跳到更远的节点。
[0088]
该策略同时考虑了不同谣言话题在此节点的影响力和对下一个用户节点的重要程度。如果一个节点与大量节点相连,这就代表了这些节点有着共同的特征并且此节点对其他节点有很大影响。
[0089]
t时刻的网络可以表示为mm2vec算法的目的是学习得到网络节点u∈(u∪v)
t
在多消息空间中的结构特征向量f(u),mm2vec算法的输入是加权后的网络拓扑,算法的输出是每个节点的向量表示,根据skip-gram方法优化目标函数:
[0090]
max∑
u∈(u∪v)
logpr(n(u)|fb(u))
[0091]
计算获得最终用户结构特征矩阵表示为:
[0092]
xb=n
×
fb(u)
[0093]
其中n代表传播空间的用户数量,fb(u)代表用户u的特征向量。
[0094]
定义用户活跃度uvac(ui)包括:
[0095]
谣言传播的一大特点是活跃度高的消息会造成短时间内消息迅速扩散,也就是说消息的活跃度对于谣言传播具有较大的影响,消息活跃度的整个变化过程代表消息的生命周期,对消息活跃度做出以下定义:
[0096]
mac(mi)=(α*num[fans(u0)] β*num[ret(mi)])*k
[0097]
其中,消息活跃度是用户转发的重要指标,消息发布者的影响力越大以及当前消息的热度越大,消息越活跃,大部分用户由于从众心理越容易转发,num[fans(u0)]代表消息mi发布者的粉丝数量,代表消息发布者的影响力,num[ret(mi)]代表目前消息的转发总数量,代表目前消息的热度,α,β∈[0,1]是可调参数,k代表根据消息从发布到目前时刻的衰变参数,尽可能让消息走势趋于平缓,可取半衰期函数t为当前时刻,t’为消息产生的时刻,w为时间片长度。
[0098]
定义消息活跃度mac(mi)包括:
[0099]
在社交网络消息转发传播的过程中,用户活跃度也对消息的传播有着重要影响,
用户活跃度越高,用户转发倾向越明显,它是影响用户转发的重要因素之一,可以量化用户活跃度,并通过用户活跃度来排除那些从来没有转发习惯的特殊用户,对用户活跃度的定义如下:
[0100][0101]
其中,degree(ui)是此用户的出度与入度之和,|v|是全网节点的总数目。
[0102]
计算消息影响力包括:
[0103]
一条消息的影响力与消息的活跃度和用户的活跃度有关,定义消息影响力为:
[0104]
imp(m)=σ1 σ2uvac(ui) σ3mac(m)
[0105]
其中,imp(m)表示消息m的消息影响力,σ1、σ2、σ3是偏回归系数,由多元线性方程拟合而来,uvac(ui)表示用户ui的用户活跃度,mac(m)表示消息m的消息活跃度。
[0106]
利用多消息复合博弈,引入消息影响力从而计算用户节点ui转发多消息的驱动力包括:
[0107]
在多消息的话题的影响下,用户选择一对谣言辟谣转发,有可能影响自己选择下一对谣言辟谣的转发,因此,用户不仅要与上一个节点的用户进行双人博弈,还要对上一个时间段,自己转发的内容进行博弈。本发明基于演化博弈论的思想,进行多维复合博弈,对网络拓扑中的边权进行重构,假设用户对一对谣言辟谣消息只会转发其中一条消息,当前用户节点与每一个上游用户节点都存在一个双人博弈,在多消息谣言话题下,当前用户节点还可能自己与自己博弈,节点的最终抉择由与所有上游用户节点双人博弈和与自身博弈后的最大收益所决定。多维复合博弈算法为定义当前用户节点转发消息类型与当前用户节点的上游用户节点转发消息类型的不同组合的收益,当前用户转发的上一条消息类型和当前用户转发的当前消息类型的不同组合的收益;根据不同组合的收益、当前用户节点转发不同类型消息的消息影响力和上游用户节点转发不同类型消息的数量计算用户转发不同类型消息的驱动力。用r表示选择转发谣言消息,用a表示选择转发辟谣消息。用f和s分别表示上游用户节点和当前用户节点,用fsmixy表示上游用户节点选择x,此节点选择y时的收益,用ssmixy表示当前用户节点转发的上一条消息为x,转发的当前消息为y时的收益,其中x,y∈(r,a);在多消息谣言话题下,用户节点ui转发多消息的驱动力计算公式为:
[0108][0109][0110]
其中,psuh
mi-r
(ui)表示当前用户节点ui转发谣言消息的驱动力,psuh
mi-a
(ui)表示当前用户节点ui转发辟谣消息的驱动力,imp(m
i-r
)表示当前用户节点ui转发的谣言消息的消息影响力,imp(m
i-a
)表示当前用户节点转发的辟谣消息的消息影响力,fsmirr表示当前用户节点的上游用户节点选择转发谣言消息,当前用户节点选择转发谣言消息的收益,fsmira表示当前用户节点的上游用户节点选择转发谣言消息,当前用户节点选择转发辟谣消息的收益,fsmiaa表示当前用户节点的上游用户节点选择转发辟谣消息,当前用户节点选择转发辟谣消息的收益;fsmiar表示当前用户节点的上游用户节点选择转发辟谣消息,
当前用户节点选择转发谣言消息的收益;ssmirr表示当前用户节点转发的上一条消息为谣言消息,转发的当前消息为谣言消息的收益;ssmira表示当前用户节点转发的上一条消息为谣言消息,转发的当前消息为辟谣消息的收益;ssmiaa表示当前用户节点转发的上一条消息为辟谣消息,转发的当前消息为辟谣消息的收益;ssmiar表示当前用户节点转发的上一条消息为辟谣消息,转发的当前消息为谣言消息的收益;表示上游用户节点ui转发辟谣消息的数量,degree(ui)表示当前用户节点ui的度。
[0111]
将转发多消息的驱动力融入用户结构特征中的多消息网络拓扑边权中,对多消息网络边权进行重构,获得多维演化博弈后的用户结构特征;重构后的多消息网络拓扑边权用来表示不同消息转发结点的关系及相互作用强度,多消息网络拓扑边权的加权思想是,转发驱动力越大,边权越大,将边权映射到-1到1之间,即可以得到t时间段内所有消息的网络拓扑中的所有边权,对多消息网络边权进行重构的边权值为:
[0112][0113]
其中,e(ui,u,mi)表示多消息网络边权的边权值,psuh
mi-a
(ui)表示用户节点ui转发辟谣消息的驱动力,psuh
mi-r
(ui)表示用户节点ui转发谣言消息的驱动力。
[0114]
构建基于图神经网络模型构建的谣言传播模型包括:
[0115]
图卷积神经网络gcn可以以邻接矩阵的形式来获取网络上的节点连接信息和节点的属性信息作为输入,本发明预测的是节点的转发情况,分为三类,分别是转发谣言消息m
i-r
转发辟谣消息m
i-a
,以及不转发消息,本模型的输入为:
[0116]
特征矩阵:x=n
×f(a,b)
,其中n代表传播空间中的用户节点数量,f
(a,b)
是每个节点的输入特征维度,f
(a,b)
=[xa,xb],特征矩阵包含了用户的内容兴趣特征和用户节点的结构特征。
[0117]
邻接矩阵:邻接矩阵通过多维演化博弈后的用户结构特征得到的,此邻接矩阵表示了传播空间中各个节点之间的连接信息。
[0118]
本发明将预处理后的特征矩阵和预处理后的邻接矩阵输入基于图神经网络模型构建的谣言传播模型,并使用带一个中间层dropout层的双层图卷积网络,最后使用softmax函数将图卷积的输出转化为对应分类的不同的概率值,基于图神经网络模型构建的谣言传播模型的公式如下:
[0119][0120]
其中,z表示用户三类标签的概率,三类标签分别为用户转发谣言消息、用户转发辟谣消息和用户不转发消息,x表示特征矩阵,a表示邻接矩阵,f(x,a)表示模型输入为特征矩阵x和邻接矩阵a,表示邻接矩阵加上一个单位矩阵,w(i)为第i层网络的权重,w(i)可通过梯度下降法来训练。
[0121]
在softmax之后的概率值用z=p(r,a,d|ui)表示,具体的定义为:
[0122][0123]
其中,z=p(r,a,d|ui)表示用户ui转发谣言消息,转发辟谣消息和不转发消息的概率,p(r|ui)表示用户ui转发谣言的概率,p(d|ui)表示用户不转发消息的概率,p(a|ui)表示用户转发辟谣消息的概率;r表示谣言消息,a表示辟谣消息,d表示不转发消息。y表示根据概率最终确定此用户转发谣言或辟谣或不转发的结果,当y=0时,用户将不转发待预测消息,当y=1时,用户将转发待预测消息的谣言消息,当y=2时,用户将转发待预测消息的辟谣消息。
[0124]
由于多消息空间传播过程中实际有效数据的不平衡性,这样会导致谣言和辟谣的转发会很难学习到,这是因为有效数据的稀疏性,导致训练后的模型容易过拟合,在大部分用户都是不转发的情况下,对样本小的数据预测精确度过低。因此,为缓解输入到基于图神经网络模型构建的谣言传播模型中数据样本不平衡,定义一个新的模型训练损失函数来学习得到每个类的权值,修改样本数据的权重,提高小样本的权重,降低大样本的权重,来缓解数据样本不平衡的问题,损失函数为:
[0125]
l=-wdylogp(y=0|x)-wrylogp(y=1|x)-waylogp(y=2|x)
[0126][0127][0128][0129]
其中,wd、wr、wa分别代表训练集中不转发消息、转发谣言消息、转发辟谣消息的数量。p(y=i|x)表示网络输出属于标签的预测概率,y是指示变量,如果样本与y类别相同,y=1,否则y=0。
[0130]
本发明从多条消息出发,结合演化博弈论的合作与竞争思想,提出了一种基于多消息和多维复合博弈的谣言传播控制方法,该方法通过考虑多条消息之间的促进和抑制关系来描述真实传播环境,对多条消息传播空间进行表示学习,建立一种基于多消息和多维复合博弈的谣言传播模型,同时,为了提高模型的精度,本发明定义了一种新的模型训练损失函数来学习得到每个类的权值,修改样本数据的权重,提高小样本的权重,降低大样本的权重,来缓解数据样本不平衡的问题;通过该模型,系统可以分析出谣言话题的传播趋势,将本发明应用于社交网络中信息传播预测和控制,针对负面信息或谣言,舆情部门可以更及时和精确的对其进行监控和管理,并在合理的时间进行引导和抑制,阻止谣言的传播。
[0131]
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献