一种基于动态免疫网络理论的社交媒体谣言检测方法
- 国知局
- 2024-07-31 23:02:54
本发明属于自然语言处理领域,具体涉及一种基于动态免疫网络理论的社交媒体谣言检测方法、计算机设备、计算机可读存储介质和计算机程序产品。
背景技术:
1、社交媒体谣言检测任务大致有以下几种基本处理方法:基于知识的谣言检测方法、基于文本特征的谣言检测方法以及基于传播特征的谣言检测方法。
2、谣言检测的任务目标是得到源消息的真实性,最直接的方法就是通过源消息的文本内容或者基于已有知识判断它的真实性。基于知识的谣言检测方法通常会使用事实核查的处理过程,该过程旨在从待核查的消息中提取知识,与已知的事实进行比较从而评估消息的真实性。基于文本特征的谣言检测方法可分为基于一般文本特征的和基于潜在文本特征两种方法,分别代表了机器学习时代和深度学习时代的两种主流方法。前者主要着眼于文本中各个层面例如词法、句法等的统计信息,后者则是利用深度神经网络对文本进行编码获取潜在文本特征,然后通过分类器判断消息的真实性。然而,这两种方法有一定局限性:首先,现有的基于知识库的谣言检测方法一般无法实时更新知识,从而也就无法判断源消息中存在、但知识库中不存在的新知识;其次,社交媒体中的消息对内容字数一般有严格的限制,基于文本特征的检测方法单纯依靠几句话的文本内容得到的特征信息往往并不准确。
3、因此,存在另一部分从消息在社交媒体传播过程中形成的传播结构入手检测源消息的真实性的方法。例如,作为现有技术,cn112199608b公开了一种基于网络信息传播图建模的社交媒体谣言检测方法,cn112035669b公开了一种基于传播异质图建模的社交媒体多模态谣言检测方法。在机器学习时代,学者们通常会使用某些特定的指标捕获消息的传播特征,如消息级联中的节点总数、级联深度、级联宽度、级联中所有节点对之间的平均距离。然而,由于工程性过强,逐渐被基于深度学习的方法所取代。rnn网络(recurrent neuralnetwork,循环神经网络)的递归性能够在处理有顺序的数据时考虑到数据之间的时间依赖关系,使得它能够学习到消息在传播过程暗含的传播结构信息。近些年,产生了很多通过图神经网络的方法处理消息级联的传播结构,利用图神经网络优秀的处理非欧空间数据能力挖掘传播特征的方法。
4、然而,上述基于传播特征的方法仍然有一些局限性:首先,现有模型和方法缺乏对社交媒体中潜在用户的建模。他们忽略了在整体舆论环境的影响下,已阅读消息但未在消息级联中发表评论的这部分用户。其次,没有充分考虑不同立场的推文之间、用户之间的潜在影响关系。在传播链较长的消息级联中,现有的大多数方法只考虑了直接连接的推文之间的交互作用,而没有考虑间接连接的推文之间的直接交互作用、以及整个消息级联的舆论环境对某条推文的影响。
技术实现思路
1、本发明的目的是提供一种基于动态免疫网络理论的社交媒体谣言检测方法、计算机设备、计算机可读存储介质和计算机程序产品,能够解决建模时对潜在用户考虑不足、忽略不同立场的推文及用户之间潜在影响关系等问题,实现社交媒体谣言的有效检测。
2、本发明的一个方面提供一种基于动态免疫网络理论的社交媒体谣言检测方法,包括:
3、步骤s1,输入带有一条源推文和多条评论推文的消息级联,利用预训练模型bertweet得到各推文的表示向量,将各推文的表示向量输入到前馈神经网络中,使用函数得到各推文的立场概率分布向量;
4、步骤s2,根据各推文的立场概率分布向量,计算出在每条评论推文发布的时间节点消息级联中各立场的用户数量和评论推文数量;基于动态免疫网络理论计算在每条评论推文发布的时间节点各立场的用户数量的瞬时变化率和各立场的评论推文数量的瞬时变化率;对用户数量的瞬时变化率和评论推文数量的瞬时变化率进行加权相加,获得各立场的每条评论推文的影响力向量;对各立场的每条评论推文的影响力向量和各自的立场概率分布向量进行向量点积运算,得到每条评论推文在消息级联中的最终消息影响力值;将每条评论推文的表示向量乘以各自的最终消息影响力值并与源推文的表示向量相加,得到消息级联的表示向量;
5、步骤s3,将计算得到的消息级联的表示向量输入到前馈神经网络中,利用函数计算得到消息真实性概率分布向量,从而得到谣言检测结果。
6、优选地,在步骤s3中,如下计算得到消息真实性概率分布向量:
7、
8、其中,是消息真实性概率分布向量,是消息级联的表示向量,是与真实性概率分布对应的权重,是与真实性概率分布对应的偏置,
9、
10、其中,是源推文的表示向量,是第条评论推文的表示向量,,是消息级联中评论推文的数量,是第条评论推文在消息级联中的最终消息影响力值,
11、
12、是第条评论推文的影响力向量,是第条评论推文的立场的概率分布向量,,为立场的数量;
13、
14、是在第条评论推文发布的时间节点各立场的评论推文数量,是在第条评论推文发布的时间节点持各立场的用户数量,为各立场的评论推文数量的瞬时变化率矩阵中第行的向量,为各立场的用户数量的瞬时变化率矩阵中第行的向量,和分别是分配给和的系数。
15、优选地,如下计算评论推文数量的瞬时变化率:
16、
17、其中,表示在第条评论推文发布的时间节点立场为的评论推文的数量,表示在第条评论推文发布的时间节点立场为的评论推文的数量的瞬时变化率,是社交媒体网络中立场的种类数量,,为第一场景值,刻画了两条评论推文由于意见冲突而双双失去参考价值的场景,表示在第条评论推文发布的时间节点社交媒体网络对立场为的评论推文的敏感值,为第二场景值,刻画了评论推文由于没有用户注意到而自然消亡的场景,为第三场景值,刻画了用户主动发布评论的场景,()是一个成熟函数,通过计算得到成熟率,表示已经浏览过该消息的用户发布评论的概率,表示在第条评论推文发布的时间节点立场为的用户数量。
18、优选地,如下计算在第条评论推文发布的时间节点社交媒体网络对立场为的评论推文的敏感值:
19、
20、其中,表示立场为的评论推文对立场为的评论推文的亲和力作用值,,表示在第条评论推文发布的时间节点立场为的评论推文的数量,
21、使用隐马尔可夫模型计算:
22、
23、其中,和分别指第条评论推文和第条评论推文的立场。
24、优选地,如下计算用户数量的瞬时变化率:
25、
26、其中,表示在第条评论推文发布的时间节点立场为的用户数量,为第四场景值,刻画了用户不再参与当前讨论的场景,为第五场景值,刻画了新用户因受其他用户影响而参与话题的场景,()是一个增殖函数,通过计算得到增殖率,表示吸引更多人浏览该消息的概率,为第六场景值,刻画了新用户自发参与当前讨论的场景。
27、优选地,如下计算用户数量和评论推文数量:
28、
29、
30、其中是指在第条评论推文发布的时间节点持各立场的推文数量向量,是指在第条评论推文发布的时间节点持各立场的用户数量向量,是指在第条评论推文发布的时间节点持各立场的推文数量向量,是指在第条评论推文发布的时间节点持各立场的用户数量向量,,表示第条评论推文的预测立场概率分布向量,表示将向量的最大值设置为1、其余值设置为0的函数。
31、优选地,在步骤s1中,利用预训练模型bertweet得到各推文的表示向量:
32、
33、
34、其中,是源推文的文本内容,是第条评论推文的文本内容,
35、使用函数得到各推文的立场概率分布向量为:
36、,
37、其中,是与立场概率分布对应的权重,是与立场概率分布对应的偏置。
38、本发明的另一个方面提供一种计算机设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现上述的方法的步骤。
39、本发明的又一个方面提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
40、本发明的又一个方面提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
41、根据本发明上述方面的基于动态免疫网络理论的社交媒体谣言检测方法、计算机设备、计算机可读存储介质和计算机程序产品,能够解决建模时对潜在用户考虑不足、忽略不同立场的推文及用户之间潜在影响关系等问题,实现社交媒体谣言的有效检测。
本文地址:https://www.jishuxx.com/zhuanli/20240730/195773.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。