一种群体性行为的预警方法与流程
- 国知局
- 2024-07-31 23:15:08
本发明涉及一种群体性行为的预警方法,属于大数据处理。
背景技术:
1、随着互联网的快速发展和计算能力的不断提升,大量的数据被生成和存储,这些数据中蕴含着的丰富信息成为了一种不可忽视的重要资源,从海量数据中发现隐藏信息,提升数据利用率,实现数据价值,成了近几年的热门研究方向。大数据技术结合社会治理数据的特性和业务背景,对为特殊部门履职过程中尽早发现特定的群体性行为并及时预警提供了便利,同时也有利于维护公共群体安全,进而通过发现预警的方式,对群体性行为进行定位和防控,尽早做到原因排查,根因分析,对于可能造成的后果做到心中有数,做好预防处置措施。
2、现有的群体性行为发现方法也有一些,包括时空聚类、图算法、社交网络分析等方法,多是对单一数据源、单一处理场景、数据可靠性统一的情况下进行处理和分析,主要体现数据本身的特性。然而,随着互联网信息的发展,信息采集技术的不断加强,对被采集设备的种类适配性更多,带来的问题却是数据多且杂,在实战应用过程中会导致对可能造成群体性事件的活动地点以及活动人员定位困难。传统分析方法在应对这种数据维度多、稀疏性比较高的数据情况时,会表现出计算效率低、结果噪音多、效果未达预期等表现欠佳的现象。且由于社会治理数据的特殊性,受限于当前的数据采集技术,在实际操作过程中,采集也会有遗漏率的问题,为了丰富数据,多会采取多方数据互补的方法,尽最大可能的降低数据的稀疏性,同时提升出结果的概率,而这种方法带来的问题就是传统方法在面对多数据源、各数据源可靠性不一致等情况时,很难完成一个特定情况的分析和刻画,难以满足实际业务需求。
3、群体性行为的预警方法,充分结合社会治理数据特点和群体性行为特征,在保证计算效率的同时,精准推荐可能有群体性行为的群体,且能完成数据回溯、数据可信度、群体行为刻画等多方面特征,更大化的过滤杂质,保证数据严谨性,为社会治理业务赋能。该方法除了能有效预警群体性事件,通过对参数的调节,还能适应其它场景下的数据挖掘,比如:同一人员的多种不同设备账号信息的关联等。
技术实现思路
1、本发明的目的在于提供一种群体性行为的预警方法,通过设定业务参数,规范数据处理流程,对社会治理大数据进行数据聚集、回溯和推荐,解决在数据研判过程中遇到的数据来源多、数据杂质多、数据无法聚集、结果无法回溯等问题,解决现有技术存在的效率低、噪音多等问题。
2、本发明目的可以通过以下技术方案实现:
3、一种群体性行为的预警方法,包括以下步骤:
4、s100.明确目标群体,建立目标群体数据库,存储目标群体的初始身份信息;
5、s200.从社会治理数据中关联目标群体的其它身份信息,补充完善目标群体的所有身份信息;
6、s300.根据补充完善的身份信息,从社会治理数据中关联这些身份信息相关的所有能表示该目标某时间在某地方的数据,形成标准化后的轨迹类数据;
7、s400.根据同行场景计算方法,结合群体的业务背景,设定参数,完成目标群体中同行情况的计算;
8、s500.根据同路场景计算方法,结合群体的业务背景和s400的结果,设定参数,完成目标群体中同路情况的计算,得到候选群体;
9、s600.根据设定的评价指标和方法,完成候选群体的群体紧密度计算,对候选群体进行评价、排序、推荐;
10、s700.设定业务参数对候选群体中涉及到的目标满足多次同路的情况进行再次判断,进一步筛选满足业务背景的候选群体,得到精准化后的结果群体,完成群体及群体性行为的挖掘;
11、进一步地,s200中,所述其他身份信息的补充方法包括:从社会治理大数据中,依据初始身份信息,关联所有相关的其它身份信息,并结合数据采集、数据来源、数据质量等因素,为每一种身份信息的可靠程度预设(0.0,1.0]的可信度值。比如:初始身份信息手机号可信度为1.0,其通过社会治理数据关联出来的微信号可信度为0.9等。
12、进一步地,s300中,所述从社会治理数据中关联身份信息相关的所有能表示该目标某时间在某地方的数据,形成标准化后的轨迹类数据的方法包括:
13、s301.对目标群体p中的每个目标p的每个身份信息(ip1,ip2,...,ipn),关联社会治理平台大数据中和轨迹相关的所有信息[(p,ip1,t,d),...],其中p表示目标,ip1表示目标p的第一种身份信息,t表示时间,d表示地点的经纬度;
14、s302.对每个目标的轨迹信息进行数据清洗和校验,如果一个目标的不同身份信息在相近的时间出现在比较远的地方,则依据不同类型身份信息的可信度值,对可信度比较低的轨迹信息作为脏数据进行丢弃处理;
15、s303.按照目标、时间、地点经纬度的方式,形成清洗后的目标轨迹信息列表[(p,t,d),...]。进一步地,s400中,所述根据同行场景的计算方法,结合群体目标业务背景,设定参数,完成群体目标同行情况的计算方法包括:
16、s401.根据业务背景,设置时间半径deltat和空间半径r以及成簇密度n三个参数;
17、s402.对轨迹信息列表进行处理,将数据按时间以天为单位进行分片,每个分片中的数据按时间升序排列;
18、s403.采用滑窗的方式对每个分片的轨迹信息列表进行处理,计算在时间差deltat内,满足任意两个目标id所在地点的距离在r内,则认为满足条件的所有目标id能形成一个簇,得到簇信息如c[(p1,t1,d1),(p2,t2,d2),...],其中p1表示第一个目标,p2表示第二个目标,t和d分别表示对应出现的时间和地点对应的经纬度;
19、s404.形成簇后的每个簇内任意两个目标,认为属于同行关系;
20、进一步地,s500中,所述根据同路场景计算方法,结合群体目标业务背景,设定参数,完成群体目标同路情况的计算,得到候选群体的方法包括:
21、s501.根据业务背景,设置簇间关联个数的参数q,候选群体最少簇的个数η,候选群体中每个目标出现次数占比阈值α;
22、s502.根据同行情况计算出的不同的簇类目标值c,计算同一时间分片下,不同簇之间重复的目标值个数,如果目标值个数大于等于q,则为两个簇建立关联关系;
23、s503.重复以上簇间关系的建立步骤,直到簇间关系稳定,所有能建立关联关系的簇一起,记为簇团cs的集合;
24、s504.计算簇团cs中涉及到的簇c的个数,如果满足个数大于等于η,则保留,否则丢弃;
25、s505.计算簇团cs中涉及的所有目标值p,统计每个目标出现的次数,如果次数大于等于α*簇的个数,则保留该目标在该簇团中,否则丢弃;
26、s506.计算簇团cs中剩余的目标值个数和簇个数,如果剩余目标值个数大于等于q,且簇个数大于等于η,则保留该簇团,记为候选群体;
27、进一步地,s600中,所述评价指标包括:候选群体中包含有簇的个数、候选群体中涉及目标值个数、候选群体中涉及平均每个目标值出现的次数、平均每个簇关联的目标数、平均每个簇中的目标值个数、候选群体中最早时间和最晚时间跨度、候选群体中地点之间的最远距离、簇间最早时间间隔平均值。
28、进一步地,s600中,所述评价指标和方法,根据业务背景和数据质量情况,为每一个评价指标预设权重,计算总权重,作为每个候选群体的紧密度值tn,计算公式为:
29、
30、其中m表示指标序列,w表示权重序列。
31、进一步地,s700中,所述设定参数对候选群体涉及到的目标进行再次判断,方法包括:
32、s701.设定起始时间,总的时间切片数d,要求满足条件的时间切片数d,和紧密度阈值β;
33、s702.根据起始时间和总的时间切片数筛选轨迹数据;
34、s703.计算所有的候选群体在每个时间切片上的表现,得到每个候选群体在每个时间切片上的紧
35、密度值序列[tn1,tn2,...tnd];
36、s704.计算每个候选群体紧密度值序列中,紧密度值大于等于β的次数,当次数大于等于d时,
37、候选群体被作为最终目标筛选出来,且以紧密度大于等于β的次数降序排序。
38、本发明的有益效果:本发明从社会治理大数据入手,首先通过业务背景确定目标群体,建立目标群体数据库,存储目标群体的初始身份信息;然后根据群体的初始身份信息,从社会治理数据中关联补充完善其它所有相关的身份信息;并按照数据采集、数据来源、数据质量等因素,为每一种身份信息的可靠程度预设可信度值;身份信息关联所有的轨迹信息,并对轨迹数据进行清洗、整理,形成每个目标的轨迹信息列表;根据同行场景计算方法,设定业务参数,得到目标簇;根据同路场景计算方法,设定业务参数,得到目标簇团;最后设定参数,从目标簇团中获得精准的最终群体并进行推荐。具体通过设计一种基于社会治理数据的群体性行为预警方法,保证社会治理数据安全性的前提下,通过设置可信度,解决多数据源、各数据源可靠性不一致的问题;通过同行同路的计算方法,解决结果噪音多、效果未达预期的情况;通过设定各种参数调参,解决该方法适应不同类型不同性质的群体性行为发现的情况;基于统计的计算方法,让数据可回溯回查,数据的高效透明流转,解决其它神经网络算法在解决同类问题时出现的数据不透明情况。最终在满足社会治理数据特性的前提下,从海量数据中分析挖掘出有用信息,精炼不同数据源的数据,对数据结果进行提炼整合,从个体行为的蛛丝马迹中发现群体性聚集行为的同时,提高数据推荐的准确率,让数据结果可解释、可依据、可使用,以此解决实际业务需求。除此以外,本发明提出的一种基于社会治理数据的群体性行为预警方法,同样适用于数据研判过程中遇到的,属同一人员不同设备不同账号之间的关联关系的发现问题,明确该人员的一个账号信息,当通过设置参数,查找到其它多个账号信息和该账号信息满足本发明提出的方法时,则可认定这些账号信息可能同属于这一个人,或者说,它们有很密切的关联关系。
本文地址:https://www.jishuxx.com/zhuanli/20240730/196636.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表