一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于图神经网络的安全事件预测方法、电子设备及存储介质

2023-01-15 06:56:09 来源:中国专利 TAG:


1.本发明属于安全事件风险预测技术领域,具体涉及基于图神经网络的安全事件预测方法、电子设备及存储介质。


背景技术:

2.随着城市化的快速发展,城市面临越来越多的挑战,如环境恶化、交通拥堵和环境安全等。由于安全和日常生活相关,人们非常关心自己所居住环境的安全问题。环境安全和很多因素有关,且与各个因素之间存在潜在的关系。目前,安全预测已经成为机器学习和深度学习热门的研究课题之一。
3.专利公开号为cn108876062b的发明公开的技术方案根据预设区域的预设历史时间段内的历史事件,利用深度学习算法,预测“震源”事件及其个数;将第一子区域的位置参数和“震源”事件个数,代入预建立的正态分布函数中,获取第一子区域中“震源”事件的密度贡献度;以及,将历史事件总个数带入预建立的正态分布函数后,获取第一子区域中“余震”事件的密度贡献度;根据第一子区域“震源”事件的密度贡献度和第一子区域“余震”事件的密度贡献度,确定第一子区域的事件覆盖密度。通过上述方式,可以适应国内城市多中心、社区布局复杂等情况,对国内的不同区域的事件的预测将更加精确。但是该方法仅使用历史事件数据对不同地点的事件发生次数进行统计,并未考虑多种类融合信息对行为的发生可能产生的影响。
4.专利公开号为cn114169659a的发明公开了一种时空风险预测及决策调度方法和装置,包括以下步骤:s100、获取数据资源并建立相应的数据库;s200、进行数据治理,得到输出数据;s300、基于深度学习的ctr预估模型和输出数据,预估待预测路段未来一周的发案概率;s400、基于待预测路段未来一周的发案概率、感受野筛选器、辖区筛选器、热点迁移规则库和历史案事件数据库,进行正则化,得到修正后的待预测路段未来一周发案概率;s500、进行警力调度和巡控路线规划。该发明可以增强预测模型输入的灵活性,提高系统的可迁移性,增强对预测结果的可解释性,增加预估概率修正模块提高了对预测结果修正的灵活性,增加了调度模块简化对预测结果的研判及调度过程。该方法并未考虑除待预测路段外,人与地点间的关系,人与其他关联密切人员间的关系对行为可能产生的潜在影响。
5.面向安全事件风险预测的主要方法有:安全事件数量预测、安全事件热点地区预测等。安全事件数量预测采用线性回归、lstm等机器学习手段来分析已有安全事件数据中的安全事件类型、行为特征、受害者特点、丢失内容、安全事件地点等综合信息,预测可能发生安全事件的区域的未来安全事件数目,其应用场景与本发明专注的个体人员安全事件风险预测并不一致;安全事件热点地区预测通过分析已有安全事件数据对安全事件活动高度集中的区域和地理位置进行预测,但仅分析安全事件数据会忽视安全事件中人员、安全事件地点以及涉事相关人员之间的潜在关系,忽视这些关系在个体人员安全事件风险预测中会导致信息缺失而影响模型预测性能。


技术实现要素:

6.本发明面向个体人员安全事件风险预测这一典型场景,提出基于图神经网络的安全事件预测方法、电子设备及存储介质。
7.为实现上述目的,本发明通过以下技术方案实现:
8.一种基于图神经网络的安全事件预测方法,包括如下步骤:
9.s1、采集人员基本信息数据,gps时空轨迹数据,进行数据清洗,提取融合图节点特征,得到人员节点特征数据,地点节点特征数据;
10.步骤s1的具体实现方法包括如下步骤:
11.s1.1、采集人员基本信息数据,进行数据清洗、特征编码、特征选择,得到woe基本信息编码特征数据,待用;
12.s1.2、采集gps时空轨迹数据,进行数据清洗、去重后,分为时间序列数据、地点序列数据,将时间序列数据处理为时间嵌入特征数据,将地点序列数据处理为地点节点特征数据;
13.s1.3、将步骤s1.1得到的woe基本信息编码特征数据和步骤s1.2得到的时间嵌入特征数据组合,得到人员节点特征数据;
14.s2、根据步骤s1得到人员节点特征数据,地点节点特征数据,构建多维人员信息轨迹融合图;
15.s3、构建基于图神经网络的个体安全事件预测模型;
16.步骤s3的具体构建方法包括如下步骤:
17.s3.1、构建特征投影层;
18.s3.2、构建多关系图注意力层;
19.s3.3、构建语义级注意力层;
20.s3.4、构建分类层;
21.s4、将步骤s2构建的多维人员信息轨迹融合图输入步骤s3的基于图神经网络的个体安全事件预测模型中,进行基于图神经网络的安全事件预测。
22.进一步的,步骤s1.1的具体实现方法包括如下步骤:
23.s1.1.1、采集人员基本信息数据,删除噪声属性和空值率超过50%的属性,得到筛选后的人员基本信息数据,待用;
24.s1.1.2、对步骤s1.1.1得到的筛选后的人员基本信息数据,对属性进行分箱操作,然后使用证据权重指标对个人基本信息数据进行特征编码,第i个箱子中的证据权重woei为:
[0025][0026]
其中,positivei表示划分的第i个箱子中高风险人员的数目,positive
t
表示全部高风险人员的数量,negativei表示划分的第i个箱子中低风险人员的数目,negative
t
表示全部低风险人员的数量;
[0027]
s1.1.3、特征编码步骤结束后,使用woe编码的结果替换人员基本信息数据,并按照如下公式获取个人基本信息编码特征:
[0028]
basic_info(p)=woe(p)={woei} i=1,2,3,

,bins
[0029]
其中,woe(p)表示人员节点p的全部woe编码集合,basic_info(p)表示人员节点p 的人员基本信息编码特征,bins表示对属性进行分箱操作的分箱编号;
[0030]
s1.1.4、通过计算信息价值指标iv进行特征选择,删除iv值小于0.02的特征,得到 woe基本信息编码特征数据,计算公式为:
[0031][0032][0033]
其中,ivi表示第i个箱子的信息价值指标。
[0034]
进一步的,步骤s1.2的具体实现方法包括如下步骤:
[0035]
s1.2.1、采集gps时空轨迹数据,利用time2vec模型提取gps时空轨迹数据中的周期性和非周期性信息数据,并计算时间嵌入特征向量,计算公式为:
[0036][0037]
其中,embtime(pj)[x]表示人员节点p的第j个原始时间记录对应的k 1维嵌入时间向量,设定k=63,x表示嵌入时间向量中第x个元素值,pj表示人员节点p的第j个原始时间记录,ω
x
和φ
x
表示可学习参数;
[0038]
s1.2.2、将步骤s1.2.1得到的时间嵌入特征向量进行聚合,计算全部时间嵌入特征向量的平均值final_embtime(p),计算公式为:
[0039][0040]
s1.2.3、通过计算信息价值指标iv进行特征选择,删除iv值小于0.02的特征,得到时间嵌入特征数据;
[0041]
s1.2.4、采集gps时空轨迹数据,利用skip-gram模型训练地点节点在全部轨迹序列中的嵌入特征以作为地点节点的特征数据,对于节点l,通过最大化预测节点l所在子轨迹序列中前后地点节点集合c(l,t)的概率乘积,计算公式为:
[0042][0043]
其中,h
l
为地点节点l在子轨迹序列中的向量化表示,h'
l
为地点节点l所在子轨迹序列中的某一前后地点节点l’在子轨迹序列中的向量化表示,h'
l
'为地点节点l所在子轨迹序列中的某一前后地点节点l”在子轨迹序列中的向量化表示,l'为包含地点节点l的全部子轨迹序列中的某一其他地点节点。
[0044]
进一步的,步骤s1.3将步骤s1.1得到的woe基本信息编码特征数据和步骤s1.2得到的时间嵌入特征数据组合的计算公式为:
[0045]
per_fea(p)=basic_info(p)||final_embtime(p)
[0046]
其中,||表示连接操作,per_fea(p)表示人员节点p的人员节点特征数据。
[0047]
进一步的,步骤s2的具体实现方法包括如下步骤:
[0048]
s2.1、人员位置层构建:人员位置层包括地点节点和人员节点,通过步骤s1得到人员节点特征数据,地点节点特征数据中采集的人员节点访问过地点节点的记录,将人员节点与地点节点在图中进行连接,表示人员节点与地点节点之间存在信息交互,进行人员位置层构建;
[0049]
s2.2、位置层构建:位置层包括地点节点,根据地点节点特征数据记录中的所有位置作为地点节点连接起来形成轨迹序列,然后将轨迹序列按照每6小时的时间间隔进一步划分为多个子轨迹序列,设定如果同时包含两个不同地点节点的子轨迹序列出现次数不少于三次,则确定地点节点间存在内置语义关系,在图中连接这两个地点节点,进行位置层构建。
[0050]
进一步的,步骤s3的具体构建方法包括如下步骤:
[0051]
s3.1、构建特征投影层:通过基于类型的投影矩阵proj
type
将人员节点特征数据、地点节点特征数据投影到同一特征空间,得到投影至相同特征空间后的节点嵌入特征h'
type
,计算公式为:
[0052][0053]
其中,h
type
表示基于类型的节点嵌入特征,type表示类型,person表示人员,location 表示地点;
[0054]
得到人员基本信息层、人员-地点层、地点-地点层,待用;
[0055]
s3.2、构建多关系图注意力层:
[0056]
s3.2.1、将步骤s3.1得到的人员基本信息层、人员-地点层、地点层分别视为在不同关系下的三张图,对三张图分别进行信息聚合计算,计算公式为:
[0057][0058]
其中,h'i表示经过特征投影层之后的第i个节点的特征嵌入,表示在关系对应图下的图注意力运算,basic information表示人员基本信息层关系,person
‑ꢀ
location表示人员-地点层关系,location-location表示地点-地点层关系;
[0059]
s3.2.2、基于不同位置节点对于人员的重要性不同以及不同位置和人员对位置节点的影响不同,利用注意力机制计算每个邻居节点的重要性,计算公式为:
[0060][0061]
其中,表示关系下节点i的邻居节点j对于中心节点i的重要性系数,σ表示激活函数,表示在关系下的注意力向量,||表示连接操作,表示节点i在关系对应图中的邻居集合,同时包括节点i自身;
[0062]
s3.2.3、通过节点i的邻居节点j的投影特征h'j和步骤s3.2.2得到的来聚合节点信息得到单一关系下的节点i的嵌入表示,而后利用分别独立平行计算的多头注意力
机制,即重复注意力聚合运算k次然后拼接,得到聚合了节点i的人员基本信息层关系、人员-地点层关系、地点-地点层关系三种关系下的节点嵌入计算公式为:
[0063][0064]
s3.3、构建语义级注意力层:针对人员-地点层关系与地点层关系进行注意力运算的同时,通过人员基本信息层关系与人员-地点层进行注意力运算,用于人员节点内不同类型信息的重要性评定,计算公式为:
[0065][0066]
其中,表示不同关系的重要性,w1表示参数矩阵,b1表示偏差,q表示关系级的注意力向量,v表示关系对应图的所有节点;
[0067]
然后通过指数归一化函数计算每个关系的重要性指数att
φ
,计算公式为:
[0068][0069]
最后结合关系的重要性指数和对应的人员节点嵌入综合人员基本关系特征及人员-人员关系特征、人员-地点关系特征,得到最终的人员节点嵌入表示计算公式为:
[0070][0071]
s3.4、构建分类层:将步骤s3.3得到的最终节点嵌入表示输入分类层进行人员节点安全事件风险分类,得到最终人员节点安全事件风险程度分类概率计算公式为:
[0072][0073]
其中,w2表示权重矩阵,b2表示偏差向量。
[0074]
进一步的,进行基于图神经网络的安全事件预测的损失函数设置为真实人员安全事件危险分类yi与预测安全事件风险分类概率之间的交叉损失熵,计算公式为:
[0075][0076]
其中p表示全部人员节点的集合,w表示类别权重,用于应对数据集不平衡问题。
[0077]
电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现所述的一种基于图神经网络的安全事件预测方法的步骤。
[0078]
计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种基于图神经网络的安全事件预测方法。
[0079]
本发明的有益效果:
[0080]
本发明所述的一种基于图神经网络的安全事件预测方法,创新性地提出基于图神
经网络的个体安全事件预测模型,使用多类型的数据考虑其中的融合信息,又通过分析融合信息构建安全事件分子、安全事件发生地点和安全事件时间的内在联系,首先对人员基本信息数据和gps轨迹数据进行预处理,构建人员行为模式图架构;同时针对两类数据进行分析,将人员节点和地点节点特征嵌入图中,得到多维度人员信息轨迹融合图;最后将该融合图送入基于图神经网络的个体安全事件预测模型,给出针对个体人员的安全事件风险是高风险还是低风险。
[0081]
本发明所述的一种基于图神经网络的安全事件预测方法,涉及个体人员安全事件风险预测的相关技术通过对数据拥有方提供的多种类人员相关数据进行分析,得到与人员相关的各种不同类别的信息,反映关注的个体人员在不同方面的特点以及与正常人员可能存在的区别。通过对信息使用安全事件风险预测的相关技术,能够针对性评估关注的个体人员的安全事件风险程度。
[0082]
本发明所述的一种基于图神经网络的安全事件预测方法,提出多维度人员信息轨迹融合图,从社交网络与地点网络两个角度建模人员活动关系,更为全面的分析人员活动规律,提供更丰富的隐含语义信息,提升个体人员安全事件风险预测的准确率。
[0083]
本发明所述的一种基于图神经网络的安全事件预测方法,提出用于多维度人员信息轨迹融合图的节点特征提取方法,能够将人员基本信息和人员活动的gps轨迹中的时空信息有效融合,为分析个体人员安全事件风险提供融合信息特征,更加全面立体的挖掘人员自身的特点以及人员活动规律的特点。
[0084]
本发明所述的一种基于图神经网络的安全事件预测方法,提出基于图神经网络的个体安全事件预测模型,能够判断某一人员近期可能发生安全事件行为的风险是高或者低,辅助专业人员进一步判断该目标人员的危险等级并调整后续可能的针对性措施。
附图说明
[0085]
图1为本发明所述的一种基于图神经网络的安全事件预测方法流程图;
[0086]
图2为本发明所述的多维度人员信息轨迹融合图的节点特征提取流程图;
[0087]
图3为本发明所述的多维人员信息轨迹融合图的示意图;
[0088]
图4为本发明所述的基于图神经网络的个体安全事件预测模型示意图。
具体实施方式
[0089]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施方式,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅用以解释本发明,并不用于限定本发明,即所描述的具体实施方式仅仅是本发明一部分实施方式,而不是全部的具体实施方式。通常在此处附图中描述和展示的本发明具体实施方式的组件可以以各种不同的配置来布置和设计,本发明还可以具有其他实施方式。
[0090]
因此,以下对在附图中提供的本发明的具体实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定具体实施方式。基于本发明的具体实施方式,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他具体实施方式,都属于本发明保护的范围。
[0091]
为能进一步了解本发明的发明内容、特点及功效,兹例举以下具体实施方式,并配
合附图1-附图4详细说明如下:
[0092]
具体实施方式一:
[0093]
一种基于图神经网络的安全事件预测方法,包括如下步骤:
[0094]
s1、采集人员基本信息数据,gps时空轨迹数据,进行数据清洗,提取融合图节点特征,得到人员节点特征数据,地点节点特征数据;
[0095]
针对多维度人员信息轨迹融合图节点特征提取任务,需要两大类分析数据:人员基本信息数据和gps人员活动轨迹数据。前者在各类与“人”相关的机器学习任务中频繁出现,由于其记录了特定人员的个人信息,通过对其进行数据清洗、特征编码、特征选择步骤将原始人员基本信息数据处理成含有人员特定信息的特征,作为信息融合图的人员节点特征的一部分。后者由于存在密集采样的特性,导致gps轨迹数据中一定存在大量的数据冗余情况。举例来说,手机网络信号基站在捕捉到某一用户出现在当前基站范围内的手机信号后,会在几秒钟内记录几次甚至几十次该用户在同一个地方的gps位置记录。然而在数据分析时由于被记录者在几秒钟内根本无法做出可能的危险行动,这些大量的记录仅需要一条就足以说明被记录者出现在了当前地点,因此这种几秒钟内的连续gps轨迹记录徒增数据的复杂程度且没有任何价值,其采样的密集性亦无助于识别被记录者宏观上的时空行为模式。所以需要对gps轨迹进行去重,即只保留一个地方连续时间内的第一个记录。然后将去重后的gps轨迹数据分开成时间序列数据和地点序列数据。其中时间序列数据处理成含有人员活动时间特点的时间嵌入特征,作为信息融合图的人员节点特征的另一部分;地点序列数据直接处理成含有人员活动轨迹特点的地点节点特征,编入信息融合图的地点节点中;
[0096]
步骤s1的具体实现方法包括如下步骤:
[0097]
s1.1、采集人员基本信息数据,进行数据清洗、特征编码、特征选择,得到woe基本信息编码特征数据,待用;
[0098]
进一步的,步骤s1.1的具体实现方法包括如下步骤:
[0099]
s1.1.1、采集人员基本信息数据,删除噪声属性和空值率超过50%的属性,得到筛选后的人员基本信息数据,待用;
[0100]
s1.1.2、对步骤s1.1.1得到的筛选后的人员基本信息数据,对属性进行分箱操作,然后使用证据权重指标对个人基本信息数据进行特征编码,第i个箱子中的证据权重woei为:
[0101][0102]
其中,positivei表示划分的第i个箱子中高风险人员的数目,positive
t
表示全部高风险人员的数量,negativei表示划分的第i个箱子中低风险人员的数目,negative
t
表示全部低风险人员的数量;
[0103]
s1.1.3、特征编码步骤结束后,使用woe编码的结果替换人员基本信息数据,并按照如下公式获取个人基本信息编码特征:
[0104]
basic_info(p)=woe(p)={woei} i=1,2,3,

,bins
[0105]
其中,woe(p)表示人员节点p的全部woe编码集合,basic_info(p)表示人员节点p 的人员基本信息编码特征,bins表示对属性进行分箱操作的分箱编号;
[0106]
s1.1.4、通过计算信息价值指标iv进行特征选择,删除iv值小于0.02的特征,得到 woe基本信息编码特征数据,计算公式为:
[0107][0108][0109]
其中,ivi表示第i个箱子的信息价值指标;
[0110]
s1.2、采集gps时空轨迹数据,进行数据清洗、去重后,分为时间序列数据、地点序列数据,将时间序列数据处理为时间嵌入特征数据,将地点序列数据处理为地点节点特征数据;
[0111]
进一步的,步骤s1.2的具体实现方法包括如下步骤:
[0112]
s1.2.1、采集gps时空轨迹数据,利用time2vec模型提取gps时空轨迹数据中的周期性和非周期性信息数据,并计算时间嵌入特征向量,计算公式为:
[0113][0114]
其中,embtime(pj)[x]表示人员节点p的第j个原始时间记录对应的k 1维嵌入时间向量,设定k=63,x表示嵌入时间向量中第x个元素值,pj表示人员节点p的第j个原始时间记录,ω
x
和φ
x
表示可学习参数;
[0115]
s1.2.2、将步骤s1.2.1得到的时间嵌入特征向量进行聚合,计算全部时间嵌入特征向量的平均值final_embtime(p),计算公式为:
[0116][0117]
s1.2.3、通过计算信息价值指标iv进行特征选择,删除iv值小于0.02的特征,得到时间嵌入特征数据;
[0118]
s1.2.4、采集gps时空轨迹数据,利用skip-gram模型训练地点节点在全部轨迹序列中的嵌入特征以作为地点节点的特征数据,对于节点l,通过最大化预测节点l所在子轨迹序列中前后地点节点集合c(l,t)的概率乘积,计算公式为:
[0119][0120]
其中,h
l
为地点节点l在子轨迹序列中的向量化表示,h'
l
为地点节点l所在子轨迹序列中的某一前后地点节点l’在子轨迹序列中的向量化表示,h'
l
'为地点节点l所在子轨迹序列中的某一前后地点节点l”在子轨迹序列中的向量化表示,l'为包含地点节点l的全部子轨迹序列中的某一其他地点节点;
[0121]
s1.3、将步骤s1.1得到的woe基本信息编码特征数据和步骤s1.2得到的时间嵌入特征数据组合,得到人员节点特征数据;
[0122]
进一步的,步骤s1.3将步骤s1.1得到的woe基本信息编码特征数据和步骤s1.2得
到的时间嵌入特征数据组合的计算公式为:
[0123]
per_fea(p)=basic_info(p)||final_embtime(p)
[0124]
其中,||表示连接操作,per_fea(p)表示人员节点p的人员节点特征数据;
[0125]
s2、根据步骤s1得到人员节点特征数据,地点节点特征数据,构建多维人员信息轨迹融合图,如图2-图3所示;
[0126]
多维度人员信息轨迹融合图是利用人员基本信息数据和gps轨迹数据构建而成,为基于图神经网络的个体安全事件预测模型提供图结构数据的输入。人员基本信息数据记录了特定人员的个人信息;gps轨迹数据记录了人员一段时间的地理空间移动行为,包含人员日常活动中的时间规律和经过地点的空间模式。因此,通过将人员抽象成带有对应特征的人员节点并把人员的行动轨迹用图的形式表现,有利于提取行动轨迹中人员特有的时空信息且能够在图结构中体现轨迹数据的时空耦合性;连接轨迹中关联性强的多个关键地点并将其编码作为地点节点特征保存在地点节点中,在凸显图中人员运动的关键轨迹的同时缩减了gps轨迹记录的庞大数据量,提升了轨迹数据的可分析程度;根据不同人员与不同地点彼此的交互关系将图划分为多层子图,既能保存人员与地点两两间的关联语义信息,也能够为后续个体安全事件预测模型更准确地捕捉利用安全事件人员与安全事件人员、安全事件人员与高危地点、高危地点与高危地点的传播关系提供针对性信息。
[0127]
进一步的,步骤s2的具体实现方法包括如下步骤:
[0128]
s2.1、人员位置层构建:人员位置层包括地点节点和人员节点,通过步骤s1得到人员节点特征数据,地点节点特征数据中采集的人员节点访问过地点节点的记录,将人员节点与地点节点在图中进行连接,表示人员节点与地点节点之间存在信息交互,进行人员位置层构建;
[0129]
构建人员位置层有助于安全事件预测模型利用轨迹信息中不同人员去过的位置信息来搭建由共同位置连接而成的深层次人员关系传播路径,这些路径蕴含了人员-地点-人员的信息交互;进一步的,这些路径的集合形成了人员之间隐性的基于位置的关系网络;
[0130]
s2.2、位置层构建:位置层包括地点节点,根据地点节点特征数据记录中的所有位置作为地点节点连接起来形成轨迹序列,然后将轨迹序列按照每6小时的时间间隔进一步划分为多个子轨迹序列,设定如果同时包含两个不同地点节点的子轨迹序列出现次数不少于三次,则确定地点节点间存在内置语义关系,在图中连接这两个地点节点,进行位置层构建;
[0131]
位置层中沿边连接的各地点节点构成的序列是对应人员经常访问的地点轨迹序列,其中隐含了人员日常行为模式,可用于后续的人员个体安全事件风险预测任务;
[0132]
s3、构建基于图神经网络的个体安全事件预测模型,如图4所示;
[0133]
基于图神经网络的个体安全事件预测模型(multi dimension fusion graph neuralnetwork,mdfgnn)通过使用多维度人员信息轨迹融合图来对关键人员的安全事件风险进行预测。由于人员信息轨迹融合图由人员与地点两种不同的类型的节点和连接各个关系节点的边构建而成,图中蕴含人员节点、地点节点本身的特征信息以及人员和地点两两之间复杂的语义关系:包括人员对地点的访问关系,轨迹地点序列中地点与地点之间可能出现的频繁联系模式关系,以及人员与人员之间隐含的基于位置的社交关系。在这三种不同的关系下,相同的节点拥有不同的相邻节点并且对两节点彼此之间的意义不同。举例
来说:同一人员节点访问过10次的地点节点要比其访问过1次的地点节点对该人员的重要性更高;途径同一地点节点的不同人员节点之间具有的社交关系要比从未去过同一地点节点的人员节点之间的社交关系更强。此外,相较于地点节点仅通过轨迹序列得到其特征,人员节点特征因其包含了人员基本信息和gps轨迹记录中的轨迹时间信息两种不同类型的信息,导致衡量人员节点的内在关系变得更为复杂且困难,进而如何选择融合对预测人员风险有意义的特征同样富于挑战。
[0134]
步骤s3的具体构建方法包括如下步骤:
[0135]
s3.1、构建特征投影层;
[0136]
通过基于类型的投影矩阵proj
type
将人员节点特征数据、地点节点特征数据投影到同一特征空间,得到投影至相同特征空间后的节点嵌入特征h'
type
,计算公式为:
[0137][0138]
其中,h
type
表示基于类型的节点嵌入特征,type表示类型,person表示人员,location 表示地点;
[0139]
得到人员基本信息层、人员-地点层、地点-地点层,待用;
[0140]
特征投影层有利于在同一特征空间下比较人员节点和地点节点携带的不同类型信息并便于进行后续的节点特征聚合传递操作;
[0141]
s3.2、构建多关系图注意力层;
[0142]
通过将人员自身的基本信息独立看作成一层特殊的关系,在这层关系下仅包含人员节点并称之为人员基本信息关系。我们综合以上三种关系分析,目的是方便mdfgnn利用语义级注意力层把人员节点特征中的人员基本信息编码特征和时间嵌入特征以及地点节点特征通过注意力机制有选择性的融合,从特征中剔除冗余数据,进一步提取出对预测人员节点安全事件风险性有用的信息;
[0143]
进一步的,步骤s3.2的构建方法包括如下步骤:
[0144]
s3.2.1、将步骤s3.1得到的人员基本信息层、人员-地点层、地点层分别视为在不同关系下的三张图,对三张图分别进行信息聚合计算,计算公式为:
[0145][0146]
其中,h
′i表示经过特征投影层之后的第i个节点的特征嵌入,表示在关系对应图下的图注意力运算,basic information表示人员基本信息层关系,person
‑ꢀ
location表示人员-地点层关系,location-location表示地点-地点层关系;
[0147]
s3.2.2、基于不同位置节点对于人员的重要性不同以及不同位置和人员对位置节点的影响不同,利用注意力机制计算每个邻居节点的重要性,计算公式为:
[0148][0149]
其中,表示关系下节点i的邻居节点j对于中心节点i的重要性系数,σ表示激活函数,表示在关系下的注意力向量,||表示连接操作,表示节点i在关系对应图中
的邻居集合,同时包括节点i自身;
[0150]
s3.2.3、通过节点i的邻居节点j的投影特征h
′j和步骤s3.2.2得到的来聚合节点信息得到单一关系下的节点i的嵌入表示,而后利用分别独立平行计算的多头注意力机制,即重复注意力聚合运算k次然后拼接,得到聚合了节点i的人员基本信息层关系、人员-地点层关系、地点-地点层关系三种关系下的节点嵌入计算公式为:
[0151][0152]
s3.3、构建语义级注意力层:针对人员-地点层关系与地点层关系进行注意力运算的同时,通过人员基本信息层关系与人员-地点层进行注意力运算,用于人员节点内不同类型信息的重要性评定,计算公式为:
[0153][0154]
其中,表示不同关系的重要性,w1表示参数矩阵,b1表示偏差,q表示关系级的注意力向量,v表示关系对应图的所有节点;
[0155]
然后通过指数归一化函数计算每个关系的重要性指数att
φ
,计算公式为:
[0156][0157]
最后结合关系的重要性指数和对应的人员节点嵌入综合人员基本关系特征及人员-人员关系特征、人员-地点关系特征,得到最终的人员节点嵌入表示计算公式为:
[0158][0159]
s3.4、构建分类层:将步骤s3.3得到的最终节点嵌入表示输入分类层进行人员节点安全事件风险分类,得到最终人员节点安全事件风险程度分类概率计算公式为:
[0160][0161]
其中,w2表示权重矩阵,b2表示偏差向量。
[0162]
s4、将步骤s2构建的多维人员信息轨迹融合图输入步骤s3的基于图神经网络的个体安全事件预测模型中,进行基于图神经网络的安全事件预测;进行基于图神经网络的安全事件预测的损失函数设置为真实人员安全事件危险分类yi与预测安全事件风险分类概率之间的交叉损失熵,计算公式为:
[0163][0164]
其中p表示全部人员节点的集合,w表示类别权重,用于应对数据集类别不平衡问题。
[0165]
具体实施方式二:
[0166]
电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现具体实施方式一所述的一种基于图神经网络的安全事件预测方法的步骤。
[0167]
本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的基于creo 软件的可修改由关系驱动的推荐数据的推荐方法的步骤。
[0168]
所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路 (application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0169]
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0170]
具体实施方式三:
[0171]
计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种基于图神经网络的安全事件预测方法。
[0172]
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的基于creo软件的可修改由关系驱动的建模数据的建模方法的步骤。
[0173]
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram, random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0174]
本发明的关键点和欲保护点为:
[0175]
1、本发明适用于个体人员安全事件风险预测的场景。在该场景中,数据拥有方需要对多种类型的数据分别进行处理,同时针对不同类型的数据分析个体安全事件的多类型相关信息,最后依据以上信息给出对当前人员的安全事件风险预测结果。
[0176]
2、本发明提出了多维度人员信息轨迹融合图。融合图中存在人员位置层以及位置层两种类型的子图,能够帮助数据拥有方既通过人员-位置-人员连接的边构建基于位置的
人员社交关系,又能够通过位置-位置连接的边构建起人员高频活动的地点联系。这一方法从社交网络与地点网络两个角度建模人员活动关系,有助于数据拥有方更为全面的分析人员活动规律,提供更丰富的隐含语义信息,提升个体人员安全事件风险预测的准确率。
[0177]
3、本发明提出的多维度人员信息轨迹融合图的节点特征提取方法,通过编码人员基本信息数据得到的人员基本信息编码特征以及gps轨迹数据中的时间记录得到的时间嵌入特征共同组成人员节点特征;此外通过分析gps轨迹数据中的地点轨迹序列得到地点节点特征。这一方法将人员基本信息和人员活动的gps轨迹中的时空信息有效融合在多维度人员信息轨迹融合图中,为分析个体人员安全事件风险提供了融合信息特征,更加全面立体的挖掘了人员自身的特点以及人员活动规律的特点。
[0178]
4、本发明提出的基于图神经网络的个体安全事件预测模型。该模型考虑到了单类型节点包含多种类型信息的特点,提出了通用的能够捕捉不同关系和节点内不同类型信息的多层次子图框架,并根据个体人员安全事件风险预测场景设计具体层次的子图构建方法。这一模型能够对有关部门关注的目标人员进行预先数据分析并提供可靠的人员安全事件风险预测结果,通过判断某一人员近期可能发生安全事件行为的风险是高或者低,辅助专业人员进一步判断该目标人员的危险等级并调整后续可能的针对性措施。
[0179]
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0180]
虽然在上文中已经参考具体实施方式对本技术进行了描述,然而在不脱离本技术的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本技术所披露的具体实施方式中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本技术并不局限于文中公开的特定具体实施方式,而是包括落入权利要求的范围内的所有技术方案。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献