技术新讯 > 电子通信装置的制造及其应用技术 > 一种基于人工智能技术的工业安全防护网关系统的制作方法 > 正文

一种基于人工智能技术的工业安全防护网关系统的制作方法

国知局
2024-08-02 14:52:50

本发明涉及病毒检测，更具体地说，它涉及一种基于人工智能技术的工业安全防护网关系统。

背景技术：

1、安全网关可以有效保护网络资源的安全访问、数据的传输加密和数据的分级分类与威胁检测。

2、但目前一些网络攻击方式可能会将恶意软件的代码分割成多个部分并插入正常的软件安装包内，每部分均是无害的文件或数据，从而躲避安全网关的筛查，从而跟随软件安装包传输至目标系统，通过远程脚本进行重组并运行，并随着正常的软件安装而躲避异常资源调用的检测，从而实现恶意攻击目标系统，目前的安全网关无法对这些分割部分进行识别和判定。

技术实现思路

1、本发明的目的就在于为了解决上述问题而提供一种基于人工智能技术的工业安全防护网关系统。

2、本发明提供了一种基于人工智能技术的工业安全防护网关系统，包括：

3、数据获取模块，用于获取待验证的软件安装包的官方版本；

4、数据预处理模块，用于将待验证的软件安装包与官方版本的软件安装包进行遍历式对比，并筛出异常代码片段，并对所有异常代码片段进行预处理；

5、数据处理模块，用于构建完整代码生成模型，通过完整代码生成模型对所有预处理后的异常代码片段进行处理，并生成一个完整的异常软件代码；

6、危害检测模块，用于对数据处理模块输出的异常软件代码进行危害性检测，若存在危害性，则将待验证的软件安装包删除，若不存在危害性，则将待验证的软件安装包传输至目标系统。

7、一种基于人工智能技术的工业安全防护方法，采用如上述的一种基于人工智能技术的工业安全防护网关系统，包括以下步骤：

8、步骤100、扫描待验证的软件安装包并获取软件的名称、版本号和官方网站链接，访问软件的官方网站并下载相应版本的软件安装包；

9、步骤200、将待验证的软件安装包与官方版本的软件安装包进行遍历式对比，并筛出异常代码片段；

10、步骤300、构建完整代码生成模型，将异常代码片段进行预处理后输入完整代码生成模型来生成一个完整的异常软件代码；

11、步骤400、对生成的异常软件代码进行危害性检测，若存在危害性，则将待验证的软件安装包删除，若不存在危害性，则将待验证的软件安装包传输至目标系统。

12、作为本发明的进一步优化方案，对异常代码片段进行预处理，具体为：

13、将异常代码片段按空格、运算符、标点等符号分割为token，从而将异常代码片段转化为token序列；

14、构建词表,将每个独特的token映射到一个设定的id，每个代码片段表示为一个id序列；

15、构建状态空间，每个状态由当前已生成的异常代码片段的id序列表示，定义初始状态为空序列；

16、构建动作空间，每个动作代表在当前状态下添加一个新的异常代码片段。

17、作为本发明的进一步优化方案，构建完整代码生成模型，具体为：

18、构建异常代码片段的节点图，节点表示异常代码片段中的token，有向边表示两个节点之间的语法和语义关系；

19、采用预训练的打码嵌入模型为每个节点分配一个随机的嵌入向量作为节点初始嵌入向量，将节点信息编码为向量并与节点初始嵌入向量拼接或融合，节点信息包括类型、上下文、位置；

20、将每个节点的邻居节点的嵌入聚合到当前节点；

21、使用前馈神经网络将每个节点的当前嵌入和聚合嵌入进行融合,得到节点的新嵌入；

22、对所有节点的最终嵌入进行池化操作,得到整个图的全局表示；

23、将全局图表示输入到全连接层，输出所有可选动作的q值。

24、作为本发明的进一步优化方案，所述将每个节点的邻居节点的嵌入聚合到当前节点的平均聚合公式为：

25、

26、其中：

27、为节点v在第k层的嵌入向量；

28、n(v)为节点v的邻居节点集合；

29、mean为求平均值的操作；

30、ws为可学习的权重矩阵；

31、σ为非线性激活函数。

32、作为本发明的进一步优化方案，所述使用前馈神经网络将每个节点的当前嵌入和聚合嵌入进行融合,得到节点的新嵌入，具体为：

33、对于节点v,将其当前嵌入hv和聚合嵌入n(v)拼接,然后输入到前馈神经网络中：

34、

35、其中：

36、是节点v在第k层的当前嵌入；

37、n(v)k是节点v邻居节点嵌入的聚合结果；

38、concat是向量拼接操作；

39、ffn是前馈神经网络,通常包含几层全连接层和非线性激活函数。

40、作为本发明的进一步优化方案，训练完整代码生成模型的方法，具体为：

41、初始化经验回放池：

42、用于存储当前状态st,当前动作at,当前奖励rt，下一状态st+1的转移样本；

43、对于每个异常软件代码样本：

44、初始化生成过程,设置当前状态st为空序列；

45、进入循环,重复下面步骤直到生成终止；

46、根据当前状态st,使用完整代码生成模型选择q值最大的动作at(即添加一个新的代码片段)；

47、执行动作at,获得奖励rt和下一状态st+1；

48、将(st,at,rt,st+1)存入经验回放池；

49、从经验回放池中随机采样一批数据；

50、使用q-learning算法的损失函数,更新完整代码生成模型参数；

51、将st更新为st+1,进入下一循环。

52、作为本发明的进一步优化方案，将预处理后的异常代码片段输入完整代码生成模型，生成一个完整的异常软件代码，具体为：

53、初始化生成过程,设置当前状态st为空序列；

54、重复执行以下步骤,直到达到终止条件；

55、使用训练好的完整代码生成模型,基于当前状态st选择q值最大的动作at；

56、执行动作at,将相应代码片段添加到当前生成序列中,得到下一状态st+1；

57、更新当前状态st＝st+1；

58、终止条件是生成序列达到最大长度或输出完整可执行代码或无可选动作；

59、输出完整异常软件代码。

60、一种存储介质，其存储了非暂时性计算机可读指令，当非暂时性计算机可读指令由计算机执行时，能够执行如上述的一种基于人工智能技术的工业安全防护方法中的步骤。

61、本发明的有益效果在于：本发明可有效的对待验证数据包进行危险筛查，通过将插入数据包中的异常代码片段筛出，然后将所有异常代码片段进行预处理后输入完整代码生成模型，通过完整代码生成模型生成最完整的软件代码，并对生成的软件代码进行危害性检测，通过检测结果来判断该待验证数据包是否存在恶意攻击病毒，从而有效的增加了网关对恶意攻击病毒的筛除和拦截，也有效的降低了对一些无害脚本的误判概率。