基于数据挖掘的后台数据智能监控系统及方法与流程
- 国知局
- 2024-07-31 22:52:09
本申请涉及软件漏洞的智能化监测领域,且更为具体地,涉及一种基于数据挖掘的后台数据智能监控系统及方法。
背景技术:
1、随着信息技术的迅猛发展,计算机软件已经无处不在,深入到人们生活的方方面面。随之而来的是软件规模和复杂性的持续增长,导致软件漏洞的类型和数量不断攀升。这些漏洞不仅在数量上呈现增加趋势,而且在复杂性和多样性上也日益突出,给计算机系统的安全带来了巨大挑战,甚至可能引发严重后果。
2、软件漏洞是指在软件系统或产品的整个生命周期中,由于操作者的疏忽、设计错误、编码缺陷或运行故障等原因而产生的问题。这些漏洞以各种形式存在于软件系统的各个层面和环节。黑客往往利用这些软件缺陷非法进入目标主机,并窃取敏感数据。因此,及时发现设备、应用程序和系统软件中的漏洞,并修补它们,对于确保软件系统的安全稳定运行至关重要。
3、源代码漏洞自动检测是源代码漏洞修复的前提和基础,对于保障软件安全具有重要意义。但是,传统的源代码漏洞检测方法依赖于安全专家手动设计的规则,这种方法存在着两个主要问题:首先,制定规则的过程复杂耗时,需要大量人力资源和专业知识;其次,检测到的漏洞类型受限于事先定义的规则,无法全面覆盖所有可能的漏洞情况。
4、因此,期待一种基于数据挖掘的后台数据智能监控系统及方法,采用粗粒度的漏洞检测和细粒度的漏洞检测相结合的方式对源代码进行检测和分析,以提高检测效率,并且更全面地发现各种类型的漏洞,从而更好地保障软件系统的安全性。
技术实现思路
1、为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于数据挖掘的后台数据智能监控系统及方法,其首先采集待检测源代码的多个代码切片图以及待检测源代码的多个代码语句作为输入数据,接着使用深度学习技术对这些输入数据进行特征提取和分析操作以得到代码漏洞特征向量,然后对所述代码漏洞特征向量进行特征分析和分类以得到用于表示待检测源代码的漏洞类型标签的分类结果。其中,这些漏洞类型标签可以是缓冲区溢出、格式字符串漏洞、sql注入等。这样,根据所述分类结果,能够更准确地了解到漏洞类型,有助于技术人员采取更加针对性的应对措施。这样,有助于提高检测效率,并更好地保障软件系统的安全性。
2、根据本申请的第一方面,提供了一种基于数据挖掘的后台数据智能监控系统,其包括:
3、源代码数据采集模块,用于采集待检测源代码的多个代码切片图以及待检测源代码的多个代码语句;
4、源代码特征获取模块,用于分别对所述待检测源代码的多个代码切片图以及所述待检测源代码的多个代码语句进行特征提取和分析以得到代码切片全局特征向量以及代码上下文语义特征向量;
5、源代码特征融合模块,用于将所述代码切片全局特征向量以及所述代码上下文语义特征向量进行特征融合以得到代码漏洞特征向量;
6、源代码特征分类结果生成模块,用于基于所述代码漏洞特征向量以得到分类结果,所述分类结果用于表示待检测源代码的漏洞类型标签。
7、结合本申请的第一方面,在本申请的第一方面的一种基于数据挖掘的后台数据智能监控系统中,所述源代码特征获取模块,包括:代码切片特征提取单元,用于对所述待检测源代码的多个代码切片图进行特征编码以得到所述代码切片全局特征向量;代码语句特征提取单元,用于对所述待检测源代码的多个代码语句进行特征编码以得到所述代码上下文语义特征向量。
8、根据本申请的第二方面,提供了一种基于数据挖掘的后台数据智能监控方法,其包括:
9、采集待检测源代码的多个代码切片图以及待检测源代码的多个代码语句;
10、分别对所述待检测源代码的多个代码切片图以及所述待检测源代码的多个代码语句进行特征提取和分析以得到代码切片全局特征向量以及代码上下文语义特征向量;
11、将所述代码切片全局特征向量以及所述代码上下文语义特征向量进行特征融合以得到代码漏洞特征向量;
12、基于所述代码漏洞特征向量以得到分类结果,所述分类结果用于表示待检测源代码的漏洞类型标签。
13、结合本申请的第二方面,在本申请的第二方面的一种基于数据挖掘的后台数据智能监控方法中,基于所述代码漏洞特征向量以得到分类结果,所述分类结果用于表示待检测源代码的漏洞类型标签,包括:源代码漏洞特征提取单元,用于将所述代码漏洞特征向量通过基于卷积神经网络模型的代码漏洞特征提取模块以得到代码漏洞分类特征向量;源代码漏洞特征优化单元,用于计算所述代码漏洞分类特征向量的概率权重的等效强度表征以得到优化代码漏洞分类特征向量;源代码漏洞特征分类单元,用于将所述优化代码漏洞分类特征向量通过分类器以得到所述分类结果。
14、与现有技术相比,本申请提供的一种基于数据挖掘的后台数据智能监控系统及方法,其首先采集待检测源代码的多个代码切片图以及待检测源代码的多个代码语句作为输入数据,接着使用深度学习技术对这些输入数据进行特征提取和分析操作以得到代码漏洞特征向量,然后对所述代码漏洞特征向量进行特征分析和分类以得到用于表示待检测源代码的漏洞类型标签的分类结果。其中,这些漏洞类型标签可以是缓冲区溢出、格式字符串漏洞、sql注入等。这样,根据所述分类结果,能够更准确地了解到漏洞类型,有助于技术人员采取更加针对性的应对措施。这样,有助于提高检测效率,并更好地保障软件系统的安全性。
技术特征:1.一种基于数据挖掘的后台数据智能监控系统,其特征在于,包括:
2.根据权利要求1所述的基于数据挖掘的后台数据智能监控系统,其特征在于,所述源代码特征获取模块,包括:
3.根据权利要求2所述的基于数据挖掘的后台数据智能监控系统,其特征在于,所述代码切片特征提取单元,包括:
4.根据权利要求3所述的基于数据挖掘的后台数据智能监控系统,其特征在于,所述代码语句特征提取单元,包括:
5.根据权利要求4所述的基于数据挖掘的后台数据智能监控系统,其特征在于,所述上下文编码器包含转换器。
6.根据权利要求5所述的基于数据挖掘的后台数据智能监控系统,其特征在于,所述源代码特征融合模块,用于:以如下级联公式融合所述代码切片全局特征向量和所述代码上下文语义特征向量以得到代码漏洞特征向量;
7.根据权利要求6所述的基于数据挖掘的后台数据智能监控系统,其特征在于,所述源代码特征分类结果生成模块,包括:
8.根据权利要求7所述的基于数据挖掘的后台数据智能监控系统,其特征在于,所述源代码漏洞特征优化单元,包括:
9.根据权利要求8所述的基于数据挖掘的后台数据智能监控系统,其特征在于,计算所述代码漏洞分类特征向量中各个位置的特征值在所述代码漏洞分类特征向量中的频率以得到分类特征频率统计向量,包括:
10.一种基于数据挖掘的后台数据智能监控方法,其特征在于,包括:
技术总结本申请涉及软件漏洞的智能化监测领域,其具体地公开了一种基于数据挖掘的后台数据智能监控系统及方法,其首先采集待检测源代码的多个代码切片图以及待检测源代码的多个代码语句作为输入数据,接着使用深度学习技术对这些输入数据进行特征提取和分析操作以得到代码漏洞特征向量,然后对所述代码漏洞特征向量进行特征分析和分类以得到用于表示待检测源代码的漏洞类型标签的分类结果。其中,这些漏洞类型标签可以是缓冲区溢出、格式字符串漏洞、SQL注入等。这样,根据所述分类结果,能够更准确地了解到漏洞类型,有助于技术人员采取更加针对性的应对措施。这样,有助于提高检测效率,并更好地保障软件系统的安全性。技术研发人员:万琳受保护的技术使用者:河南畅想星空电子科技有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/195085.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表