一种用于加密网络流量分类预测的不确定性量化方法与流程
- 国知局
- 2024-08-02 13:56:50
本发明属于网络安全领域,具体涉及一种用于加密网络流量分类预测的不确定性量化方法。
背景技术:
1、随着互联网技术的快速发展,大众网络安全意识不断提升,网络通信的安全性和隐私保护变得越来越重要。网络流量加密技术成为维护通信安全的关键手段之一,针对加密流量进行识别分类的技术也应运而生,机器学习与深度学习模型也被引入网络安全领域用于网络流量研究,随着流量分类研究的不断深入,主流的流量分类方法都能够实现不同类型流量的分类识别,并且都可以得到不错的效果。但是由于机器学习模型在流量分类过程中通常需要对新数据进行预测,流量数据往往存在不确定性与多样性,因此模型的预测结果也会存在不确定性,此时机器学习模型的泛化性能就会比较差。为了能够使模型进行准确预测并适应新的流量数据就必须对模型的预测结果进行不确定性量化分析。
2、当前研究有使用解释人工智能(xai)技术进行网络流量不确定性量化,能通过xai技术研究可解释性、可信度,提供基于样本和全局的解释;有针对网络流量数据的特征描述进行不确定性量化;有将分布外检测(ood)方法用于预测结果的量化分析。但是这些技术都存在着不同的局限性,会出现计算复杂度较高、可解释性与性能权衡、泛化性较低、可信度检验不足等问题,这些问题对于网络流量的不确定量化分析仍然是一个巨大的挑战。且当前阶段研究很少会涉及到流量分类结果的不确定性量化分析,远不像计算机视觉领域中研究深入,因此对于加密网络流量分类领域的不确定性量化研究需要进一步深入,对现有技术进行改进和丰富。
3、本发明提出了一种用于加密网络流量分类预测的不确定性量化方法,旨在针对现有加密网络流量分类模型的预测结果进行不确定性量化分析,研究模型的可解释性与可信度。
技术实现思路
1、(一)要解决的技术问题
2、本发明要解决的技术问题是如何提供一种用于加密网络流量分类预测的不确定性量化方法,以解决网络流量的不确定量化分析的问题。
3、(二)技术方案
4、为了解决上述技术问题,本发明提出一种用于加密网络流量分类预测的不确定性量化方法,该方法包括如下步骤:
5、s1、模型训练预测
6、采用用于加密网络流量分类的机器学习模型进行训练预测;
7、s2、不确定性量化
8、s21、使用已经训练好的机器学习模型对测试样本进行预测,并根据预测结果确定该测试样本所属类别;
9、s22、然后使用核密度估计法计算测试样本与训练数据集样本的密度分布;
10、s23、在得到上述测试样本和训练数据集样本的密度分布后,使用kl散度衡量两个分布间的相似性;
11、s24、使用转换函数将测试样本与训练数据集样本分布的kl散度转换成ood分数;根据ood分数判断应当接受还是否定零假设。
12、(三)有益效果
13、本发明提出一种用于加密网络流量分类预测的不确定性量化方法,本发明提出了一种用于加密网络流量分类预测的不确定性量化方法,能够针对现有加密网络流量分类模型的预测结果进行不确定性量化分析,检测其预测结果的可信度,对现有模型进行性能评估。在预测过程中,该方法能够量化预测结果的不确定性,通过高斯核密度估计和kl散度计算ood分数,衡量分布内与分布外样本之间的相似性与差异性,帮助系统识别并适应新数据,从而提高了模型的扩展性和鲁棒性。本发明提出了用于现有加密网络流量分类机器学习模型的不确定性量化方法,能够针对模型给出的分类预测结果提供预测结果的不确定性量化分析,提高了网络流量分类的可靠性和可解释性。
技术特征:1.一种用于加密网络流量分类预测的不确定性量化方法,其特征在于,该方法包括如下步骤:
2.如权利要求1所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,所述s21之前还包括:在对测试样本的预测结果进行不确定性量化分析前应当确定好零假设和备择假设,零假设和备择假设分别设为:
3.如权利要求2所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,所述s22中,使用了高斯核函数计算核密度分布估计。
4.如权利要求3所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,高斯核函数表示为:
5.如权利要求4所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,所述s22中,xm的高斯核密度分布估计表示为:
6.如权利要求5所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,所述s22中,测试样本点xt的高斯核密度分布估计为:
7.如权利要求6所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,所述s23具体包括:在得到上述测试样本和训练数据集样本的密度分布后,使用kl散度衡量两个分布间的相似性:
8.如权利要求7所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,所述s23还包括:使用归一化技术将kl散度映射到[0,1]区间:
9.如权利要求8所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,所述s24具体包括:使用转换函数将测试样本点与训练数据集样本点分布的kl散度转换成ood分数:
10.如权利要求9所述的用于加密网络流量分类预测的不确定性量化方法,其特征在于,高斯核密度估计用于获得训练数据集样本和测试样本相对于整个流量数据集的概率密度值,kl散度用于衡量训练数据集样本与测试样本分布间的相似性,并将其转换为可解释的离群值分数。
技术总结本发明涉及一种用于加密网络流量分类预测的不确定性量化方法,属于网络安全领域。本发明的方法包括模型训练预测、高斯核密度估计、KL散度计算、OOD分数计算、假设校验等步骤。本发明能够针对现有加密网络流量分类模型的预测结果进行不确定性量化分析,检测其预测结果的可信度,对现有模型进行性能评估。在预测过程中,该方法能够量化预测结果的不确定性,通过高斯核密度估计和KL散度计算OOD分数,衡量分布内与分布外样本之间的相似性与差异性,帮助系统识别并适应新数据,从而提高了模型的扩展性和鲁棒性。本发明提高了网络流量分类的可靠性和可解释性。技术研发人员:苗晓孔,王颖,陈月月,张志斌,魏鹏,刘敬,罗平,李翼宏,陈鹏,上官弋卜,李文博,胡文友受保护的技术使用者:中国人民解放军61660部队技术研发日:技术公布日:2024/7/18本文地址:https://www.jishuxx.com/zhuanli/20240801/241192.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表