一种基于大语言模型的安全测试方法与流程
- 国知局
- 2024-08-02 14:24:33
本发明涉及人工智能和网络安全领域,具体涉及一种基于大语言模型的安全测试方法;具体地,本发明涉及人工智能、自然语言处理、模型训练及网络攻防等关键技术,旨在提供一种自动化、多样化、隐蔽化、高效化和智能化的安全测试手段,提升网络安全测试能力和网络防御能力。
背景技术:
1、本节中的陈述仅提供与本公开相关的背景信息,并且可能不构成现有技术。
2、随着信息技术的快速发展,网络安全威胁日益突出。“知彼知己,百战不殆”,研究复杂多变的安全测试技术对于提升网络防御能力具有决定性作用。传统的安全测试方法大都基于模版来生成攻击载荷,进而对系统进行安全测试。不过这种方式生成的攻击载荷容易被安全防御机制检测和拦截,难以模拟高度伪装的真实网络攻击载荷,网络系统安全测试的有效性难以保证。
3、以chatgpt为代表的aigc技术赋能了各个技术领域,同样对网络安全领域进行着强烈冲击。不断发展的aigc技术是一把双刃剑,网络防御者可以借助aigc工具增强威胁情报分析能力,分析网络日志和网络流量,这能加速网络防御的响应速度。同样,网络攻击者可以借助aigc工具来进行网络犯罪活动,生成攻击载荷及其他恶意行为。不断发展的数字化形势不仅升级了网络防御的各项能力,也提高了网络威胁的复杂程度,这对安全测试的能力提出了新的挑战。
4、安全测试的关键在于能否模拟真实有效的网络攻击载荷,发现潜在的网络威胁,攻击载荷的有效性和多样性对安全测试起着决定性作用。
5、因此,基于大语言模型的攻击载荷生成技术研究具有重大研究价值。这种方法可以提高攻击载荷的伪装性和隐蔽性,这些攻击载荷具有正常流量相似的语义和语法结构,使其在网络中更难被检测和阻止。
技术实现思路
1、本发明主要针对传统安全测试中的攻击载荷生成方法欠缺多样性和隐蔽性的问题提出解决方案,具体针对以下几个方面的问题提出解决方案:
2、1)如何提升安全测试中的攻击载荷生成效率和多样性;
3、2)如何评估安全测试中的攻击载荷有效性,增强攻击载荷的隐蔽性;
4、3)如何微调模型,来提升安全测试中的攻击载荷生成的灵活性和准确性;
5、因此,本发明旨在提供一种基于大语言模型的安全测试方法,对网络系统进行测试,提升网络安全防御能力,以应对日益复杂的网络安全威胁。
6、本发明的技术方案如下:
7、一种基于大语言模型的安全测试方法,包括:
8、步骤s1:根据攻击场景和目的生成攻击载荷指令;
9、步骤s2:基于攻击载荷指令,调用若干开源大语言模型直接生成攻击载荷;
10、步骤s3:将生成的攻击载荷放入沙箱环境中进行测试,挑选出能够正确执行的有效攻击载荷,形成有效攻击载荷数据集;
11、步骤s4:对有效攻击载荷数据集中的有效攻击载荷进行攻击测试和评估,筛选出高质量攻击载荷,形成高质量攻击载荷数据集;
12、步骤s5:采用高质量攻击载荷数据集,对大语言模型进行微调,使大语言模型的攻击载荷生成能力得到增强。
13、进一步地,所述步骤s2,包括:
14、若大语言模型不能正常输出攻击载荷,则修改大语言模型的prompt提示词,直到大语言模型正常输出为止。
15、进一步地,所述步骤s3,包括:
16、若攻击载荷在沙箱环境执行出错,则将错误信息连同该攻击载荷生成的历史信息共同输入大语言模型进行重新生成。
17、进一步地,所述步骤s4,包括:
18、步骤s41:搭建实际的物理网络环境;
19、步骤s42:基于白噪声的方法,建立网络安全基线;
20、步骤s43:向物理网络环境投入有效攻击载荷;
21、步骤s44:观察网络安全基线是否预警以及预警程度,并根据预警程度,筛选出高质量攻击载荷,形成高质量攻击载荷数据集。
22、进一步地,所述步骤s42,包括:
23、步骤s421:收集正常网络流量数据;
24、步骤s422:模拟随机的网络行为,生成白噪声数据;
25、步骤s423:将生成的白噪声数据与正常网络流量数据合并;
26、步骤s424:基于合并后的数据,建立网络安全基线。
27、进一步地,所述步骤s44,包括:
28、网络安全基线的预警级别,包括:无预警、低级预警、中级预警、高级预警以及紧急预警;根据网络安全基线的预警级别来标记攻击载荷的有效性与隐蔽性,从而筛选出高质量攻击载荷。
29、进一步地,所述步骤s5,包括:
30、步骤s51:将高质量攻击载荷数据集按比例分为训练集、验证集和测试集;
31、步骤s52:选择大语言模型的参数量、微调方法和微调策略;
32、步骤s53:加载相应的参数量,按照选取的微调方法、微调策略以及训练集,对大语言模型进行微调,在微调过程中定期使用验证集来评估大语言模型的性能,根据验证集的表现调整微调策略和参数量;
33、步骤s54:使用测试集来评估最终大语言模型的性能。
34、进一步地,所述步骤s421,包括:
35、使用网络流量监控工具或数据包捕获设备来收集各正常网络活动的数据;所述各正常网络,包括:http、https、ftp、dns。
36、进一步地,所述网络安全基线检测到异常活动时,系统发出警报并采取相应响应措施;所述响应措施,包括:阻止流量、隔离系统。
37、进一步地,所述微调方法,包括:采用全量微调的方法和采用peft技术的方法。
38、与现有的技术相比本发明的有益效果是:
39、1.高自动化:相比传统的网络系统安全测试方法,基于大语言模型的攻击载荷生成方法能够极大地提高安全测试的自动化程度及测试效率。
40、2.全面性:大语言模型具有强大的泛化能力,生成的攻击载荷在结构和内容上具有多样性,提升安全测试的全面性。
41、3.高有效性:采用基于安全基线的方法对攻击载荷的有效性进行评估,能够高度逼真地模拟攻击行为,提供攻击载荷有效性的评价指标,筛选出高有效性的攻击载荷。
42、4.高灵活性:面对日益加强的大语言模型生成内容的安全管控,以高质量攻击载荷数据集来微调模型,提高了攻击载荷生成和安全测试的灵活性。
43、5.提升网络防御能力:生成高逼真和高有效的攻击载荷可以帮助安全团队发现潜在的系统漏洞和安全风险,对安全系统进行修复加固,提升整个系统的安全能力。
技术特征:1.一种基于大语言模型的安全测试方法,其特征在于,包括:
2.根据权利要求1所述的一种基于大语言模型的安全测试方法,其特征在于,所述步骤s2,包括:
3.根据权利要求1所述的一种基于大语言模型的安全测试方法,其特征在于,所述步骤s3,包括:
4.根据权利要求1所述的一种基于大语言模型的安全测试方法,其特征在于,所述步骤s4,包括:
5.根据权利要求4所述的一种基于大语言模型的安全测试方法,其特征在于,所述步骤s42,包括:
6.根据权利要求4所述的一种基于大语言模型的安全测试方法,其特征在于,所述步骤s44,包括:
7.根据权利要求1所述的一种基于大语言模型的安全测试方法,其特征在于,所述步骤s5,包括:
8.根据权利要求5所述的一种基于大语言模型的安全测试方法,其特征在于,所述步骤s421,包括:
9.根据权利要求5所述的一种基于大语言模型的安全测试方法,其特征在于,所述网络安全基线检测到异常活动时,系统发出警报并采取相应响应措施;所述响应措施,包括:阻止流量、隔离系统。
10.根据权利要求7所述的一种基于大语言模型的安全测试方法,其特征在于,所述微调方法,包括:采用全量微调的方法和采用peft技术的方法。
技术总结本发明公开了一种基于大语言模型的安全测试方法,涉及人工智能和网络安全领域,包括:步骤S1:根据攻击场景和目的生成攻击载荷指令;步骤S2:基于攻击载荷指令,调用若干开源大语言模型直接生成攻击载荷;步骤S3:将生成的攻击载荷放入沙箱环境中进行测试,挑选出能够正确执行的有效攻击载荷,形成有效攻击载荷数据集;步骤S4:对有效攻击载荷数据集中的有效攻击载荷进行攻击测试和评估,筛选出高质量攻击载荷,形成高质量攻击载荷数据集;步骤S5:采用高质量攻击载荷数据集,对大语言模型进行微调,使大语言模型的攻击载荷生成能力得到增强。本发明,能够对网络系统进行测试,提升网络安全防御能力,以应对日益复杂的网络安全威胁。技术研发人员:熊坤,孙治,廖珊,王一凡,毛得明,张玲受保护的技术使用者:中国电子科技网络信息安全有限公司技术研发日:技术公布日:2024/7/25本文地址:https://www.jishuxx.com/zhuanli/20240801/242728.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。