技术新讯 > 计算推算,计数设备的制造及其应用技术 > 恶意代码识别方法及装置与流程 > 正文

恶意代码识别方法及装置与流程

国知局
2024-08-05 11:49:16

本发明涉及网络安全，特别涉及一种恶意代码识别方法及装置。

背景技术：

1、随着用户对恶意代码的检测时效性要求越来越高，目前由客户端和云端协同进行检测。传统方案中，客户端在进行恶意代码识别时，是通过哈希算法计算文件哈希值，并将哈希值发送给云端，由云端对该哈希值进行查询以确定是否为恶意代码。然而，哈希值非常敏感，文件的微小变化会导致哈希值的巨大不同。攻击者通过对恶意代码进行微小修改来生成变种，从而避免基于哈希值的检测。

2、在相关技术中，通过样本共享机制来解决上述问题。云端接收多个客户端在本地收集的可疑样本实体，对可疑样本实体进行分析，以更新检测规则。但是共享机制涉及将用户的数据发送到云端，容易造成用户隐私和数据安全的问题。

技术实现思路

1、本发明提供了一种恶意代码识别方法及装置，可以解决相关技术中存在的问题。技术方案如下：

2、一方面，提供了一种恶意代码识别方法，所述方法包括：

3、获取客户端中待检测对象的二进制原始数据；所述待检测对象至少包括静态文件和/或动态行为；

4、将所述二进制原始数据输入至预先训练完成的字节嵌入模型中，并获取所述字节嵌入模型针对所述二进制原始数据进行字节编码嵌入后输出的字节嵌入向量；

5、将所述字节嵌入向量发送给云端，以由云端对所述字节嵌入向量进行恶意性识别，并接收云端反馈的恶意性识别结果。

6、另一方面，提供了一种恶意代码识别装置，所述装置包括：

7、数据获取单元，用于获取客户端中待检测对象的二进制原始数据；所述待检测对象至少包括静态文件和/或动态行为；

8、向量获取单元，用于将所述二进制原始数据输入至预先训练完成的字节嵌入模型中，并获取所述字节嵌入模型针对所述二进制原始数据进行字节编码嵌入后输出的字节嵌入向量；

9、通信单元，用于将所述字节嵌入向量发送给云端，以由云端对所述字节嵌入向量进行恶意性识别，并接收云端反馈的恶意性识别结果。

10、另一方面，提供了一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器用于存放计算机程序，所述处理器用于执行所述存储器上所存放的计算机程序，以实现上述所述的恶意代码识别方法的步骤。

11、另一方面，提供了一种计算机可读存储介质，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述所述恶意代码识别方法的步骤。

12、另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述所述的恶意代码识别方法的步骤。

13、本发明提供的技术方案至少可以带来以下有益效果：通过将二进制原始进行字节编码嵌入，以将得到的字节嵌入向量发送给云端进行恶意性识别，本方案相对于直接传输实体数据采用向量的方式传输，不仅数据传输量降低，且传输的字节嵌入向量难以反推出原始数据内容，从而可以降低用户隐私被泄露的风险，提高了数据安全性。

技术特征：

1.一种恶意代码识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，获取待检测对象的二进制原始数据，包括：

3.根据权利要求1所述的方法，其特征在于，在将所述二进制原始数据输入至预先训练完成的字节嵌入模型中之前，还包括：

4.根据权利要求1所述的方法，其特征在于，所述字节嵌入模型为第一llm模型；云端在进行恶意性识别时采用第二llm模型实现；所述第一llm模型和所述第二llm模型具有相同模型结构，且采用联合训练方式进行训练得到；

5.根据权利要求4所述的方法，其特征在于，所述字节嵌入模型的模型结构中不包括分词器结构，在对所述二进制原始数据进行字节编码嵌入过程中不对所述二进制原始数据进行分词处理。

6.根据权利要求1-3中任一所述的方法，其特征在于，云端反馈的所述恶意性识别结果在确定为恶意性时，所述恶意性识别结果还包括：恶意代码家族和核心行为；其中，云端还设置有向量数据库，所述向量数据库中包括多个已知向量以及与多个已知向量一一对应的恶意代码家族和核心行为；

7.一种恶意代码识别装置，其特征在于，所述装置包括：

8.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器用于存放计算机程序，所述处理器用于执行所述存储器上所存放的计算机程序，以实现上述权利要求1-6任一所述方法的步骤。

9.一种计算机可读存储介质，其特征在于，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法的步骤。

10.一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法的步骤。

技术总结本发明公开了一种恶意代码识别方法及装置，属于网络安全技术领域。方法包括：获取客户端中待检测对象的二进制原始数据；所述待检测对象至少包括静态文件和/或动态行为；将所述二进制原始数据输入至预先训练完成的字节嵌入模型中，并获取所述字节嵌入模型针对所述二进制原始数据进行字节编码嵌入后输出的字节嵌入向量；将所述字节嵌入向量发送给云端，以由云端对所述字节嵌入向量进行恶意性识别，并接收云端反馈的恶意性识别结果。本发明不仅数据传输量降低，且传输的字节嵌入向量难以反推出原始数据内容，从而可以降低用户隐私被泄露的风险，提高了数据安全性。技术研发人员：关墨辰,张栗伟,童志明,肖新光受保护的技术使用者：北京安天网络安全技术有限公司技术研发日：技术公布日：2024/8/1