在机器学习操作中检测分布外数据样本的制作方法
- 国知局
- 2024-07-31 22:37:07
本公开涉及在机器学习操作中检测分布外数据样本。
背景技术:
1、在一些实现中,使用机器学习模型来生成数据样本的预测结果。例如,机器学习模型可以用在恶意软件检测中,以确定软件代码是否可能包含恶意软件代码,从而引发安全风险。机器学习模型还可用于图像处理,以确定图像数据是否包含某些对象或类似于某些图形。所述机器学习模型还可以用于声音识别中,以确定音频数据的文本。机器学习模型可用于其他应用。
技术实现思路
技术特征:1.一种方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求2所述的方法,还包括:
4.根据权利要求1所述的方法,还包括:
5.根据权利要求1所述的方法,其中所述生产数据样本是软件代码,并且所述预测结果指示所述软件代码是否具有恶意软件的风险。
6.根据权利要求1所述的方法,其中所述第一机器学习模型的所述一个或多个神经元根据所述一个或多个神经元的重要性等级而被确定。
7.根据权利要求1所述的模型,其中所述预激活数据是包括所述一个或多个神经元的经扁平化的预激活张量的向量。
8.一种计算机可读介质,所述计算机可读介质包括指令,所述指令在被执行时使计算设备执行操作,所述操作包括:
9.根据权利要求8所述的计算机可读介质,所述操作还包括:
10.根据权利要求9所述的计算机可读介质,所述操作还包括:
11.根据权利要求8所述的计算机可读介质,所述操作还包括:
12.根据权利要求8所述的计算机可读介质,其中所述生产数据样本是软件代码,并且所述预测结果指示所述软件代码是否具有恶意软件的风险。
13.根据权利要求8所述的计算机可读介质,其中所述第一机器学习模型的所述一个或多个神经元根据所述一个或多个神经元的重要性等级而被确定。
14.根据权利要求8所述的计算机可读介质,其中所述预激活数据是包括所述一个或多个神经元的经扁平化的预激活张量的向量。
15.一种计算机实现的系统,包括:
16.根据权利要求15所述的计算机实现的系统,所述操作还包括:
17.根据权利要求16所述的计算机实现的系统,所述操作还包括:
18.根据权利要求15所述的计算机实现的系统,所述操作还包括:
19.根据权利要求15所述的计算机实现的系统,其中所述生产数据样本是软件代码,并且所述预测结果指示所述软件代码是否具有恶意软件的风险。
20.根据权利要求15所述的计算机实现的系统,其中所述第一机器学习模型的所述一个或多个神经元根据所述一个或多个神经元的重要性等级而被确定。
技术总结本公开的实施例涉及在机器学习操作中检测分布外数据样本。系统、方法和软件可用于检测机器学习操作的生产数据样本的分布评估。在某些方面,一种方法包括:从第一机器学习模型接收预激活数据,其中预激活数据包括第一机器学习模型的一个或多个神经元的预激活信息,并且预激活数据在第一机器学习模型处理生产数据样本以生成预测结果时获取;使用第二机器学习模型来处理预激活数据以生成分布评估;以及基于分布评估来确定其中生产数据样本是对抗数据样本还是漂移数据样本。技术研发人员:A·阿米里受保护的技术使用者:黑莓有限公司技术研发日:技术公布日:2024/7/25本文地址:https://www.jishuxx.com/zhuanli/20240730/193868.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。