一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种集成式的SMOTE算法

2022-08-03 02:08:30 来源:中国专利 TAG:

技术特征:
1.一种集成式的smote算法,其特征在于:包括以下步骤:1)预训练分类器,对于攻击类型中的每个样本的x
i
计算的p
t
值,记为p
ti
;2)对于攻击类型中p
ti
高于p
t
安全值min
p
的样本,将该样本加入p
t
样本集合中;3)对于p
t
样本集合中每一个样本x
i
计算在p
t
样本集合中的k个最近邻样本;4)计算p
t
样本集合中每一个样本x
i
与k近邻样本距离,记为d
ij
;5)对于p
t
样本集合中每一个样本x
i
,计算其与k近邻样本距离之和为d
i
,公式如下:6)计算p
t
样本集合中样本x
i
的密度系数,记为r
i
,公式为:当r
i
越大时,该样本所处的位置攻击类样本的密度越低;当r
i
越大时,该位置的密度越高;其中m
s
表示当前所处p
t
集合样本的数量;7)将p
t
集合中密度系数高于r
i
安全值min
r
的样本加入新集合q8)对于集合q中的每一个样本x
i
,归一化其p
t
值与密度系数r
i
;公式如下:;公式如下:其中,r
min
,r
max
分别是集合q中样本的密度系数最小值与最大值;p
t_max
与p
t_min
分别表示集合q中样本的p
t
的最小值与最大值;9)对于集合q中的每个x
i
,根据两个参数r'
i
和p'
ti
计算合成系数,记为rp
i
,公式如下:公式里的α是[0,1]区间的有理数,它作为一个超参数用来调整基于密度和基于p
t
的关注程度;m
q
表示的是集合q的样本数量;10)计算需要合成的样本总数,公式如下:g=(m
l-m
s
)
×
β其中m
l
为原数据集中多数类样本数量;β是[0,1]区间的有理数;在合成新样本的过程中,β作为超参数来调整合成样本的数量;11)计算集合q中的样本x
i
需要合成的新样本数量,记为g
i
;公式如下:g
i
=g
×
rp
i
对于集合q中每一个样本x
i
,根据g
i
值来合成新的少数类样本。

技术总结
本发明公开了一种集成式的SMOTE算法,该技术方法包括以下步骤,预训练分类器,对于攻击类型中的每个样本的x


技术研发人员:郭红波 张兴兰
受保护的技术使用者:北京工业大学
技术研发日:2022.03.31
技术公布日:2022/8/1
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献