一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于垂直分割的差分隐私异构多属性数据发布方法与流程

2022-03-23 00:38:51 来源:中国专利 TAG:

技术特征:
1.一种基于垂直分割的差分隐私异构多属性数据发布方法,其特征在于,包括以下步骤:(1)自适应隐私预算分配:数据拥有者p
i
根据局部数据集d
i
的数据敏感性和隐私属性暴露概率计算隐私预算ε
i
;(2)提出隐树模型参数和结构学习相统一的满足差分隐私的隐树模型学习:数据拥有者p
i
利用隐树模型学习算法构建隐树结构,使构建的τ
i
满足ε
i1-差分隐私,同时基于τ
i
计算的θ
i
满足ε
i2-差分隐私;p
i
将τ
i
和θ
i
发送给第三方,第三方通过隐树模型学习算法构建整合数据集的隐树结构τ,同时更新参数θ;(3)合成数据发布:根据隐树结构τ和加噪θ,采样每个属性的条件分布,生成扰动数据集d',并对外发布。2.根据权利要求1所述的基于垂直分割的差分隐私异构多属性数据发布方法,其特征在于,所述步骤(1)实现过程如下:自适应隐私预算分配参数由数据敏感性sd和隐私属性暴露概率l
pb
两部分组成;两部分组成;其中,sen
attr
表示敏感属性,sen
val
表示敏感属性的值,η和σ分别为数据敏感度和隐私泄露概率的权重,η σ=1,权重的分配由数据拥有者根据具体数据隐私保护要求确定,对不同的隐私保护需求可以调节数据敏感度和隐私泄露概率的权重来进行自适应隐私预算分配,实现不同的隐私保护强度。3.根据权利要求1所述的基于垂直分割的差分隐私异构多属性数据发布方法,其特征在于,步骤(2)所述的隐树模型参数学习实现过程如下:基于双向推理算法计算隐属性y的联合条件分布,当y
j
的孩子节点不是显属性时,β
j
的计算需要从叶节点开始向上传递,计算每个隐属性节点y
j
∈y的β
j
,具体公式如下:其中,{y
c
}是y
j
的孩子节点集合;从根节点开始自上而下推理,计算每个隐属性节点y
j
∈y的α
j
:其中,{y
s
:y
p(s)
=y
p(j)
,y
s
≠y
j
}是y
j
的兄弟节点集合;对于任意隐属性节点y
j
∈y,计算边缘条件分布pr(y
j
,y
p(i)
|x
(n)
):其中,{y
s
:y
p(s)
=y
p(j)
,y
s
≠y
j
}是y
j
的兄弟节点集合;当y
j
的孩子节点为显属性或者y
j
为根节点y
r
时,β
j
和α
j
计算为β
j
=pr(x
in
(j)|y
j
),α
j
=pr(y
j
|x
out
(j)),可以得到条件分布
4.根据权利要求1所述的基于垂直分割的差分隐私异构多属性数据发布方法,其特征在于,步骤(2)所述的隐树模型结构学习实现过程如下:首先初始化隐树结构隐属性集合初始化模型参数将未加入τ
i
的显属性x
j
∈x\τ和隐属性集合y加入候选集合ω,使用指数机制从候选集合ω中选取使模型参数θ
i
的对数似然增量最大的属性对(a
j1
,a
j2
)加入隐树结构τ
i
,若有生成隐属性,同时将隐属性加入集合y;基于更新的隐树结构τ
i
,计算联合条件分布,更新隐树参数θ
i
;重复执行上述隐树结构τ
i
和隐树参数θ
i
的更新操作,直到将初始的平凡树森林合并为一棵隐树。5.根据权利要求1所述的基于垂直分割的差分隐私异构多属性数据发布方法,其特征在于,所述步骤(3)实现过程如下:数据拥有者p
i
根据自适应隐私预算分配参数a
i
计算隐私预算大小ε
i
=a
i
×
ε,并保证隐树参数学习的计算过程满足ε
i-差分隐私保护要求;在本地学习得到隐树结构之后,数据拥有者将隐树结构τ
i
和参数θ
i
发送给第三方;第三方根据接收到隐树森林,学习新的隐树结构τ,同时更新隐树参数θ;利用学习到的隐树的结构τ和参数θ,第三方可以估算原始整合数据的联合分布;根据该联合分布,第三方生成一组新的整合数据;为了保证θ
i
的隐私性,为每个属性在给定其父节点的条件下的概率分布添加拉普拉斯噪声lap((2(d m))/(|d
i
|
·
ε2)),其中概率分布的全局敏感度

f=2/|d
i
|。

技术总结
本发明公开了一种基于垂直分割的差分隐私异构多属性数据发布方法,数据拥有者P


技术研发人员:黄志球 张小玉
受保护的技术使用者:南京航空航天大学
技术研发日:2021.12.10
技术公布日:2022/3/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献