计算机研究与发展2022,Vol.59Issue(1) :182-196.DOI:10.7544/issn1000-1239.20200701

基于属性分割的高维二值数据差分隐私发布

Differentially Private High-Dimensional Binary Data Publication via Attribute Segmentation

洪金鑫 吴英杰 蔡剑平 孙岚
计算机研究与发展2022,Vol.59Issue(1) :182-196.DOI:10.7544/issn1000-1239.20200701

基于属性分割的高维二值数据差分隐私发布

Differentially Private High-Dimensional Binary Data Publication via Attribute Segmentation

洪金鑫 1吴英杰 1蔡剑平 2孙岚1
扫码查看

作者信息

  • 1. 福州大学数学与计算机科学学院 福州 350108
  • 2. 厦门华厦学院信息与智能机电工程学院 福建厦门 361024
  • 折叠

摘要

通常随着数据集属性维度的增加,高维数据的差分隐私发布方法所需的时间成本和产生的噪声干扰也会随之增大,尤其是对于高维二值数据很容易被过大的噪声所覆盖.因此,针对高维二值数据的隐私发布问题,提出了一种高效且低噪的发布方法PrivSCBN(differentially private spectral clustering Bayesian network).首先,该方法基于Jaccard距离,使用满足差分隐私的谱聚类算法来划分属性集,然后根据划分的结果来进一步分割原始数据集,从而实现数据的降维.其次,该方法基于动态规划思想并结合指数机制,使用满足差分隐私的贝叶斯网络快速构建算法来为每个分割后的子集构建贝叶斯网络.最后,该方法利用条件概率在二值数据上的取值特点,对从贝叶斯网络中提取的条件分布进行加噪,并通过控制贝叶斯网络的最大入度数来减少其产生的噪声大小.通过在3个真实高维二值数据集上的实验,验证了PrivSCBN方法的高效性与可用性.

关键词

差分隐私/高维二值数据发布/贝叶斯网络/属性划分/动态规划/条件分布

引用本文复制引用

基金项目

福建省自然科学基金(2017J01754)

福建省自然科学基金(2018J01797)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量2
参考文献量6
段落导航相关论文