计算机研究与发展2022,Vol.59Issue(7) :1625-1635.DOI:10.7544/issn1000-1239.20210117

最优聚类的k-匿名数据隐私保护机制

k-Anonymous Data Privacy Protection Mechanism Based on Optimal Clustering

张强 叶阿勇 叶帼华 邓慧娜 陈爱民
计算机研究与发展2022,Vol.59Issue(7) :1625-1635.DOI:10.7544/issn1000-1239.20210117

最优聚类的k-匿名数据隐私保护机制

k-Anonymous Data Privacy Protection Mechanism Based on Optimal Clustering

张强 1叶阿勇 2叶帼华 邓慧娜 陈爱民
扫码查看

作者信息

  • 1. 福建师范大学计算机与网络空间安全学院 福州 350117
  • 2. 福建省网络安全与密码技术重点实验室(福建师范大学) 福州 350117
  • 折叠

摘要

基于聚类的k-匿名机制是共享数据脱敏的主要方法,它能有效防范针对隐私信息的背景攻击和链接攻击.然而,现有方案都是通过寻找最优k-等价集来平衡隐私性与可用性.从全局看,k-等价集并不一定是满足k-匿名的最优等价集,隐私机制的可用性最优化问题仍然未得到解决.针对上述问题,提出一种基于最优聚类的k-匿名隐私保护机制.通过建立数据距离与信息损失间的函数关系,将k-匿名机制的最优化问题转化为数据集的最优聚类问题;然后利用贪婪算法和二分机制,寻找满足k-匿名约束条件的最优聚类,从而实现k-匿名模型的可用性最优化;最后给出了问题求解的理论证明和实验分析.实验结果表明该机制能最大程度减少聚类匿名的信息损失,并且在运行时间方面是可行有效的.

关键词

隐私保护/k-匿名/聚类优化/信息损失/数据发布

引用本文复制引用

基金项目

国家自然科学基金(61972096)

国家自然科学基金(61771140)

国家自然科学基金(61872088)

国家自然科学基金(61872090)

福建省高等学校产学合作项目(2022H6025)

出版年

2022
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量9
参考文献量3
段落导航相关论文