计算机研究与发展2021,Vol.58Issue(3) :624-637.DOI:10.7544/issn1000-1239.2021.20200319

基于直方图的隐私键-值数据收集算法

Towards Private Key-Value Data Collection with Histogram

张啸剑 徐雅鑫 付楠 孟小峰
计算机研究与发展2021,Vol.58Issue(3) :624-637.DOI:10.7544/issn1000-1239.2021.20200319

基于直方图的隐私键-值数据收集算法

Towards Private Key-Value Data Collection with Histogram

张啸剑 1徐雅鑫 1付楠 1孟小峰2
扫码查看

作者信息

  • 1. 河南财经政法大学计算机与信息工程学院 郑州 450002
  • 2. 中国人民大学信息学院 北京100872
  • 折叠

摘要

基于本地差分隐私的用户数据收集与分析算法已延伸到了键-值数据类型.然而,该类数据值域大小与稀疏性以及本地扰动机制直接制约着收集与分析精度.针对现有机制难以有效应对该类数据收集的不足,提出了一种基于直方图技术的有效收集与分析算法HISKV(histogram-based key-value data collection),该算法首先结合用户分组策略寻找最优截断长度,利用最优截断-抽样技术处理值域过大与稀疏性问题,然后结合截断结果随机抽取单个键-值对进行离散化处理.针对离散化结果,设计一种高效的本地扰动机制LRR KV(local random response for key-value data),该机制结合具体的键分配不同的本地扰动概率.每个用户利用LRR_KV机制扰动离散化的键-值对之后发送给收集者,收集者结合用户的报告值对每个键的频率及其值所对应的均值进行估计.理论分析了HISKV算法的无偏性、所产生的方差以及最大偏差,并与现有的键-值收集算法在真实与合成的数据集上进行比较,实验结果表明HISKV算法优于同类算法.

关键词

本地差分隐私/随机应答机制/键-值数据/频率估计/均值估计

引用本文复制引用

基金项目

国家自然科学基金(61502146)

国家自然科学基金(91646203)

国家自然科学基金(91746115)

国家自然科学基金(62072156)

河南省自然科学基金(162300410006)

河南省科技攻关项目(202102310563)

河南财经政法大学青年拔尖人才资助计划项目()

出版年

2021
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
参考文献量1
段落导航相关论文