摘要
函数型数据回归是一种特殊的回归分析,其响应或协变量包含函数型数据,即样本元素为连续函数的数据.函数型数据在医疗保健、社交媒体、传感网络等诸多领域都有重要应用,通常包含一些敏感信息,在回归分析的过程中,不加保护会引起隐私的泄露.针对函数型数据回归分析中缺少隐私保护的问题,提出了一种基于拉普拉斯机制的函数回归的差分隐私保护算法.首先,对响应数据进行降维,将响应函数建模为相互正交的B样条基的张量积,建立函数回归的数学模型;其次,对回归模型的未知参数取值使用惩罚最小二乘法估计,并通过正交基函数的数量控制粗糙度;最后,对估计参数加入服从拉普拉斯分布的噪声扰动,得到最终的回归结果.理论分析和实验表明,函数回归的差分隐私保护算法满足拉普拉斯机制的差分隐私保护,并且随着隐私预算的减小,算法效率越高,在保证数据安全性的同时达到了良好的可用性.