首页|基于联邦学习的多源数据用户画像研究与应用

基于联邦学习的多源数据用户画像研究与应用

陈晶

基于联邦学习的多源数据用户画像研究与应用

陈晶1
扫码查看

作者信息

  • 1. 贵州大学
  • 折叠

摘要

用户画像是一种能够深度挖掘海量数据中潜在价值的分析手段,在辅助决策、广告投放、行为预测等场景中有着广泛应用。中小微型企业因缺少足够数据特征而寻求画像合作,面临着跨区域异构数据难以整合、数据隐私安全难以保证等问题。联邦学习是一种能够在数据不出域的情况下完成多参与方联合训练的分布式机器学习框架,能够较好的解决用户画像联合训练中数据合法合规使用的难题。基于此,在传统画像方案中引入联邦学习机制,并针对联邦学习框架存在的隐私泄露风险,结合差分隐私和秘密共享技术进一步研究了隐私加固方案,最后设计并实现了系统核心功能。具体研究内容如下: (1)提出基于联邦学习的多源数据用户画像设计方案。针对中小微型企业在画像合作中面临的异构数据资源难以整合、数据隐私安全难以保证等问题,提出了一种基于联邦学习的多源数据用户画像设计方案,利用联邦学习的计算机制和隐私求交算法,实现了多源数据共享。实验表明,对比本地画像方案和多源数据画像方案,该方案能够大幅度提高预测精度且具有更高的隐私安全性和算法扩展性。 (2)提出基于差分隐私和秘密共享的多服务器联邦学习方案。针对联邦学习框架中存在的隐私泄露风险,结合差分隐私和秘密共享技术,提出了一种多服务器的联邦学习方案,对本地用户训练的模型添加满足近似差分隐私的噪声,并将加噪后的梯度通过秘密共享协议分发至多个服务器。实验表明,该方案拥有较高的安全性,且相较于明文方案的性能损耗仅为4%左右,对比单个服务器的加密方案,整体的计算开销减少了近53%。 (3)设计并实现系统功能。基于上述方案,设计并实现了基于联邦学习的多源数用户画像系统,通过联合训练模块和画像应用模块满足了多参与方联合画像训练的需求,同时,基于安全协议保证了用户数据的隐私安全。

关键词

用户画像/联邦学习/隐私保护/差分隐私/秘密共享

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

彭长根

学位年度

2023

学位授予单位

贵州大学

语种

中文

中图分类号

TP
段落导航相关论文