摘要
联邦学习是一种分布式机器学习技术,其解决了深度学习多个数据源之间因为数据隐私而产生的“数据孤岛”问题。由于区块链具有不可篡改和去中心化的特性,其与联邦学习结合的去中心化联邦学习成为了热门研究主题。目前去中心化联邦学习存在数据非独立同分布导致性能下降和模型所有权难以证明的问题,为了解决这两个问题,本文提出了两个方法: 1.针对目前去中心化联邦学习存在训练数据非独立同分布导致的性能下降问题,本文提出一种基于模型相似度的去中心化联邦学习策略,并使用五个联邦学习任务进行测试,分别使用了cnn模型训练fashion-mnist数据集,alexnet模型训练cifar10数据集,TextRnn模型训练THUsnews数据集,Resnet18模型训练SVHN数据集和LSTM模型训练sentiment140数据集。实验结果表明,设计的策略在五个任务非独立同分布的数据下进行去中心化联邦学习,准确率比使用原始去中心化联邦学习策略分别提升2.51%,5.16%,17.58%,2.46%和5.23%。 2.针对目前去中心化联邦学习模型所有权难以证明问题,本文基于黑盒的水印方案,设计一个去中心化联邦学习嵌入水印的策略,并分别使用alexnet模型训练cifar10数据集、Resnet18模型训练SVHN数据集两个联邦学习任务进行实验。实验结果表明,策略生成的水印检测准确率分别为95.4%和86.45%,原任务的准确率仅下降0.33%和2.53%。 最后结合以上两个方法,本文设计了一个基于超级账本的工业缺陷检测去中心化联邦学习系统,用户可以在该系统上完成联邦学习任务的创建和训练,模型水印嵌入和检测等工作,旨在为数间工厂完成工业缺陷检测联邦学习任务提供安全性和便利性。