摘要
深度神经网络已被成功应用于图像分类,但研究表明深度神经网络容易受到对抗样本的攻击.提出一种移动目标防御方法,通过Bayes-Stackelberg博弈策略动态切换模型,使攻击者无法持续获得一致信息,从而阻断其构建对抗样本.成员模型的差异性是提高移动目标防御效果的关键,将成员模型之间的梯度一致性作为度量,构建新的损失函数进行训练,可有效提高成员模型之间的差异性.实验结果表明,所提出的方法能够提高图像分类系统的移动目标防御性能,显著降低对抗样本的攻击成功率.
基金项目
国家重点研发计划(2018YFB2100400)
国家电网公司总部科技项目(5700-202019187A-0-0-00)
2019年度杭州市领军型创新团队项目()