针对深度神经网络模型指纹检测的逃避算法

An Evasion Algorithm to Fool Fingerprint Detector for Deep Neural Networks

钱亚冠 ¹何念念 ¹郭艳凯 ¹王滨 ²李晖 ³顾钊铨 ⁴张旭鸿 ⁵吴春明⁶

扫码查看

作者信息

1. 浙江科技学院大数据学院杭州 310023;海康威视&浙江科技学院边缘智能安全联合实验室杭州 310023
2. 海康威视&浙江科技学院边缘智能安全联合实验室杭州 310023
3. 西安电子科技大学网络与信息安全学院西安710071
4. 广州大学网络空间先进技术研究院广州 510006
5. 浙江大学控制科学与工程学院杭州 310058
6. 浙江大学计算机科学与技术学院杭州 310058
折叠

摘要

随着深度神经网络在不同领域的成功应用,模型的知识产权保护成为了一个备受关注的问题.由于深度神经网络的训练需要大量计算资源、人力成本和时间成本,攻击者通过窃取目标模型参数,可低成本地构建本地替代模型.为保护模型所有者的知识产权,最近提出的模型指纹比对方法,利用模型决策边界附近的指纹样本及其指纹查验模型是否被窃取,具有不影响模型自身性能的优点.针对这类基于模型指纹的保护策略,提出了一种逃避算法,可以成功绕开这类保护策略,揭示了模型指纹保护的脆弱性.该逃避算法的核心是设计了一个指纹样本检测器——Fingerprint-GAN.利用生成对抗网络(generative adversarial network,GAN)原理,学习正常样本在隐空间的特征表示及其分布,根据指纹样本与正常样本在隐空间中特征表示的差异性,检测到指纹样本,并向目标模型所有者返回有别于预测的标签,使模型所有者的指纹比对方法失效.最后通过CIFAR-10,CIFAR-100数据集评估了逃避算法的性能,实验结果表明:算法对指纹样本的检测率分别可达95％和94％,而模型所有者的指纹比对成功率最高仅为19％,证明了模型指纹比对保护方法的不可靠性.

关键词

知识产权保护/模型窃取/模型指纹/生成对抗网络/逃避算法

引用本文复制引用

基金项目

国家重点研发计划项目(2018YFB2100400)

国家重点研发计划项目(2018YFB1800601)

国家自然科学基金(61902082)

浙江省重点研发计划项目(2020C01077)

浙江省重点研发计划项目(2021C01036)

浙江省重点研发计划项目(2020C01021)

之江实验室科技预研项目(2018FD0ZX01)

出版年

2021

计算机研究与发展

中国科学院计算技术研究所中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心

影响因子：2.649

ISSN：1000-1239

被引量1

参考文献量1

段落导航