计算机应用与软件2024,Vol.41Issue(12) :146-153.DOI:10.3969/j.issn.1000-386x.2024.12.021

基于神经网络热图的对抗样本检测方法

ADVERSARIAL SAMPLES DETECTING METHOD USING HEATMAP OF NEURAL NETWORKS

王德成 闫龙川 郭永和 赵子岩 朱京 陈晓惠 崔磊 李勇男
计算机应用与软件2024,Vol.41Issue(12) :146-153.DOI:10.3969/j.issn.1000-386x.2024.12.021

基于神经网络热图的对抗样本检测方法

ADVERSARIAL SAMPLES DETECTING METHOD USING HEATMAP OF NEURAL NETWORKS

王德成 1闫龙川 2郭永和 2赵子岩 2朱京 3陈晓惠 4崔磊 4李勇男5
扫码查看

作者信息

  • 1. 杭州科技职业技术学院 浙江 杭州 311402;国家电网有限公司电力信息通信系统运行技术重点实验室 北京 100761
  • 2. 国家电网有限公司信息通信分公司 北京 100761;国家电网有限公司电力信息通信系统运行技术重点实验室 北京 100761
  • 3. 国家电网有限公司信息通信分公司 北京 100761
  • 4. 中国科学院信息工程研究所 北京 100093
  • 5. 中国人民公安大学侦查与反恐怖学院 北京 100038
  • 折叠

摘要

针对深度神经网络面临对抗攻击威胁的问题,提出一种基于"热图"的对抗样本检测方法.引入"热图"的概念表示处理样本时神经网络的神经活动,将原始样本转换为活动启发式热图;分别将良性样本和对抗样本生成热图,进而训练二元分类器来识别对抗样本.实验结果表明,该方法在面临针对MNIST和CIFAR-10 数据集上的先进对抗攻击方法时,检测精度分别高达99.4%和93.9%.

Abstract

Aiming at the problem that deep neural networks(DNN)face the threat of adversarial attacks,this paper proposes an adversarial samples detecting method based on heatmap.The idea of heatmap was proposed to represent the neural activity of a DNN when processing an input sample,and the original sample was transformed into an activity heuristic heatmap.The benign samples and adversarial samples were respectively generated to generate heat maps,and a binary classifier was trained to identify adversarial samples.The experimental results show that the detection accuracy of the proposed method is as high as 99.4%and 93.9%respectively when facing the advanced adversarial attack methods on MNIST and CIFAR-10 datasets.

关键词

深度神经网络/热图/对抗样本/对抗样本检测/机器学习安全

Key words

Deep neural network/Heatmap/Adversarial sample/Adversarial samples detection/Machine learning security

引用本文复制引用

出版年

2024
计算机应用与软件
上海市计算技术研究所 上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心
影响因子:0.615
ISSN:1000-386X
段落导航相关论文