首页|基于神经网络热图的对抗样本检测方法

基于神经网络热图的对抗样本检测方法

扫码查看
针对深度神经网络面临对抗攻击威胁的问题,提出一种基于"热图"的对抗样本检测方法.引入"热图"的概念表示处理样本时神经网络的神经活动,将原始样本转换为活动启发式热图;分别将良性样本和对抗样本生成热图,进而训练二元分类器来识别对抗样本.实验结果表明,该方法在面临针对MNIST和CIFAR-10 数据集上的先进对抗攻击方法时,检测精度分别高达99.4%和93.9%.
ADVERSARIAL SAMPLES DETECTING METHOD USING HEATMAP OF NEURAL NETWORKS
Aiming at the problem that deep neural networks(DNN)face the threat of adversarial attacks,this paper proposes an adversarial samples detecting method based on heatmap.The idea of heatmap was proposed to represent the neural activity of a DNN when processing an input sample,and the original sample was transformed into an activity heuristic heatmap.The benign samples and adversarial samples were respectively generated to generate heat maps,and a binary classifier was trained to identify adversarial samples.The experimental results show that the detection accuracy of the proposed method is as high as 99.4%and 93.9%respectively when facing the advanced adversarial attack methods on MNIST and CIFAR-10 datasets.

Deep neural networkHeatmapAdversarial sampleAdversarial samples detectionMachine learning security

王德成、闫龙川、郭永和、赵子岩、朱京、陈晓惠、崔磊、李勇男

展开 >

杭州科技职业技术学院 浙江 杭州 311402

国家电网有限公司电力信息通信系统运行技术重点实验室 北京 100761

国家电网有限公司信息通信分公司 北京 100761

中国科学院信息工程研究所 北京 100093

中国人民公安大学侦查与反恐怖学院 北京 100038

展开 >

深度神经网络 热图 对抗样本 对抗样本检测 机器学习安全

2024

计算机应用与软件
上海市计算技术研究所 上海计算机软件技术开发中心

计算机应用与软件

CSTPCD北大核心
影响因子:0.615
ISSN:1000-386X
年,卷(期):2024.41(12)