基于深度学习的网络攻击流量检测与识别关键技术研究

王蕾祺¹

扫码查看

作者信息

1. 中国科学院大学
折叠

摘要

在当前数字化时代，网络已经渗透到人们的生活和工作的各个领域。攻击者利用技术手段来破坏网络安全，催生了多种形式的网络攻击，比如计算机病毒、网络蠕虫、木马、拒绝服务攻击等。随着网络技术不断发展，加密技术被广泛应用，攻击者发起网络攻击的手段也在不断演进，这对网络安全防御提出了更高的要求。基于规则、特征和模式匹的传统网络安全防御手段已经难以应对新型的攻击形式。深度学习作为一种基于数据驱动的学习方法，可以通过对大规模网络流量数据的分析，发掘网络攻击的潜在模式，提高网络安全防御的效率和准确性。攻击检测模型作为防护网络安全的关键，保证检测模型的安全性也是近些年来研究者们十分关注的问题。因此，基于深度学习的网络攻击流量检测与识别是一个非常有前途的研究领域，本文从攻击流量检测、攻击流量识别、模型攻击防御三个方面人手。在实践中，这三个方面联系密切:首先，在网络系统中对存在的攻击流量进行高精确度和高准确度的检测，随后对其产生告警的流量进行攻击识别，以判定具体的攻击类型，为安全人员后续的相应提供依据。同时，为了保证检测结果的可信性，防止模型攻击干扰检测与识别的结果，需要对模型的攻击对抗性进行提升。本文的研究内容和主要创新点如下: 1.针对基于传统机器学习流量检测方法在不平衡数据中识别性能低的问题，提出了基于不平衡网络流量的攻击检测技术。由于网络攻击的出现频率远低于正常行为，实际的网络流量数据是不平衡的。基于不平衡数据训练的机器学习模型对占少数类的攻击行为学习不够充分，导致在检测过程对异常行为识别性能降低。本研究提出了基于不平衡网络流量的攻击检测技术,该检测模型在不平衡流量中可以实现很高的检测性能，并且能够在保证高准确率的情况下，所需的训练数据比深度神经网络少。研究还提出了注意力机制强化的过采样方法。作为一种结合注意机制的创新过采样方法，可以交换样本所携带的特征信息，解决不平衡数据过采样的冗余问题。同时，注意力机制强化的过采样方法可以帮助攻击检测模型在不平衡数据上有更好的表现。 2.针对已有研究在加密流量中特征设计的问题，本研究提出了一种基于时间窗口图的攻击指纹识别方法。由于超过80％的网络流量是加密的，基于规则匹配的方法无法对攻击进行准确识别。基于机器学习的研究只集中在基本的统计特征上，无法获得隐藏在加密流量中的关键攻击行为。更糟糕的是，攻击者不断更新攻击向量以逃避检测，这意味着从历史流量中提取的过时的特征不能识别未见过的攻击。本研究提出了一种基于时间窗口图的攻击指纹识别方法。利用攻击图，该研究从包含关键攻击行为的可疑流量中描绘出攻击受害者主机的交互行为，并且为每一次攻击划分了一个特定的持续时间，以精确地阐述攻击图，其中时间、统计和综合特征被提取来描绘攻击行为。最终利用图神经网络从攻击图谱中挖掘和掌握关键的行为模式，以生成指纹并对攻击进行分类，甚至是未见过的攻击。 3.针对从数据和模型的两个角度的模型后门防御技术结合的问题，本研究提出了基于深度学习的后门对抗技术来防御模型攻击。由于网络流量数据的标签正确性无法直观判断，因此攻击者更容易对数据进行污染，进而影响模型性能。已有的研究分别从数据污染和模型篡改两部分对神经网络后门攻击进行了研究，不足以保证模型的安全型。本研究结合了激活层聚类和剪枝训练两种技术，来防止模型被篡改和攻击。首先，通过激活层聚类技术，将流量特征被映射后的激活层特征进行二维展示，直观地展示网络异常流量的分布情况，并找到被篡改了标签的投毒数据，从而防止攻击者对模型进行投毒。其次，在模型训练过程中加入剪枝技术，在训练过程中随机剪去神经元，降低模型中神经元被投毒样本污染的概率。从数据和模型训练两个角度人手，大幅提升深度学习模型对抗神经网络后门攻击的能力。

关键词

网络流量/攻击检测/攻击识别/深度学习/神经网络后门防御/机器学习

引用本文复制引用

授予学位

博士

学科专业

网络空间安全

导师

黄伟庆

学位年度

2023

学位授予单位

中国科学院大学

语种

中文

中图分类号

段落导航