首页|基于深度学习的恶意DGA域名检测技术研究

基于深度学习的恶意DGA域名检测技术研究

黄蔚秋

基于深度学习的恶意DGA域名检测技术研究

黄蔚秋1
扫码查看

作者信息

  • 1. 广东工业大学
  • 折叠

摘要

随着互联网信息技术的快速发展,人们享受到了巨大的便利。但与此同时,网络攻击呈现出惊人的增长趋势,特别是针对互联网用户个人财产安全的恶意攻击,例如僵尸网络和勒索软件。利用僵尸网络发起攻击需要在僵尸主机与命令和控制(Camp;C)服务器之间建立连接,为了使连接更加稳定,攻击者通常使用域名生成算法(DGA)来生成大量恶意域名,通过这些恶意域名建立连接,进行通信。因此,检测DGA域名是防范僵尸网络和保障网络安全的关键步骤。 域名检测技术经历了依赖人工提取特征的机器学习阶段,但由于DGA域名的动态性和随机性,人工提取特征无法跟上DGA域名的更新速度。如今随着深度学习技术在不同领域的广泛应用,域名检测技术也向能够自动提取域名特征的深度学习技术转变,并且检测性能相比机器学习有所提升,但仍然存在着两个问题:一是无论在域名可读性方面,还是字符分布方面,基于单词的DGA域名都与良性域名高度相似,导致现有检测方法对这类域名检测效果不佳;二是相比单一模型,如今在域名检测领域广泛使用的混合模型,虽然检测效果好,但模型的参数量也在大幅增加。针对这两个问题,本文的具体研究工作如下: (1)分析单词DGA域名的组成特征,及其在可读性和字符分布两方面与良性域名的相似性,提出一种结合APCNN和BiGRU-Att的神经网络模型来提高对单词DGA域名的检测性能,一方面利用改进的并行卷积神经网络APCNN来提取单词特征和学习单词之间的组合关系;另一方面利用BiGRU-Att能提取域名中字符的关键信息。一系列实验结果表明:相比于其他四种模型,APCNN-BiGRU-Att模型对基于单词的DGA域名有更好的检测效果、多分类效果和稳定性。 (2)进一步研究单词DGA域名的构成及其组成单词长度分布情况,并对nymiam家族进行统计分析。为了增强模型对多尺度单词特征的学习能力,提出了一种基于深度可分离卷积和ECA注意力机制的域名检测方法。在第三章模型的基础上,一方面利用结合ECA通道注意力机制的并行卷积网络来提取域名的多尺度n-gram特征,为多尺度特征分配权重,同时使用深度可分离卷积来降低参数量和计算量;另一方面仍然利用BiGRU-Att模型来提取域名中字符之间的时序特征。实验结果表明:对比其他五种模型,无论是二分类性能,还是多分类性能,该模型均有更好的表现。同时相比于第三章模型,参数量和计算量也有所下降,提高了检测效率。因此,该模型在分类性能和模型复杂度之间取得更好的平衡。

关键词

网络安全/域名生成/域名检测/卷积神经网络/注意力机制

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

欧毓毅

学位年度

2023

学位授予单位

广东工业大学

语种

中文

中图分类号

TP
段落导航相关论文