基于深度学习的网络流量分类方法研究

孙弘扬¹

扫码查看

作者信息

1. 齐鲁工业大学
折叠

摘要

网络流量分类是确保网络有效管理和增强网络安全防御的关键。近年来，随着动态端口和加密技术的普及，传统的网络流量分类方法的应用范围受到了局限。随着深度学习在时间序列预测和图像处理等领域的成功，如卷积神经网络、循环神经网络等深度学习网络被广泛应用于网络流量分类领域。相较于传统方法，深度学习方法能够从大规模数据集中自动学习特征，降低对人工干预的需求，显著提升网络流量识别和分类的效率及准确率，更加适应当前复杂的网络环境。尽管深度学习技术推动了网络流量分类领域的重大进展，但当前基于深度学习的流量分类方法在捕捉流量数据的长期依赖关系以及区分关键特征方面仍存在局限性。除此之外，数据集中的类不平衡问题也严重影响了分类的效果，少数类样本与多数类样本的分类准确性差异显著。因此，为解决上述问题，本文基于深度学习技术，对网络流量分类方法展开研究，主要研究内容如下: (1)针对现有方法在捕捉流量数据长期依赖关系方面的局限性以及对关键特征区分能力弱的问题，本文提出了一种基于卷积神经网络和注意力机制的网络流量分类方法。该方法中设计的分类模型CA-STCNN，首先通过一维卷积神经网络提取流量数据中的空间特征，捕捉数据的局部相关性，然后利用时间卷积网络进一步提取时序特征，捕捉流量数据中的长期依赖关系;同时，引入通道注意力机制用以对特征通道进行动态加权，提高模型对关键特征的权重分配，降低冗余信息的干扰。为验证分类方法的有效性，本文使用公共数据集ISCX VPN-nonVPN进行流量分类实验，实验结果表明，相较于其他深度学习分类模型，CA-STCNN模型在不同服务类型和应用程序类型的流量分类任务中，具有更高的准确率、精确率、召回率和F1分数。 (2)针对类不平衡网络流量数据集分类效果不佳的问题，本文提出了一种基于生成对抗网络的类不平衡流量分类方法。该方法中设计的数据增强模型SA-CWGAN-GP结合了Wasserstein距离和梯度惩罚，优化传统生成对抗网络的损失函数，以提高真实样本分布与生成样本分布之间差异的测量精度和训练过程的稳定性。同时，该模型通过条件约束，将生成过程转化为有监督学习，从而精确生成特定类别的流量样本。数据增强模型中还引入了自注意力机制，以增强其对长期依赖关系的捕捉能力，从而提高生成流量样本的质量。此外，方法中的分类模型ICNN将Inception模块引入卷积神经网络以更全面地提取流量数据特征。实验中首先对数据高度不平衡的ISCX VPN-App数据集进行数据增强，然后通过分类模型对比分析。实验结果表明，分类模型在少数类上的分类精确率、召回率以及F1分数得到了显著提升，这充分验证了所提出的分类方法在类不平衡网络流量分类任务中的有效性。

关键词

网络流量分类/卷积神经网络/注意力机制/生成对抗网络

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

史慧玲

学位年度

2024

学位授予单位

齐鲁工业大学

语种

中文

中图分类号

段落导航