摘要
流量分类能够精准刻画网络用户的行为模式,实现网络资源的动态管理和利用率的提升。随着互联网应用的普及,个人隐私和信息安全逐渐受到关注,网络安全协议广泛使用促使流量大多以密文形式出现。加密流量无法通过分析有效载荷获得足够的信息,加密流量的统计特征具有一定随机性,上述特性导致传统的流量分类方法无法有效完成分类任务,因此现有研究着力于加密流量分类。 与传统利用原始加密流量数据设计深度学习网络进行数据提取和分类的方法不同,基于视觉的加密网络流量分类将加密流量转化为图像,以图像作为分类基础,很大程度上保证数据安全性和隐私性;使用简单且有效的图像分类算法,能够在提高分类精度的同时减少分类所需时间。现有基于视觉的加密流量分类研究主要存在已知类型加密流量分类准确度低、未知应用类型加密流量无法高效分类两方面的问题。本文针对上述问题,本文提出了基于图像的加密流量高精度识别方法和基于开集识别的未知加密流量分类方法两个解决方案。 针对现有基于视觉的加密流量分类方法,加密流量图像生成过程中选用的特征有限导致加密流量分类准确率低的问题。本文提出了一种基于图像的加密流量高精度识别方法,研究了协同利用时间、空间、协议特征多维度刻画加密流量生成图像的方法;设计了基于卷积神经网络的改进LeNet-5加密流量识别模型。实验结果表明,在ISCX公开数据集分类中本文提出的图像转化方案的常规加密流量行为分类准确率提高了4.2%,应用分类准确率达到99.7%。 针对现有方法分类未知类型加密流量时模型构建复杂,导致分类有效性差的问题。本文提出了一种基于开集识别的未知加密流量分类方法,将计算机视觉开集识别引入加密流量分类领域,快速提取未知类型流量;设计了基于K-Means聚类的未知加密流量分类算法,使用迁移学习进行分类模型更新。理论分析和实验结果表明,该方法在新增不同应用场景下的可行性与实时性。 基于上述研究的技术和方法,设计并实现了一套基于数据视觉化的加密流量分析系统TrafficClass,实现了加密流量上传、分类需求选择、行为分析、应用分析等模块。系统能够根据用户的选择完成对加密流量的数据分析,实现分类结果的可视化,本系统支持了数据中心运维、社区平台等应用场景中的流量监控。