首页|基于SMOTE算法和机器学习的网络入侵检测研究

基于SMOTE算法和机器学习的网络入侵检测研究

扫码查看
机器学习在网络入侵检测中的应用已经受到了各界的广泛关注,但是研究者们关注点多在模型选择和参数优化,没有考虑到数据不平衡对检测结果的影响,往往会导致少数类入侵样本的检测效果较差.针对该问题,以SMOTE(synthetic minority oversampling technique)数据再平衡算法为研究重点,分析了网络入侵检测中SMOTE算法对机器学习模型检测效果的影响.具体研究过程为:应用麻省理工大学入侵检测数据KDD99,首先对原始数据进行归一化和*变量处理生成原始训练集,然后以简单抽样的方法降低多数类样本的数量,以SMOTE算法提高少数类样本的数据量,生成再平衡训练集.最后,使用决策树、随机森林、logit(Logistic regression),KNN(k-NearestNeighbor)这几类机器学习模型分别在原始训练集和再平衡数据集进行5折交叉验证.最终试验结果表明,同原始训练集相比,使用平衡数据集进行训练能够在不降低甚至提升多数类样本识别效果的前提下,明显提高少数类样本的识别效果.所以,可以认为SMOTE算法对不平衡样本下的网络入侵检测有显著的提升作用.

Zhang Yang、张阳

展开 >

中国信息安全测评中心,北京 100085 中国

计算机网络安全 入侵检测 数据再平衡算法 机器学习

中国信息安全测评中心

2018年第十一届信息安全漏洞分析与风险评估大会

2018-09-16

江苏无锡

2018年第十一届信息安全漏洞分析与风险评估大会论文集

487-495

2018