首页|基于单分类算法的异常行为检测研究

基于单分类算法的异常行为检测研究

张煜琦

基于单分类算法的异常行为检测研究

张煜琦1
扫码查看

作者信息

  • 1. 大连理工大学
  • 折叠

摘要

异常行为指与其他具有显著差异的行为。虽然其数量较少,但在众多领域中都极具研究价值。研究异常行为不仅可以优化现有问题,而且可以发现潜在问题,为后续分析与决策提供良好基础。但同时异常行为也会带来负面影响,若试验前未进行异常行为处理,可能会造成严重的后果。因此,研究检测异常行为的方法具有实际意义。异常行为检测在金融、通信、医疗、生产制造等行业都具有重要作用。虽然目前异常行为检测方法众多,但实际问题中,异常数据往往难以获取,而单分类算法主要是基于正类样本建立模型,找到决策边界,并能够将正类样本和负类样本识别出来,正适用于难以获取异常数据的实际问题。因此,基于单分类算法的异常行为检测研究具有现实意义。 本文主要研究基于单分类算法的异常行为检测。首先给出了异常行为的定义、产生原因以及异常行为的分类,随后对异常行为检测的多种方法进行详细阐述,然后介绍了异常行为检测评价指标与异常行为检测在各领域中的应用。为验证单分类算法的异常行为检测效果,先对单分类算法的起源与进展进行学习,然后重点论述了单类支持向量机、支持向量数据域描述、孤立森林三种常用单分类算法的原理。之后提出两个问题蘑菇毒性异常检测与淋巴状态异常检测,应用本文提出的基于稀疏主成分分析和遗忘算法的创新方法进行特征筛选,对预处理后的数据使用单类支持向量机与孤立森林两种算法建立模型,并判断算法的异常行为检测效果与分类器的泛化性能。试验表明,两种算法均可以将有毒蘑菇及淋巴异常样本检测出来,具有较好的异常检测效果,且泛化性能较好。因此,基于单分类算法的异常行为检测具有实际应用价值和研究前景。

关键词

异常行为检测/单类支持向量机/孤立森林

引用本文复制引用

授予学位

硕士

学科专业

应用统计

导师

张超

学位年度

2021

学位授予单位

大连理工大学

语种

中文

中图分类号

C8
段落导航相关论文