首页|基于深度学习的多变量时序数据异常检测方法研究

基于深度学习的多变量时序数据异常检测方法研究

杨泽宇

基于深度学习的多变量时序数据异常检测方法研究

杨泽宇1
扫码查看

作者信息

  • 1. 齐鲁工业大学
  • 折叠

摘要

随着技术的不断革新和产业结构的持续优化,各行各业纷纷采用传感器来捕捉时序数据,实现对设备的实时监控。通过这种方式能够及时发现设备在运行过程中出现的故障和问题,从而及时采取相应的措施。这使得时序数据异常检测任务成为维护生产效率和确保生产安全的关键。因此,挖掘异常数据背后的潜在规律,对时序数据进行精准而高效的异常检测,已成为一项备受关注的研究课题。 然而,由于传感器获取的数据量呈指数级增长,数据关系也变得愈发错综复杂等原因。在时序数据异常检测领域存在两大难题。其一,在获取时序数据时,由于人为因素、传感器故障等原因。数据中常存在缺失值,这使得模型在检测异常时受到严重干扰。其二,现有的时序数据特征繁杂且数据量大,并且特征之间具有潜在关联性。但现有方法在检测异常时却难以同时捕捉数据中深层次的时间信息和特征关联性,导致异常漏检和误检率较高。针对上述存在的问题,本文对多变量时序数据异常检测进行以下两方面的深入研究。本论文提出的方法不仅提高了异常检测的精度,还实现了低误报率和低漏检率,为当前异常检测领域所遇到的问题提出了新的解决思路。 首先,本文针对时序数据缺失的情况,设计了一种基于二阶预测网络的时序数据补全模型。该模型可以实现精准的缺失值补全功能,能够有效地处理不完整数据集,减少数据缺失对异常检测造成的干扰。为了进一步提升补全效果,本文提出将时序数据转化为图结构的策略。该策略能够充分利用数据中的结构信息,获取数据的概率分布和特征之间的关联性,实现对缺失值的精准补全。最后,通过实验证明,该模型不仅具备高效补全缺失值的能力,更能深入挖掘数据各特征间的潜在关联,从而实现特征关系的补全。这一创新性的方法为第四章所介绍的时序数据异常检测提供完整的数据,解决了因数据缺失导致的误报率较高的问题。 其次,本文针对当前异常检测方法无法同时考虑时序数据的特征关联性和长距离时间信息的问题,创新性地提出一种多变量时序数据异常检测模型Anomaly-PTG(Anomaly-Parallel Transformer-GRU)。该模型由信息提取模块和异常检测模块构成。在信息提取模块中,能够同时捕获时序数据的特征关系和时间信息,解决由于信息缺失导致的检测精度低问题。在异常检测模块中,提出将预测与重构方法进行最优组合的策略,实现对异常行为更全面的检测,有效降低模型的异常漏检率。最后,在四个公开的数据集上进行验证,与先进的基线方法相比,Anomaly-PTG模型在平均F1值上提升了2.2%,展现出了良好的性能。

关键词

多变量时序数据/异常检测/数据挖掘/数据补全/二阶预测网络/信息提取/深度学习

引用本文复制引用

授予学位

硕士

学科专业

计算机技术

导师

李刚

学位年度

2024

学位授予单位

齐鲁工业大学

语种

中文

中图分类号

TP
段落导航相关论文