首页|单时间序列异常子序列检测算法的研究

单时间序列异常子序列检测算法的研究

扫码查看
随着信息技术的快速发展,数据的种类越来越多且数据规模越来越大,而时间序列是其中一种很重要的数据形式。从时间序列数据中寻找出异常极具意义,例如检测异常心电数据、异常传感器数据等。时间序列异常有时不仅仅是数据点异常,而是连续一段数据即子序列异常,本文研究的就是单时间序列中异常子序列的检测。 单时间序列异常子序列检测方法主要有基于模型的方法及基于比较的方法。基于比较的方法相比基于模型的方法来说,其思想简单直观,设置参数少,无需训练模型,算法适用范围更广。当前基于比较的方法一般通过寻找与其余子序列最不相似的子序列来进行异常子序列的检测。其中典型高效的算法就是HOT SAX(Hot Symbolic Aggregate Approximation)算法。基于比较的方法具有许多优点,但一些问题仍需解决改善,本文就是在基于比较的算法的基础上进行的异常子序列检测研究。 本文在基于比较的方法框架下,提出利用子序列最小边界矩形比特化表示的聚类结果来启发异常子序列的搜索顺序,从而提高异常子序列检测的效率。考虑到原异常子序列定义不能发现相似异常的缺点,改进异常子序列的定义,采用基于k近邻的异常子序列定义,并在此定义下提出高效的异常子序列检测算法来寻找异常子序列。实际应用中有时需要检测前若干个异常,本文同时提出了检测前若干个最异常子序列的算法。时间序列数据通常是源源不断更新的,将时间序列异常子序列检测算法运用到动态时间序列数据流中进行异常子序列在线检测更具实际应用价值,本文通过深入分析时间序列数据流特点,将新定义下的异常子序列检测算法框架运用到时间序列数据流中,提出了高效的异常子序列在线检测算法以适应时间序列数据流。通过将本文提出的算法运用到模拟数据集和实际数据集中进行验证,实验结果表明,算法是有效的,且获得了较高的效率。

肖鹏

展开 >

数据处理 时间序列 异常子序列检测 HOT SAX算法

硕士

计算机科学与技术

张春慨

2015

哈尔滨工业大学

中文

TP