摘要
挖掘特征项较多的时间序列数据中的重要信息是工业信息化领域中的一项共同任务,包括网络服务、金融、电力、水利、企业自动化运行系统、生物学信息等领域。本文构建的时间序列数据检测算法中,以提高异常检测分类准确率为目的,在Kaggle的pump_sensor时间序列数据进行训练和测试,实现了基于时间序列数据异常检测的研究。 本文对现有的时间序列数据中数据预处理和异常检测算法的优势进行分析,介绍了时间序列检测模型、数据处理相关理论以及异常检测评价指标等相关技术,为本文构建的时间序列检测模型做理论基础。 针对Kaggle的pump_sensor时间序列数据特征偏多的特性,结合经典LSTM模型对于pump_sensor时间序列异常检测的分析结果,采用蚁狮优化算法优化LASSO特征选择算法,将得到的ALO-LASSO特征选择结果运用到LSTM模型中,实现LSTM模型输入特征参数的优化,从而构建了基于ALO-LASSO-LSTM时间序列数据异常检测分类模型。该模型在Kaggle公开的pump_sensor时间序列数据上进行仿真实验,实验表明,构建的时间序列数据的异常检测模型(ALO-LASSO-LSTM)的平均准确率达到95.3%,提高LSTM模型异常检测的准确率。 针对pump_sensor数据的时间特性,结合长短时记忆网络适合处理序列数据的特点,对输入特征优化后LSTM网络添加注意力机制实现进一步的改进,构建了基于Attention-LSTM检测模型,该模型提高了重要特征的权重,强化了重要特征在LSTM模型的分类作用。最后通过强分类模型Adaboost集成算法可以把多个Attention-LSTM分类模型进行集成,进而得到强分类模型,进一步提高分类模型的准确率。该模型在pump_sensor数据集进行仿真实验,基于Attention-LSTM的Adaboost异常检测模型在特征相同的条件下分类结果有所提高,平均准确率达到96.6%。