多元时间序列可解释性分类方法研究

崔哲翰¹

扫码查看

作者信息

1. 山西大学
折叠

摘要

多元时间序列分类作为时间序列领域的一项基本任务，随着深度学习表示能力的提高取得显著进步。然而，深度学习网络的“黑盒”特性使其难以在时间序列领域得到广泛应用。本文围绕多元时间序列分类可解释性，基于Transformer网络设计并实现一种结合时间域和空间域上下文的可解释性分类模型 TSformer；提出一种可解释性评价方法并构造三种合成数据集从样本级验证TSformer分类结果的可解释性能；以及搭建一个基于事后可解释性方法的深度学习分类系统。具体内容如下。本文提出一种两阶段的上下文多头自注意力机制，用于更细粒度地理解多元时间序列数据下Transformer的分类决策过程。第一阶段学习跨时间相关性变量，第二阶段学习跨空间相关性变量。为了在捕获跨时间（空间）相关性变量的同时增加空间（时间）上下文嵌入信息，使用一种联合张量分解策略Tucker分解。利用核心张量融合上下文嵌入，使得Query和Key点积自注意力包含上下文背景信息。采用聚合滑窗模块，减少一次性输入的时间步长大小，在缓解自注意力机制计算复杂度的同时保留时间域的语义信息。三个可解释性数据集和七个UEA长序列数据集实验表明，TSformer的分类性能超过五种对比方法，在全部可解释性数据集和五个UEA数据集下使用两种准确性指标 AAC、AUC 均达到最优或次优的结果。结合自注意力分数热力图和显著性图，在时间域和空间域进行 PM2.5浓度分类、癫痫分类、人类动作分类等可解释性案例分析。针对多元时间序列分类模型的可解释性量化问题，提出一种基于数据扰动的评估方法，在时间维度和空间维度合成带有扰动的数据，利用模型的可解释性机制把扰动源识别的准确率作为可解释性评估的量化指标。基于该方法分别从时间域、空间域和时空域构造三个扰动合成数据集，用来度量TSformer与对比方法之间的可解释性能差异。扰动合成数据集的实验结果表明，TSformer 在时空域的扰动合成数据集上识别扰动的准确率较高。在定性分析上，从通道和多元变量变化的角度构造两种合成数据集。可视化分析时间域和空间域的自注意力验证两阶段自注意力可以反映通道的变化。结合显著性图，验证时间域的自注意力可以反映时间的趋势变化。搭建一款基于时序可解释的深度学习分类系统。帮助用户了解多元时间序列可解释性的概念。结合事后可解释性算法，用户能够交互式地运用事后可解释性手段来完成简单的实际应用。

关键词

多元时间序列分类/可解释性/多头自注意力机制/数据扰动

引用本文复制引用

授予学位

硕士

学科专业

软件工程

导师

彭甫镕

学位年度

2024

学位授予单位

山西大学

语种

中文

中图分类号

段落导航