首页|基于深度学习的时序数据挖掘方法及应用研究

基于深度学习的时序数据挖掘方法及应用研究

周威

基于深度学习的时序数据挖掘方法及应用研究

周威1
扫码查看

作者信息

  • 1. 西南交通大学
  • 折叠

摘要

随着传感器技术的成熟以及大数据时代的飞速发展,各行各业涌现出海量数据,同时由于持续不断的采样和收集,使得大量数据具有了时序特性,例如交通轨迹数据,生理信号数据,空气质量数据和工业监测数据等等。因此,如何有效挖掘时序数据中的动态特征,提取潜在的知识信息,以帮助下游任务实现高效正确的决策是时序数据挖掘的重要研究任务。然而,如今数据体量庞大,传统的机器学习算法已难以表征数据中复杂的非线性关系。深度学习因其自身强大的特征学习能力,能够有效建模数据的非线性依赖,从而在各个领域都备受青睐。因此,为了深入研究时序数据挖掘的有效方法,本文基于深度学习,结合多视图学习、多任务学习、注意力机制和特征融合等方法,致力于从多角度、多粒度、多维度去全面探索时序数据的潜在动态结构,设计新型深度学习模型,并在相应的实际应用场景中进行有效性验证。本文主要的研究工作及贡献总结为以下四个方面: ·基于深度学习的多视图交通运力预测:交通流数据作为一种典型的时序数据,具有显著的时序特性。如何充分挖掘数据的潜在规律和变化模式,是研究的热点及难点。因此,本文提出了一个灵活的结构化的多视图深度学习模型,能够充分学习数据的时序依赖,有效解决交通运力预测任务。该模型根据交通流的时间规律,构建了周期性、趋势性和邻近性三个视图对时序动态进行建模;进一步针对每个视图,设计了孪生时空网络同时捕获入流和出流的时空依赖;最后对三个视图进行自适应地加权融合得到最终运力预测结果。在真实交通数据集上的实验结果验证了所提模型的有效性。 ·基于深度学习的多任务交通运力预测:出租车运力(即空闲出租车数量)作为重要的交通资源与人们日常出行紧密相关。准确地预测出租车运力能帮助乘客及时了解未来可用的交通资源,合理规划行程。然而,运力资源受到交通流数据的影响,具有复杂的时空依赖:一方面出租车入流和出流各自具有内在特定的时空模式;另一方面二者之间存在动态的交互影响。因此,本文提出了一个多任务深度学习模型用来解决这些挑战。该模型主要包含三个模块:时空联合网络模块用于提取交通入流/出流内部的时空依赖;时空差分网络模块用于建模入流和出流之间的交互关系;全局嵌入网络模块用于刻画外部因素对交通数据的影响。此外,还采用了一个多任务损失融合函数整合模型多个损失,使得模型能够有效学得鲁棒的知识。基于真实数据集的丰富实验结果验证了所提模型的优越性能以及模型设计的合理性。 ·基于深度学习的多尺度生理信号分类:生理信号分类对于健康检测和医疗诊断都具有重要意义,基于深度学习的方法已被用于该领域以获得可靠的预测。然而,现有方法的性能仍受限于生理信号序列的长期依赖和不规律振动。为了克服这些局限性,本文提出了一个多尺度深度学习模型,能够充分提取不同粒度的时序特征,从而实现有效分类。该模型的关键创新在于提出了一个多尺度时间特征提取模块和渐进式门控Transformer模块,前者采用粗粒度和细粒度特征提取器将信号序列投影到不同时间粒度的嵌入空间中;后者则渐进式地从不同粒度的嵌入中学习融合多尺度信息获取鲁棒的数据表示。最终学得的表示用于输入分类器中进行分类。在真实的生理信号数据集上的实验结果证明了所提模型的优越性和有效性。 ·基于深度学习的多维度多元时序数据分类:多元时序分类对于诸多现实应用领域都具有至关重要的作用,例如医疗、交通、金融和工业等。虽然已有的基于深度学习的方法在该任务上取得显著成效,但是大多数现有模型仍存在一定的局限性:一方面已有研究大多只对静态时间依赖进行表征而忽略了动态时间演化;另一方面大多数模型无法充分学习不同变量之间不同的时序变化模式。因此,本文提出了一个多维度深度学习模型,建模不同维度的静态时序依赖和动态时序演化,融合得到有效的特征表示。该模型首先基于原始序列构建差分序列,并分别映射得到静态时间嵌入和动态时间嵌入;然后,设计了时间静态跨注意力和时间动态跨注意力模块分别提取不同维度的时序信息,并提出了时间融合跨注意力模块整合不同维度的静态和动态时序特征;最后融合后的表示用于分类。基于大量多元时序数据集的实验结果验证了所提模型在多元时序分类任务上具有良好的性能。

关键词

时序数据/数据挖掘/深度学习/多视图学习/多任务学习/注意力机制/特征融合

引用本文复制引用

授予学位

博士

学科专业

计算机科学与技术

导师

杨燕

学位年度

2023

学位授予单位

西南交通大学

语种

中文

中图分类号

TP
段落导航相关论文