摘要
轨迹数据是由各种定位设备所产生的时序数据流,描述了一定时间范围内移动对象的位置变化,反映了对象的活动规律和行为模式,蕴含了丰富的时空特征和语义特征。因此,轨迹数据挖掘成为大数据分析领域关注的重点。轨迹异常检测是时空轨迹数据挖掘的重要研究内容之一,旨在挖掘出数据集中少量且不同的轨迹。异常不等同于噪声,异常可能产生于不同的机制,异常的发生可能伴随有趣的现象,因此吸引了大量学者进行轨迹数据异常检测的研究。 针对已有的轨迹异常检测方法主要考虑轨迹的时空特征,能够检测出时空特征约束下的异常轨迹,但是忽略了轨迹的多维语义特征的影响,无法实现语义特征约束下的异常轨迹检测。本文顾及轨迹数据的时间、空间和语义特征,结合轨迹数据异常检测理论,实现多维语义特征约束下的轨迹异常检测。论文主要研究内容如下: (1)基于卡尔曼滤波的轨迹噪声点检测。针对轨迹数据在采样过程中受到各种因素影响,导致轨迹数据出现轨迹点漂移等轨迹点噪声问题。本文基于卡尔曼滤波原理提出一种轨迹噪声点检测方法,充分考虑轨迹点的运动状态向量,基于时空轨迹点运动向量趋势预测,发现不符合轨迹运动趋势的噪声数据,剔除时空轨迹存在的点状噪声,提高数据质量。 (2)时空语义约束的轨迹异常点检测。针对传统的轨迹异常点检测方法主要考虑空间特征,忽略语义特征的问题。本文将轨迹点映射到多维语义空间中,基于多维语义特征度量轨迹点的距离,计算每个轨迹点的局部离群因子。提出了时空异语义约束的异常点检测方法,为轨迹数据的进一步挖掘提供支撑。 (3)m-iBOAT算法的异常轨迹检测。针对传统的轨迹数据异常检测方法仅考虑时空特征,导致检测结果不准确且难以解释的问题。本文提出了m-iBOAT算法,从多维语义特征的角度出发,度量轨迹网格单元的相似性,基于轨迹支持度和异常分数识别异常轨迹,实现多维语义特征约束下的异常轨迹检测。