摘要
近年来,网约车出行服务受到了广泛的欢迎,已经成为了城市交通出行系统的重要组成部分,并深刻地改变了出行者日常的出行行为。滴滴、优步、Lyft等在线网约车出行服务平台通过智能手机应用为用户提供便捷的出行服务,并在此过程中积累了大量的时空数据,这些数据不仅可以为网约车出行服务平台的智能化运营和管理提供帮助,还可以帮助改善整个城市交通系统的运行效率。出行需求预测问题是网约车出行服务平台的一个基本问题。相比传统出租车服务,尽管网约车出行服务具有诸多优势,但是仍然存在时空供需不平衡的问题。通过提前了解出行者的出行需求,网约车平台可以通过更有效的策略来进行订单和车辆调度,从而减少出行者的等待时间和驾驶员的空闲行驶时间,提高匹配效率。此外,在准确预测出行需求的基础上,通过动态定价的方式也可以使平台获得更高的收益。 随着电子传感器和无线通信技术的飞速发展,利用移动互联网和终端采集到的大规模时空数据进行实时预测已经成为了交通领域的研究热点。网约车出行需求预测问题作为一个典型的时空预测问题,包含两个基础的子问题,即区域级需求预测问题和起讫点出行需求预测问题。其中,区域级需求预测问题的研究目标是实现对城市不同医域出行需求的发生量或吸引量的预测,而起讫点出行需求预测问题的研究目标是实现对城市不同区域间出行需求量的预测。 从数据的时间序列特性出发,传统的基于统计的方法被用来解决特定区域(或特定站点)内的交通预测问题。然而,这些基于统计的方法独立地处理每个区域,因此不能有效的学习时间序列数据间的空间相关性。近年来,深度学习方法被越来越多地应用于交通研究中,显著的提高了许多交通预测任务的准确性。到目前为止,基于神经网络的模型和算法已经成为了交通预测问题研究中的首选方法。为了建模网约车出行需求数据或其他时空数据中存在的复杂时空关联性,研究者提出了多种不同的深度学习架构。在这些工作中,卷积神经网络(ConvolutionalNeuralNetwork,CNN)被广泛应用于提取数据中的空间相关性。然而,基于卷积神经网络的模型只能应用于规则的欧氏数据,这限制了其在交通预测任务中的准确性和一般性。为此,基于图的神经网络被引入到相关交通问题的研究中。在本文中,为了解决基于时空数据的网约车出行需求预测问题在区域层面和起讫点层面面临的独特挑战,我们开展了若干研究工作。 首先,为了对城市不同区域的网约车出行需求进行预测,现有的研究多侧重于获取区域间的时空相关性,而忽略了区域间因城市地理布局而导致的局部统计差异,这限制了预测模型在精度上的表现。本文提出了一种新的深度学习方法,包含局部连接的时空全卷积神经网络(Locally-connectedSpatial-TemporalFullyConvolutionalNeuralNetwork,LST-FCN),来学习区域间的时空相关性并处理区域间的局部统计差异。在局部连接的时空全卷积神经网络模型中,我们采用三维卷积运算同时从时间和空间维度提取特征,并且通过局部连接的卷积层来处理区域间的局部统计差异。由于局部连接的时空全卷积神经网络采用了完全卷积的网络架构,因此在前向传播的计算过程中,模型能够保持各个区域的空间位置信息,从而保证层与层之间没有空间信息的丢失。并且,在反向传播训练阶段,每个区域的预测误差也可以独立地传递到前一层,并优化该区域对应的训练参数。本文在滴滴出行提供的真实数据集上对所提出的模型进行了实验评估,并将预测结果与一系列的基准模型进行了比较。此外,我们通过对特征提取过程的可视化进一步探讨了局部连接的时空全卷积神经网络模型的工作机制。可视化结果表明,该方法能较好地定位和获取空间维度的有效特征。 其次,从研究目的来看,起讫点出行需求预测问题是区域级需求预测问题的自然延伸。相比区域级需求预测问题,起讫点出行需求预测在实际应用中具有更加重要的意义,但是预测难度也更大,面临更多的挑战。其中的主要原因包括:(1)非欧式的时空相关性:起讫点出行需求数据中的时空相关性很难从对应的OD(Origin-Destination)矩阵中直接提取,OD矩阵中元素之间的关系需要使用图结构进行描述;(2)动态和双向图结构:区域级需求预测任务只关注节点的动态属性(如需求量),而忽略了边的方向性和动态性。然而,在起讫点出行需求预测任务中,区域间的出行需求在每个时间间隔内是双向的,并且随着时间的推移发生动态变化。这就要求用于预测的模型不仅能够捕捉到不同时段起讫点出行需求的拓扑结构信息,而且能够对拓扑结构的演化模式进行学习;(3)高度稀疏性:起讫点出行需求预测的目的是预测区域间的出行需求量,因此,对于城市中的N个区域而言,每个时间间隔内需要预测的出行需求量个数为N2个。然而,在起讫点出行需求构成的OD矩阵中,零元素的数量远远多于非零元素,这种稀疏性会导致预测模型对数据中的噪声敏感,继而对预测精度产生负面影响。由于起讫点出行需求预测问题中存在的上述困难,现有的研究主要集中在区域级需求预测上,而针对起讫点出行需求预测问题的研究较少。在本文中,我们从图的角度出发,构造了一种动态图结构来描述网约车出行需求的起讫点数据,并提出了一种新的图神经网络方法一一动态节点边注意力网络(DynamicNode-EdgeAttentionNetwork,DNEAT),从出行需求发生和吸引的角度来解决网约车起讫点出行需求预测问题面临的独特挑战。与以往的研究不同,在动态节点边注意力网络中,我们开发了一种新的神经网络层——k-hop序节点边注意力层(k-hoptemporalnode-edgeattentionlayer,k-TNEAT),用于捕获构造的动态图中拓扑结构的时间演化规律,而不是预先定义出行区域间的拓扑结构关系。本文使用两个源于真实世界的网约车出行需求数据集(来自中国成都和纽约)评估了提出的模型。实验结果表明,动态节点边注意力网络模型在预测表现上明显优于其他基准模型,并且在处理数据稀疏性问题上具有更强的鲁棒性。 最后,对于起讫点出行需求预测问题,本文进一步对其中的图表示学习问题和图结构构建问题进行了研究。在过去的几年中,为了克服基于卷积神经网络的模型在捕获非欧式关联性方面的缺陷,研究者提出了多种时空图学习方法来解决起讫点出行需求预测问题。然而,由于图神经网络方法对于数据图结构的要求和限制,以往的大多数需求预测方法必须在起讫点出行需求数据的复杂性和图神经网络方法的适用性之间做出折衷。当前,对于动态图结构数据的学习和建模仍然是一个具有挑战性的研究问题,在预定义和静态图结构基础上构建的时空图方法很难揭示出行需求数据中内在的动态相关性。在动态节点边注意力网络的研究基础上,本文提出了一种通用的端到端深度学习架构,称为动态自构图神经网络(DynamicAuto-structuringGraphNeuralNetwork,DAGNN),来进一步解决网约车起讫点出行需求预测问题以及弥补相关的研究空白。在动态自构图神经网络中,我们开发了一种动态图分解与重构层(DynamicGraphDecompositionandReconstructionlayer,DGDR),实现了对复杂时空数据中图网络结构构建问题和图表示向量学习问题的有效衔接和端到端学习。此外,不同于以往的时空图神经网络模型,在动态图分解与重构层中,不同类型的多源数据可以轻松的集成到模型中,图网络结构的构建和图表示向量的学习完全从数据出发而不依赖于任何人工经验和假设。实验中,我们在两个真实的网约车需求数据集上对比了动态自构图神经网络和其他十个基准模型的预测表现。实验结果表明,本文提出的动态自构图神经网络模型在两个实验数据集上均取得了最优的预测表现,并且在处理数据稀疏性问题上具有更强的鲁棒性。最后,本文通过可视化的方法研究了动态自构图神经网络模型在图网络结构构建方面的有效性和合理性。