摘要
深度学习目前已被广泛地应用于诸多领域,并取得了很好的效果。如今,网约车行业发展迅速,使人们的生活产生了有利的变化,但是也存在着诸如资源配置不平衡,供需矛盾的问题。网约车需求预测对于网约车企业、司机、乘客都有一定的正向影响,可以缓解供需矛盾并优化资源配置。本文使用深度学习算法对短时网约车需求量进行预测,主要工作如下: 1.从滴滴盖亚计划的真实订单数据集入手,根据预处理的历史订单挖掘乘客的出行规律及需求量的变化情况,提出了网约车乘客的出行需求量具有时空特征。对于时间特征,分析并提出了三个属性来概括,分别是临近性、日周期性和周周期性,这主要与当地居民的工作和生活习惯息息相关。空间特征具体表现为中心区域需求量高,郊区需求量低,从中心往四周逐渐呈现稀疏趋势。 2.针对以往研究多使用随机森林预测单个区域需求量的局限性,提出了使用多输出随机森林的方法对多个区域的网约车需求量进行预测。另外,基于网约车需求数据存在的空间特征和时间特征,分别使用擅长数据空间特性提取的CNN和擅长数据时间特性提取的LSTM进行预测,并利用CNN和LSTM验证拟合临近性、日周期性、周周期性以及融合三种属性的方法之间的差异。结果显示:融合三种属性的方法相较于拟合单一属性的方法更有效,且CNN的RMSE相比多输出随机森林的RMSE降低了27.88%,相比LSTM的RMSE降低了15.74%,说明CNN在提取空间特征的同时融合了三种时间属性,预测效果更好。 3.以CNN和LSTM为基础,提出了一种改进的结合残差网络和注意力机制的短时网约车需求预测算法。针对数据的临近性、日周期性和周周期性三种属性设计了三部分组件,每部分组件的网络结构都相同。首先,对于浅层神经网络只能进行局部特征提取的缺点,提出了利用含有残差单元的网络提取数据的空间特征,更好地刻画城市中任意两个区域的附近和遥远的空间相关性。其次,使用LSTM进行时间特征的提取,考虑到不同历史时间段对未来时间段需求量的影响不同,因此对时间处理模块做了改进,加入了注意力机制来动态调整权值。最后,将三部分组件的结果进行加权融合并输出。实验结果显示:本文提出的组合模型的RMSE相比CNN的RMSE降低了22.28%,表明了该组合模型的有效性及优势。