摘要
随着社会经济的发展,城市化进程的加速,由于出行需求在城市中分布不均匀、城市交通系统的在时间和空间上的利用不均等导致严重的交通拥堵,已经严重限制了城市的健康发展。交通小区是研究城市交通系统的基本单元,其划分需要满足同质性和空间连续性的原则,空间约束聚类方法把地理信息和空间邻接关系融入到聚类过程中,能够平衡聚类结果的空间连续性和同质性,为交通小区划分提供新的思路。 本文以成都市滴滴出行网约车订单数据和兴趣点(Pointofinterest,POI)数据为研究数据源,结合交通小区划分原则,重点探讨如何从数据中充分提取交通小区划分所需信息,如何建立满足实际城市交通系统需要的交通小区划分方法,如何分析城市交通小区的时空特征等问题。主要包括以下研究内容: (1)提出一种基于词频-逆文件频率(TermFrequency-InverseDocumentFrequency,TF-IDF)的交通语义特征提取方法,在滴滴出行网约车订单数据和POI数据预处理基础上,把研究区域离散为规则正方形网格作为交通小区划分的基本空间单元,提取了网格内反映出行量的交通出行特征和反映土地利用状况的交通语义特征,为交通小区划分奠定基础。 (2)把空间约束聚类的“聚类后平滑”的思想融入到交通小区划分方法之中,结合经典的K-means方法,提出了基于空间加权约束K-means(SpatialWeightedConstraintK-means,SWCK-means)的交通小区划分方法。基于轮廓系数和CalinskiHarabasz指数设计实验确定了最佳交通小区划分数量。开展不同网格分辨率情况下的实验,使用交通小区划分的评价指标(出行密度波动系数、交通小区等效半径的75分位数、交通小区内部出行比例、交通小区总体异质性和交通小区平均紧凑性),确定了基于K-means的交通小区划分方法和基于SWCK-means的交通小区划分方法的最佳的交通小区划分网格分辨率。进行了基于K-means的交通小区划分方法与基于SWCK-means的交通小区划分方法的最优划分方案对比分析,发现基于SWCK-means的交通小区划分方法能得到具有更高同质性和空间连续性的交通小区划分结果,验证了基于SWCK-means的交通小区划分方法的合理性和有效性。 (3)借鉴了空间约束聚类中“邻接约束聚类”的思想,把网格之间的空间邻接关系通过Hadamard乘积方法与谱聚类方法结合起来,提出了基于空间约束谱(SpatialConstrainedSpectralClustering,SCS-Clustering)聚类的交通小区划分方法,并根据簇内平方和(SquareSumWithincluster,ssw)、簇间平方和(SquareSumBetweenclusters,SSB)和空间连续交通小区的百分比(Percentofcontiguitytrafficzone,Pctz)确定空间邻接约束参数δ。根据SSW的变化率设计实验确定最佳交通小区划分数量。根据交通小区划分评价指标确定了基于谱聚类的交通小区划分方法和基于SCS-Clustering的交通小区划分方法的最佳划分网格分辨率。并进行了两种方法最优划分方案的对比分析,发现基于SCS-Clustering的交通小区划分方法得到了具有更高同质性和空间连续性的交通小区划分结果,验证了基于SCS-Clustering的交通小区划分方法的合理性和有效性。 (4)开展了基于SWCK-means聚类和基于SCS-Clustering的交通小区划分方法的最优划分方案的对比分析,通过观察划分结果图和对比评价指标发现提出的方法优于基于主要道路划分的交通小区,且基于SCS-Clustering的交通小区划分方法要优于基于SWCK-means聚类的交通小区划分方法。以基于SCS-Clustering的交通小区划分方法的最优划分方案为基础,分析了交通小区的时空特征。首先比较了工作日和周末不同时间段交通小区划分的变化,发现工作日和周末交通小区划分结果的交通小区质心位置变化不大,并计算了不同时间段的交通小区划分的评价指标,发现等效半径的75分位数变化不大,出行密度波动系数、总体异质性和平均紧凑性在不同时间段出现微小的变化,说明工作日和周末交通小区划分结果变化较小。其次分析了工作日和周末早高峰、晚高峰和夜晚三个时间段交通吸引力指数的变化,并解释了典型商业类型交通小区、居住类型交通小区和交通枢纽类型交通小区的交通出行量变化趋势。最后分析了交通小区间的OD(Origin-Destination)交互,在工作日和周末各交通小区之间的出行OD随时间变化的特征基本相同,交通小区之间的OD交互主要分布在研究区域的中心区域(二环以内),并以六个行政区的交界核心区域为中心向外扩散,其中核心商圈和交通枢纽对OD分布的影响较大。