摘要
日益增长的航空运输需求,使得航空运输资源愈加紧张,航班延误现象更是频繁出现,困扰着民用航空运输业相关部门与广大旅客。利用统计方法和机器学习算法,对航班运行过程中产生的大量数据进行分析,建立机场延误预测模型,能够使机场等单位在战术或预战术阶段提前响应,对于减少航班延误和旅客滞留具有重要意义。 本文以预测机场离场延误航班量为目标,探究天气条件下影响机场航班离场延误的其他因素,开展基于梯度提升回归树(Gradient Boosting Regression Tree,GBRT)的航班延误预测研究。首先,引入并简化天气影响交通指数(Weather Impacted Traffic Index,WITI)模型,利用高斯混合聚类方法对影响机场航班运行的主要天气要素进行聚类,利用最大类间方差法结合航班运行数据确定主要天气类别,并计算每个类别下天气影响交通系数,从而改进传统的 WITI模型,使其能够更加精准地指示天气对机场航班运行的影响;其次,建立机场延误波及模型,并从时间和空间两个维度,研究关联机场和关联航班对机场离场延误的影响,通过相关性分析,提取机场延误波及特征;然后,结合气象特征和机场延误波及特征,增添时间特征和航班运行特征,构建机场离场延误航班量预测模型的特征体系,利用GBRT算法搭建机场离场延误航班量预测模型,从特征数据、参数优化和特征重要度等角度对预测模型进行分析和优化,结果表明,GBRT算法搭建的机场延误预测模型能够准确的预测机场未来一小时的离场航班延误量。最后,利用模糊算法,建立相应的隶属度函数与模糊判断规则,得出定量的机场延误度指标。