摘要
近年来国家民航行业正处于高速发展期,航班延误带来的影响不断显现,为此航空公司及乘客对航班延误的时间预测有着更迫切的需求.本文采用Catboost算法来预测航班延误,使用美国交通统计局(BST)发布的以亚特兰哈兹菲尔德-杰克逊机场(ATL)为预测点的航班数据,通过数据预处理进行数据清洗,提取出关键类别型特征,并利用网格搜索及交叉验证实现模型参数优化.通过对R-Squared、MAE、训练时间等回归指标进行实验,Catboost算法与LightGBM、XGBoost算法相比,具有更高的预测精度和更短的训练时间.