摘要
车货匹配是提高车主和货主信息流通和促进货运交易的关键途径,然而,在实际应用当中,车货匹配需要考虑司机和货主的行为习惯,并且需要根据不平衡数据进行预测.为解决此问题,本文考虑数据不平衡性,结合RUS重抽样方法,整合Logistic Regression、朴素贝叶斯以及LightGBM模型,最终得到Stacking集成学习的车货匹配模型RLBL-Stacking.以运满满数据为例,对数据进行预处理,筛选合适特征进行模型训练.结果表明,相较于其他单一的分类模型,集成算法能在不平衡数据中取得更好的预测结果.