摘要
针对车险欺诈问题,文章提出了一种引入权重的Stacking融合模型对欺诈进行识别预测.对预处理后的车险欺诈数据集利用过滤法和嵌入法进行特征筛选,再采用SMOTE-Tomek Links相结合的采样方法平衡数据集.文章基于机器学习算法建立SVM、KNN、随机森林和XGBoost模型,并以此为基模型,建立传统的Stacking融合模型、引入不同指标作为权重的Stacking融合模型.结果表明:以F1 加权的Stacking融合模型的Pre值为 91.7300%,与其他指标进行加权的Stacking模型预测效果相比,以F1 加权的Stacking融合模型对车险欺诈行为具有较好的识别预测能力.
基金项目
福建省教育厅中青年项目教师教育科研项目(JAT200297)
福建省自然科学基金面上项目(2023J01910)
福建省自然科学基金面上项目(2023J01909)