中国安全科学学报2023,Vol.33Issue(2) :23-30.DOI:10.16265/j.cnki.issn1003-3033.2023.02.0034

基于机器学习的公交驾驶员事故风险识别及影响因素研究

Research on accident risk identification and influencing factors of bus drivers based on machine learning

朱彤 秦丹 魏雯 任杰 冯移冬
中国安全科学学报2023,Vol.33Issue(2) :23-30.DOI:10.16265/j.cnki.issn1003-3033.2023.02.0034

基于机器学习的公交驾驶员事故风险识别及影响因素研究

Research on accident risk identification and influencing factors of bus drivers based on machine learning

朱彤 1秦丹 1魏雯 1任杰 1冯移冬2
扫码查看

作者信息

  • 1. 长安大学运输工程学院,陕西西安710064
  • 2. 交通运输部公路科学研究所,北京100088
  • 折叠

摘要

为从公交驾驶员群体中识别出易发生事故的风险公交驾驶员,结合某市公交公司营运安全管理系统数据库、百度应用程序接口(API)及网络爬取技术,并应用K近邻算法补充缺失值,获取42条线路及1 893名驾驶员的数据;基于驾驶员、车辆、线路特征、违规行为、事故、管理等基本特征变量构造派生变量;采用包括递归特征消除、有惩罚项的逻辑回归、随机森林的集成方法选择特征;采用极致梯度提升(XGBoost)等6种机器方法分别建立分类模型,并采用贝叶斯方法优化超参数.结果表明:在构建的6个分类模型中,XGBoost方法构建的模型其受试者工作特征(ROC)曲线下的面积(AUC)评估结果最佳;运用贝叶斯方法优化模型,可以在一定程度上提升ROC的AUC指标;对于风险公交驾驶员预测准确率达到98.66%,运营单位还可以根据自身情况权衡虚报率与命中率代价.此外,车辆服役时间、违规次数等特征对于事故风险具有明显的非线性影响.

关键词

风险公交驾驶员/机器学习/事故风险/极致梯度提升(XGBoost)/SHapley加性解释(SHAP)值

引用本文复制引用

基金项目

国家重点研发计划(2019YFE0108000)

陕西省交通运输厅科研项目(21-34R)

出版年

2023
中国安全科学学报
中国职业安全健康协会

中国安全科学学报

CSTPCDCSCD北大核心
影响因子:1.548
ISSN:1003-3033
被引量1
参考文献量4
段落导航相关论文