摘要
为解决因交通信息监控设备年久失修导致时空数据不完备,对交通时空数据质量状况进行综合诊断,为后续数据质量恢复与应用研究奠定数据基底.首先利用地点车速数据的时序特性和箱线图判别准则(Boxplot)客观判别了问题数据类型,其次针对不同问题数据类型特点构建了多属性综合评价指标图谱,采用熵权法(EWM)为各评价指标赋予信息熵权值,利用逼近理想解(TOP-SIS)评价法得到了各条路段地点车速数据的贴近度并给予排序,最后综合道路属性及贴近度排序结果评价了区域路网地点车速数据质量状况.以2021年乌鲁木齐市1周的原始卡口交通数据为例,对应不同问题数据类型提出了多个数据质量评价指标,利用多属性评价指标图谱及道路属性对EWM-TOPSIS综合评价方法进行验证.研究结果表明:问题数据判别算法能够精确判别出冗余数据、缺失数据及异常数据3类问题数据,对应的评价指标均值分别为5.66%、10.04%、5.04%,综合可用性指标均值为84.66%,各路段数据质量整体良好;利用EWM-TOPSIS综合评价方法得到的路段地点车速数据贴近度均值为0.25,区域路网地点车速数据质量指数均值为0.19,道路属性是影响区域路网数据质量的关键因素之一.所提数据质量诊断方法能够辨识原始卡口交通问题数据类型,综合道路属性客观评价区域路网的整体数据质量,为交通数据质量诊断及未来应用服务提供了新的解决思路.
基金项目
国家自然科学基金(52172338)
长安大学研究生科研创新实践项目(300103722058)