首页|基于Q-强化学习的干道交叉口信号配时模型

基于Q-强化学习的干道交叉口信号配时模型

扫码查看
交叉口是城市交通的核心和枢纽,要想有效地提升城市交通体系的通行效率,对交叉口信号配时的优化显得尤为必要.由于城市路网中大范围的信号配时方法决策属于模糊决策问题,而且路网中的车辆具有实时性,强化学习的方法可以适用于交通信号配时领域.本文把主流的Q-强化学习方法应用于干道交叉口信号配时,在每个路口以状态空间、信号周期、每个相位绿灯时间为参数建立模型,设置奖惩函数,并以车辆延误为指标,即Q函数,在相邻路口Agent的信息交换之后得出每个路口该时段的最优动作,降低了由于交叉口数量增多造成的各交叉口Agent间信息交互的次数,避免了独立强化学习可能出现的维数灾难、无法长期学习等问题.实验结果表明:基于Q-强化学习的城市干道交叉口信号配时方法相比于固定配时和传统的Q-强化学习策略,能降低车辆延误,提升收敛速度,提高系统效率.
Q-learning based signal timing optimization model for trunk road intersections

徐建闽、席嘉鹏

展开 >

华南理工大学土木与交通学院,广东广州510000

交叉口信号配时 模糊决策问题 Q-强化学习 干道 长期学习

国家自然科学基金资助项目广东省科技计划项目广东省自然科学基金资助项目

618730982016A0303050012018A030313250

2021

广西大学学报(自然科学版)
广西大学

广西大学学报(自然科学版)

CSTPCD北大核心
影响因子:0.767
ISSN:1001-7445
年,卷(期):2021.46(4)
  • 1
  • 10