首页|基于SARSA学习的单交叉口配时优化仿真与设计

基于SARSA学习的单交叉口配时优化仿真与设计

Simulation and design of timing optimization at a single intersection based on SARSA learning

扫码查看
现如今我国城市道路网络迅速扩大,城市道路交通拥挤状况加剧.传统的定时控制和感应控制不再适应交通环境的多变性、随机性及不确定性.针对Q学习算法只考虑新的状态下获得的最大奖赏,而不考虑新状态带来的风险,将Sarsa学习应用于单交叉口配时优化方法中,Sarsa学习在目标选择策略中有着既考虑最优值,又考虑探索作用值的优点.以单交叉口平均延误最小为优化目标,确定最优策略,并在VisSim中进行仿真,在仿真检验阶段1 000个步长后,Sarsa学习的车辆平均延误相比于Q学习减少了1.277 s.结果 表明Sarsa学习算法在配时优化延误指标上优于Q学习.

白静静、任安虎、李珊

展开 >

西安工业大学电子信息工程学院 西安710021

交叉口控制 Sarsa学习 配时优化 强化学习

陕西省科技厅项目陕西省西安市未央区科技局项目

2018GY-153201833

2020

国外电子测量技术
北京方略信息科技有限公司

国外电子测量技术

CSTPCD北大核心
影响因子:1.414
ISSN:1002-8978
年,卷(期):2020.39(6)
  • 3
  • 5