首页|基于深度强化学习的车辆自主避撞决策控制模型

基于深度强化学习的车辆自主避撞决策控制模型

Vehicle autonomous collision avoidance decision control model based on deep reinforcement learning

扫码查看
为提高车辆对行驶环境的自我学习和决策能力,提出了一种基于深度确定性策略梯度(DDPG)的车辆自主避撞决策控制模型.基于Markov决策过程的强化学习理论和车辆纵向运动学特性,设计了决策所需目标对象及自车信息的状态空间和自车减速度的动作空间,以安全性、舒适性和效率因素为多目标奖励函数的端到端的车辆自主避撞决策模型.利用Matlab/Simulink构建的DDPG算法与交通环境的交互模型,通过了前车静止(CCRs)和前车制动(CCRb)场景测试.结果表明:本决策算法具有很好的收敛性,引入加速度和冲击度的极限值,在实现车辆有效避撞的同时,兼顾乘坐舒适性,且性能优于模糊控制.

李文礼、张友松、韩迪、钱洪、石晓辉

展开 >

重庆理工大学 汽车零部件先进制造技术教育部重点实验室,重庆400054,中国

车辆安全 自主避撞 深度确定性策略梯度(DDPG) 控制模型 多目标奖励函数

重庆理工大学研究生创新项目重庆市巴南区科技成果转化及产业化专项

clgycx202020212020TJZ022

2021

汽车安全与节能学报
清华大学

汽车安全与节能学报

CSTPCDCSCD北大核心
影响因子:0.748
ISSN:1676-8484
年,卷(期):2021.12(2)
  • 4
  • 7