首页|基于深度确定性梯度算法的端到端自动驾驶策略

基于深度确定性梯度算法的端到端自动驾驶策略

扫码查看
根据深度确定性策略梯度算法理论,提出了端到端的自动驾驶控制策略,通过Carla无人驾驶模拟器,以汽车前视图像和少量测量信息作为输入,直接输出转向、油门或制动的控制动作.同时,鉴于强化学习过程中存在大量试错行为,设计了对危险试错动作加以约束并修正的监督器,以减少危险动作并提升训练效率.根据Carla的训练测试结果表明,深度确定性策略梯度算法能使小车学习到有效的自动驾驶策略,且添加监督器之后的算法能明显减少试错行为并提升训练效率.
An end-to-end autonomous driving strategy based on the deep deterministic gradient algorithm

赖晨光、杨小青、胡博、庞玉涵、邹宏

展开 >

重庆理工大学 汽车零部件制造及检测技术教育部重点实验室,重庆 400054

重庆理工大学 车辆工程学院,重庆 400054

自动驾驶 强化学习 深度确定性策略梯度 监督式深度强化学习

国家自然科学基金重庆市研究生教育教学改革研究项目

51905061yjg203115

2023

重庆理工大学学报
重庆理工大学

重庆理工大学学报

CSTPCD北大核心
影响因子:0.567
ISSN:1674-8425
年,卷(期):2023.37(1)
  • 4