基于深度确定性梯度算法的端到端自动驾驶策略

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据

中文摘要：根据深度确定性策略梯度算法理论,提出了端到端的自动驾驶控制策略,通过Carla无人驾驶模拟器,以汽车前视图像和少量测量信息作为输入,直接输出转向、油门或制动的控制动作.同时,鉴于强化学习过程中存在大量试错行为,设计了对危险试错动作加以约束并修正的监督器,以减少危险动作并提升训练效率.根据Carla的训练测试结果表明,深度确定性策略梯度算法能使小车学习到有效的自动驾驶策略,且添加监督器之后的算法能明显减少试错行为并提升训练效率.

外文标题：An end-to-end autonomous driving strategy based on the deep deterministic gradient algorithm

作者：

赖晨光、杨小青、胡博、庞玉涵、邹宏

展开 >

作者单位：

重庆理工大学汽车零部件制造及检测技术教育部重点实验室,重庆 400054

重庆理工大学车辆工程学院,重庆 400054

关键词：

自动驾驶强化学习深度确定性策略梯度监督式深度强化学习

基金：

国家自然科学基金重庆市研究生教育教学改革研究项目

项目编号：

51905061yjg203115

出版年：

2023

DOI：

10.3969/j.issn.1674-8425(z).2023.01.007

重庆理工大学学报

重庆理工大学

重庆理工大学学报

CSTPCD北大核心

影响因子：0.567

ISSN：1674-8425

年,卷(期)：2023.37(1)

参考文献量4