首页|强化学习的自动驾驶控制技术研究进展

强化学习的自动驾驶控制技术研究进展

Research progress of automatic driving control technology based on reinforcement learning

扫码查看
自动驾驶车辆的本质是轮式移动机器人,是一个集模式识别、环境感知、规划决策和智能控制等功能于一体的综合系统.人工智能和机器学习领域的进步极大推动了自动驾驶技术的发展.当前主流的机器学习方法分为:监督学习、非监督学习和强化学习3种.强化学习方法更适用于复杂交通场景下自动驾驶系统决策和控制的智能处理,有利于提高自动驾驶的舒适性和安全性.深度学习和强化学习相结合产生的深度强化学习方法成为机器学习领域中的热门研究方向.首先对自动驾驶技术、强化学习方法以及自动驾驶控制架构进行简要介绍,并阐述了强化学习方法的基本原理和研究现状.随后重点阐述了强化学习方法在自动驾驶控制领域的研究历史和现状,并结合北京联合大学智能车研究团队的研究和测试工作介绍了典型的基于强化学习的自动驾驶控制技术应用,讨论了深度强化学习的潜力.最后提出了强化学习方法在自动驾驶控制领域研究和应用时遇到的困难和挑战,包括真实环境下自动驾驶安全性、多智能体强化学习和符合人类驾驶特性的奖励函数设计等.研究有助于深入了解强化学习方法在自动驾驶控制方面的优势和局限性,在应用中也可作为自动驾驶控制系统的设计参考.

潘峰、鲍泓

展开 >

北京化工大学,北京100029

北京联合大学,北京100101

自动驾驶 决策控制 马尔可夫决策过程 强化学习 数据驱动 自主学习

国家自然科学基金北京市教委科技计划一般项目

61932012KM201911417009

2021

中国图象图形学报
中国科学院遥感应用研究所,中国图象图形学学会 ,北京应用物理与计算数学研究所

中国图象图形学报

CSTPCDCSCD北大核心
影响因子:1.111
ISSN:1006-8961
年,卷(期):2021.26(1)
  • 9
  • 3