基于深度强化学习的燃料电池汽车多目标能量管理策略研究

周海涛¹

扫码查看

作者信息

1. 重庆大学
折叠

摘要

面对环境污染、全球变暖、石油资源枯竭等问题，新能源汽车成为各大汽车厂商的重点研究对象。随着燃料电池技术发展，燃料电池汽车充分发挥新能源汽车零排放与节能优势，得到了国内外研究者的广泛关注。能量管理策略是具有多能量源燃料电池汽车的核心控制技术，直接决定着整车性能。深度强化学习算法能有效处理多目标能量管理问题，在优化效果、实时性以及自学习等具有显著优势；为此，本文将开展基于深度强化学习的燃料电池汽车多目标能量管理研究，具体研究内容如下：首先，燃料电池汽车动力系统建模研究。搭建整车纵向动力学模型与面向控制的传动部件模型;分析影响动力源耐久性的因素，建立燃料电池退化模型与电池老化模型；阐述全局优化算法-动态规划（DynamicProgramming,DP）基本原理，实现DP求解能量管理问题，分析全局优化策略下各动力源的工作特性。其次，基于深度强化学习的能量管理策略研究。基于强化学习概念与原理，分别阐述深度Q网络（DeepQ-Network，DQN）与深度确定性策略梯度（Deepdeterministicpolicygradient,DDPG）的基本理论，构建基于深度强化学习的燃料电池汽车能量管理框架；分析UDDS工况下基于DQN与基于DDPG的离线训练结果，将训练完成的策略在线应用于验证驾驶工况，进一步表明所提策略的自适应性。再次，基于软约束演员评论家(Softactorcritic,SAC)的寿命意识能量管理策略研究。阐述SAC算法的基本概念，分析能量管理框架下SAC算法与传统深度强化学习算法的优劣；基于燃料电池退化模型和电池老化模型，构建以氢耗、SOC维持、燃料电池退化以及电池老化为多目标的能量管理优化问题，确定动力源老化与氢耗的折中方案，分析基于SAC的寿命意识能量管理结果，验证拼接工况下所提策略的有效性。最后，计及空调系统协同能量管理研究。基于热力学平衡理论，建立空调系统模型与车舱热负荷模型，搭建计及空调系统的协同能量管理框架，利用SAC算法实现协同能量管理问题的求解；对比分析高温制冷以及低温制热下协同能量管理结果，进一步验证拼接工况下策略的有效性。

关键词

燃料电池汽车/能量管理/深度强化学习/DQN/DDPG/SAC/舒适性

引用本文复制引用

授予学位

硕士

学科专业

车辆工程

导师

唐小林

学位年度

2022

学位授予单位

重庆大学

语种

中文

中图分类号

段落导航