摘要
提出了能量管理策略优化方法,通过深度强化学习中的深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法调整等效因子,以提高燃油利用率,达到SOC保持与油耗降低的目标.受到边缘计算架构启发,建立了基于并行的深度强化学习算法以加快学习速度.在FTP72工况的仿真结果表明:提出的算法使油耗相对基于PID控制器的传统A-ECMS算法降低了7.2%,而以边缘计算架构建立的并行深度强化学习算法使收敛速度提高了334%.
基金项目
国家自然科学基金(51905061)
中国博士后科学基金(2020M671842)
重庆市自然科学基金(cstc2019jcyj-msxmX0097)
重庆市教育委员会科学技术研究项目(KJQN201801124)
内燃机燃烧学国家重点实验室开放课题(k2019-02)