基于双深度Q网络的智能决策系统研究

Research on Intelligent Decision-making System Based on Double Deep Q-Network

况立群 ¹冯利 ¹韩燮 ¹贾炅昊 ²郭广行³

扫码查看

作者信息

1. 中北大学大数据学院,山西太原 030051
2. 北方自动控制技术研究所,山西太原 030006
3. 太原师范学院地理科学学院,山西太原 030006
折叠

摘要

目前智能决策系统中的经典算法智能化程度较低,而更为先进的强化学习算法应用于复杂决策任务又会导致存储上的维度灾难问题.针对该问题,提出了一种基于双深度Q网络的智能决策算法,改进了目标Q值计算方法,并将动作选择和策略评估分开进行,从而获得更加稳定有效的策略.智能体对输入状态进行训练,输出一个较优的动作来驱动智能体行为,包括环境感知、动作感知及任务协同等,继而在复杂度较高的决策环境中顺利完成给定任务.基于Unity3D游戏引擎开发了虚拟智能对抗演练的验证系统,对演练实时状态和智能体训练结果进行可视化,验证了双深度Q网络模型的正确性和稳定性,有效解决了强化学习算法存在的灾难问题.该智能决策算法有望在策略游戏、对抗演练、任务方案评估等领域发挥作用.

关键词

深度强化学习/深度Q网络/对抗演练/仿真训练/Unity3D

引用本文复制引用

基金项目

国家级装备预研项目(41401020402)

出版年

2022

计算机技术与发展

陕西省计算机学会

计算机技术与发展

CSTPCD

影响因子：0.621

ISSN：1673-629X

被引量2

参考文献量13

段落导航