计算机技术与发展2022,Vol.32Issue(2) :137-142.DOI:10.3969/j.issn.1673-629X.2022.02.022

基于双深度Q网络的智能决策系统研究

Research on Intelligent Decision-making System Based on Double Deep Q-Network

况立群 冯利 韩燮 贾炅昊 郭广行
计算机技术与发展2022,Vol.32Issue(2) :137-142.DOI:10.3969/j.issn.1673-629X.2022.02.022

基于双深度Q网络的智能决策系统研究

Research on Intelligent Decision-making System Based on Double Deep Q-Network

况立群 1冯利 1韩燮 1贾炅昊 2郭广行3
扫码查看

作者信息

  • 1. 中北大学 大数据学院,山西 太原 030051
  • 2. 北方自动控制技术研究所,山西 太原 030006
  • 3. 太原师范学院 地理科学学院,山西 太原 030006
  • 折叠

摘要

目前智能决策系统中的经典算法智能化程度较低,而更为先进的强化学习算法应用于复杂决策任务又会导致存储上的维度灾难问题.针对该问题,提出了一种基于双深度Q网络的智能决策算法,改进了目标Q值计算方法,并将动作选择和策略评估分开进行,从而获得更加稳定有效的策略.智能体对输入状态进行训练,输出一个较优的动作来驱动智能体行为,包括环境感知、动作感知及任务协同等,继而在复杂度较高的决策环境中顺利完成给定任务.基于Unity3D游戏引擎开发了虚拟智能对抗演练的验证系统,对演练实时状态和智能体训练结果进行可视化,验证了双深度Q网络模型的正确性和稳定性,有效解决了强化学习算法存在的灾难问题.该智能决策算法有望在策略游戏、对抗演练、任务方案评估等领域发挥作用.

关键词

深度强化学习/深度Q网络/对抗演练/仿真训练/Unity3D

引用本文复制引用

基金项目

国家级装备预研项目(41401020402)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
被引量2
参考文献量13
段落导航相关论文