基于互信息的智能博弈对抗分层强化学习研究

Research on Hierarchical Reinforcement Learning of Intelligent Game Confrontation Based on Mutual Information

魏竞毅 ¹赖俊 ¹陈希亮¹

扫码查看

作者信息

1. 陆军工程大学指挥控制工程学院,江苏南京 210007
折叠

摘要

智能博弈在当前人工智能的发展中是较为热点的一个问题,同时随着人工智能的不断发展,在作战指挥领域也逐渐得到了广泛的应用,尤其以美国DAPPA为首,利用人工智能来为指挥员的战场决策提供全方位的策略支持,如何利用人工智能模拟战场环境下进行战场对抗也是研究的一方面.当前智能体虽然能够通过获得奖励不断进行优化,在策略上通常是根据即时奖励选择当时收益最大的策略,现实战场环境中有些决策当时虽不会有即时收益,但之后是会对整体的战场形势有更好的推动作用,能够取得更有利的战果.针对此问题,利用分层强化学习进行智能体的智能博弈训练,并应用于简单战场环境下来模拟虚拟指挥员,提出了一种基于互信息的智能博弈对抗的分层强化学习算法MI-A3C.MI-A3C算法在模拟的战场环境中能够取得86.7％的胜率,并能够完成主要任务,同时在实验中可以发现一些有利于长远收益的决策.

关键词

智能博弈/强化学习/互信息/分层/A3/C算法/分队指挥

引用本文复制引用

出版年

2022

计算机技术与发展

陕西省计算机学会

计算机技术与发展

CSTPCD

影响因子：0.621

ISSN：1673-629X

参考文献量5

段落导航