计算机技术与发展2022,Vol.32Issue(10) :156-163.DOI:10.3969/j.issn.1673-629X.2022.10.026

规则引导的智能体决策框架

Rule-guided Agent Decision-Making Framework

牟轩庭 张宏军 廖湘琳 章乐贵
计算机技术与发展2022,Vol.32Issue(10) :156-163.DOI:10.3969/j.issn.1673-629X.2022.10.026

规则引导的智能体决策框架

Rule-guided Agent Decision-Making Framework

牟轩庭 1张宏军 1廖湘琳 1章乐贵1
扫码查看

作者信息

  • 1. 陆军工程大学 指挥控制工程学院,江苏 南京 210000
  • 折叠

摘要

虽然近年来深度强化学习在决策智能中取得突破,但复杂场景中的巨大动作空间仍然是算法成功学习的一大挑战.导致这一问题的主要原因在于缺乏指导的智能体难以累积足够的成功经验,样本数据质量低下,影响模型正确收敛,而加入人类知识进行辅助是一种有效的方法.为此提出了规则引导的智能体决策框架,介绍了决策框架的总体组成;针对不同态势下存在的无效动作导致探索困难的问题,提出了规则引导的智能体决策方法,选择近端策略优化算法和注意力机制构建了简单的智能体网络,利用专家经验设计规则引导层,根据态势特征对智能体的动作空间进行动态约束.实验结果表明:该方法提高了智能体在星际争霸II小型任务"训练陆战队员"中的成绩,并且去掉规则引导层后仍然能够保持部分性能.

关键词

深度强化学习/专家经验/规则/动作空间/近端策略优化算法/注意力机制

引用本文复制引用

基金项目

国家自然科学基金(61806221)

出版年

2022
计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
参考文献量7
段落导航相关论文