首页|规则引导的智能体决策框架

规则引导的智能体决策框架

扫码查看
虽然近年来深度强化学习在决策智能中取得突破,但复杂场景中的巨大动作空间仍然是算法成功学习的一大挑战.导致这一问题的主要原因在于缺乏指导的智能体难以累积足够的成功经验,样本数据质量低下,影响模型正确收敛,而加入人类知识进行辅助是一种有效的方法.为此提出了规则引导的智能体决策框架,介绍了决策框架的总体组成;针对不同态势下存在的无效动作导致探索困难的问题,提出了规则引导的智能体决策方法,选择近端策略优化算法和注意力机制构建了简单的智能体网络,利用专家经验设计规则引导层,根据态势特征对智能体的动作空间进行动态约束.实验结果表明:该方法提高了智能体在星际争霸II小型任务"训练陆战队员"中的成绩,并且去掉规则引导层后仍然能够保持部分性能.
Rule-guided Agent Decision-Making Framework

牟轩庭、张宏军、廖湘琳、章乐贵

展开 >

陆军工程大学 指挥控制工程学院,江苏 南京 210000

深度强化学习 专家经验 规则 动作空间 近端策略优化算法 注意力机制

国家自然科学基金

61806221

2022

计算机技术与发展
陕西省计算机学会

计算机技术与发展

CSTPCD
影响因子:0.621
ISSN:1673-629X
年,卷(期):2022.32(10)
  • 7