牟轩庭、张宏军、廖湘琳、章乐贵
陆军工程大学 指挥控制工程学院,江苏 南京 210000
深度强化学习 专家经验 规则 动作空间 近端策略优化算法 注意力机制
国家自然科学基金
61806221
2022
10.3969/j.issn.1673-629X.2022.10.026