multi-agent deep reinforcement learningcoordinated collision avoidancecentralized training with decen-tralized executionprioritized experience replaymulti-agent Softmax deep double deterministic policy gradient
多智能体深度强化学习 协同避碰 中心化训练去中心化执行 优先经验回放 多智能体Softmax深层双确定性策略梯度
国家自然科学基金资助项目
52101368
2024