deep reinforcement learningmulti-UAVsgame confrontationMADDPGActor-Criticrule couplingex-perience replaysparse rewards
深度强化学习 多无人机 博弈对抗 MADDPG Actor-Critic 规则耦合 经验回放 稀疏奖励
国家自然科学基金黑龙江省自然科学基金重庆市教委科学技术研究计划中国博士后科学基金面上项目黑龙江省博士后基金面上项目
61903099LH2020F025KJZD-K202004702021M690812LBH-Z21048
2024