吴戴燕、刘世林
安徽六安技师学院 机电工程系,安徽 六安 237001
安徽工程大学 电子工程学院,安徽 芜湖 241000
机械臂 马尔科夫决策 深度增强学习 Q学习 归一化优势函数
安徽省高等学校自然科学研究重大项目安徽省高等学校自然科学研究重点项目
KJ2018ZD066KJ2019A1184
2022
10.13853/j.cnki.issn.1672-3708.2022.06.003