robot manipulation skills learningreinforcement learningsparse rewardmaximum entropy methodsadaptive temperature parametersmeta-learning
机器人操作技能学习 强化学习 稀疏奖励 最大熵方法 自适应温度参数 元学习
国家重点研发计划国家自然科学基金区域联合基金北京市自然科学基金河北省自然科学基金
2018YFB1308300U20A201674202026F202103079
2024