Deep reinforcement learningTemporal abstractHierarchical reinforcement learningMutual informationInternal re-wardsDiversity in option policies
深度强化学习 时序抽象 分层强化学习 互信息 内部奖励 Option多样性
国家自然科学基金国家自然科学基金江苏省高等学校自然科学研究重大项目江苏省高等学校自然科学研究重大项目吉林大学符号计算与知识工程教育部重点实验室资助项目吉林大学符号计算与知识工程教育部重点实验室资助项目苏州市应用基础研究计划工业部分江苏省高校优势学科建设工程资助项目
617723556170205518KJA52001117KJA52000493K172014K0493K172017K18SYG201422
2024