Offline reinforcement learningDeep reinforcement learningReinforcement learningConservative Q-learningUncer-tainty
离线强化学习 深度强化学习 强化学习 保守Q学习 不确定性
国家自然科学基金国家自然科学基金国家自然科学基金国家自然科学基金新疆维吾尔自治区自然科学基金江苏高校优势学科建设工程资助项目
617723556170205561876217621761752022D01A238
2024