基于强化学习的组合优化综述

扫码查看

原文链接

国家科技期刊平台
NETL
NSTL
万方数据
维普

中文摘要：组合优化(CO)是运筹学的关键部分之一,近年来引起了学术界的极大兴趣.常见的解决此类问题的方法多数涉及到人工设计的启发式方法.因此,如何利用强化学习(RL)的决策过程生成CO问题的可行解,以及RL能否代替传统方法也是当前研究的重点.主要介绍CO与RL的基本定义、CO与RL框架之间协同作用的分类,最后探讨将CO与RL相结合的研究前景.

外文标题：A Survey on Reinforcement Learning for Combinatorial Optimization

作者：

顾一凡

展开 >

作者单位：

南京航空航天大学计算机科学与技术学院,江苏南京210016

关键词：

强化学习组合优化运筹学值函数方法基于策略的方法

基金：

项目编号：

6130015920175552042

出版年：

2021

DOI：

10.11907/rjdk.202559

软件导刊

湖北省信息学会

软件导刊

影响因子：0.524

ISSN：1672-7800

年,卷(期)：2021.20(9)

被引量1
参考文献量30