首页|基于深度强化学习算法的弹性供应链调度优化方法

基于深度强化学习算法的弹性供应链调度优化方法

扫码查看
由于参与供应链的客户需求和供应者配置的多元性,导致供应链的配送成本难以得到有效控制,主要是因为在模型求解过程中,受困于参数本身的矛盾性,求解过程很容易陷入局部最优.为此,提出基于深度强化学习算法的弹性供应链调度优化方法研究.分别从供应者配置角度和客户需求角度构建了供应链模型,以供应链配送成本最小化为目标函数,应用深度强化学习算法中的深度Q网络(deep Q-network,DQN)算法进行训练,同步进行弹性供应链优化调度.DQN能够有效地处理这种高维状态空间,通过深度神经网络学习状态与动作之间的映射关系,自动提取关键特征,从而简化问题的复杂性.将收敛输出结果期望误差,输入供应链模型进行迭代计算,输出优化调度结果.测试结果表明,设计的方法可以实现对配送成本的有效控制.

张进军

展开 >

安徽警官职业学院信息管理系 安徽合肥 230031

深度强化学习算法 弹性供应链调度 供应者配置 客户需求 供应链模型 配送成本最小化 Deep Q-Network 误差收敛

安徽省高等学校自然科学研究重大项目(2023)

2023AH040354

2024

信息技术与信息化
山东电子学会

信息技术与信息化

影响因子:0.29
ISSN:1672-9528
年,卷(期):2024.(4)
  • 10