基于深度强化学习的多需求类型库存控制研究

蔡子诚¹

扫码查看

作者信息

1. 华东交通大学
折叠

摘要

近年来，经济全球化的不断推进和数字化技术的不断发展拓宽了企业的销售渠道，增加了需求的多样性和不确定性。企业在面临多渠道、多种类的产品需求时，需要不断调整各类产品的库存策略，及时响应客户的需求，提高服务水平。与此同时，高响应度的服务也带来了高额库存成本的问题。在过去，企业运营产生的大量业务数据很难被处理，企业无法有效地从大量数据中分析出市场环境的变化趋势，不能及时发现需求变化趋势并做出反应，这可能导致居高不下的库存成本。计算机技术的快速发展为此问题提供了解决思路。机器学习技术能从数据中获取信息，不断学习并改善性能，实现对环境变化的及时反应。因此，机器学习技术能够为企业库存决策提供帮助。库存控制是序贯决策问题，机器学习中的深度强化学习常用于解决此类问题。深度强化学习用马尔可夫决策过程对供应链建模，将供应链中各成员看作智能体，供应链环境作为模型的状态空间，各成员做出的订货决策为模型的动作空间。通过智能体与环境不断交互学习，最终智能体会学到一种决策方案，使模型达到预期的效果。本文对国内外关于多维库存分类、静态库存控制模型和动态库存控制模型的相关文献进行梳理，构建了基于APIOBPCS(AutomatedPipeline,InventoryandOrderBasedProductionControlSystem)和基于深度Q网络的多需求类型库存控制模型。以最小化供应链库存总成本为目标，采用仿真数据和实际数据对模型进行仿真分析。通过研究发现，基于深度Q网络的多需求类型库存控制模型能够对四种需求类型产品的库存成本进行很好的控制，并且通过实际数据的算例分析，模型得出的库存策略也能够有效降低供应链库存总成本。此外，此模型能够通过学习不断提升性能，能够在企业实际应用中为决策者提供帮助。本文研究的创新之处主要有以下三点：（1）考虑库存的不同需求类型，根据多需求类型库存分类法区分库存的需求类型，对实际数据的适用性更强，能够有效描述企业运营产生的数据。（2）为了缓解供应链的不稳定性以及大数据环境下的消费需求，通过结合强化学习与深度学习对供应链库存控制问题建模，解决了传统强化学习求解供应链决策问题产生的“维数诅咒”问题。（3）从实际数据出发，以数据驱动的库存控制能够提高企业对数据的利用率和数据挖掘能力，并为管理者制定库存策略和实施方法提供了理论支持。

关键词

库存分类/库存控制/深度强化学习/深度Q网络

引用本文复制引用

授予学位

硕士

学科专业

物流工程与管理

导师

李卓群/李其

学位年度

2023

学位授予单位

华东交通大学

语种

中文

中图分类号

段落导航