基于深度强化学习的配件库存决策研究 |
| |
作者姓名: | 李雨情 潘超凡 |
| |
作者单位: | 1. 西南交通大学制造业产业链协同与信息化支撑技术四川省重点实验室;2. 西南石油大学计算机科学学院 |
| |
摘 要: | 针对供应链中制造厂配件中心库的库存决策问题,充分考虑库存限制因素及复杂多变的配件需求特性,将库存决策这类序贯决策问题建模为马尔可夫决策过程,并通过深度强化学习算法对该库存决策模型进行求解,以探索不确定需求下不同需求特性配件的最优订货量,从而达到企业利润最大化的目的。实验结果表明,基于深度强化学习的库存决策能够在充分贴合现实情况的前提下有效提高企业利润,具有实际应用价值。
|
关 键 词: | 深度学习 强化学习 库存决策 |
|
|