基于深度强化学习的自适应虚拟机整合方法

Adaptive Virtual Machine Consolidation Method Based on Deep Reinforcement Learning

余显 ¹李振宇 ²孙胜 ¹张广兴 ²刁祖龙 ²谢高岗²

扫码查看

作者信息

1. 中国科学院计算技术研究所北京100190;中国科学院大学北京100049
2. 中国科学院计算技术研究所北京100190
折叠

摘要

能耗限制的服务质量优化问题一直以来都是数据中心虚拟机资源管理所面临的巨大挑战之一.尽管现有的工作通过虚拟机整合技术一定程度上降低了能耗和提升了系统服务质量,但这些方法通常难以实现长期最优的管理目标,并且容易受到业务场景变化的影响,面临变更困难以及管理成本高等难题.针对数据中心虚拟机资源管理存在的能耗和服务质量长期最优难保证以及策略调整灵活性差的问题,提出了一种基于深度强化学习的自适应虚拟机整合方法(deep reinforcement learning-based adaptive virtual machine consolidation method,RA-VMC).该方法利用张量化状态表示、确定性动作输出、卷积神经网络和加权奖赏机制构建了从数据中心系统状态到虚拟机迁移策略的端到端决策模型;设计自动化状态生成机制和反向梯度限定机制以改进深度确定性策略梯度算法,加快虚拟机迁移决策模型的收敛速度并且保证近似最优的管理性能.基于真实虚拟机负载数据的仿真实验结果表明:与开源云平台中流行的虚拟机整合方法相比,该方法能够有效地降低能耗和提高系统的服务质量.

关键词

数据中心/虚拟机资源管理/虚拟机整合/强化学习/深度确定性策略梯度

引用本文复制引用

基金项目

国家自然科学基金(61725206)

国家自然科学基金(U20A20180)

中国科学院-奥地利合作项目(171111KYSB20200001)

出版年

2021

计算机研究与发展

中国科学院计算技术研究所中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心

影响因子：2.649

ISSN：1000-1239

被引量7

参考文献量41

段落导航