计算机研究与发展2021,Vol.58Issue(12) :2783-2797.DOI:10.7544/issn1000-1239.2021.20200366

基于深度强化学习的自适应虚拟机整合方法

Adaptive Virtual Machine Consolidation Method Based on Deep Reinforcement Learning

余显 李振宇 孙胜 张广兴 刁祖龙 谢高岗
计算机研究与发展2021,Vol.58Issue(12) :2783-2797.DOI:10.7544/issn1000-1239.2021.20200366

基于深度强化学习的自适应虚拟机整合方法

Adaptive Virtual Machine Consolidation Method Based on Deep Reinforcement Learning

余显 1李振宇 2孙胜 1张广兴 2刁祖龙 2谢高岗2
扫码查看

作者信息

  • 1. 中国科学院计算技术研究所 北京100190;中国科学院大学 北京100049
  • 2. 中国科学院计算技术研究所 北京100190
  • 折叠

摘要

能耗限制的服务质量优化问题一直以来都是数据中心虚拟机资源管理所面临的巨大挑战之一.尽管现有的工作通过虚拟机整合技术一定程度上降低了能耗和提升了系统服务质量,但这些方法通常难以实现长期最优的管理目标,并且容易受到业务场景变化的影响,面临变更困难以及管理成本高等难题.针对数据中心虚拟机资源管理存在的能耗和服务质量长期最优难保证以及策略调整灵活性差的问题,提出了一种基于深度强化学习的自适应虚拟机整合方法(deep reinforcement learning-based adaptive virtual machine consolidation method,RA-VMC).该方法利用张量化状态表示、确定性动作输出、卷积神经网络和加权奖赏机制构建了从数据中心系统状态到虚拟机迁移策略的端到端决策模型;设计自动化状态生成机制和反向梯度限定机制以改进深度确定性策略梯度算法,加快虚拟机迁移决策模型的收敛速度并且保证近似最优的管理性能.基于真实虚拟机负载数据的仿真实验结果表明:与开源云平台中流行的虚拟机整合方法相比,该方法能够有效地降低能耗和提高系统的服务质量.

关键词

数据中心/虚拟机资源管理/虚拟机整合/强化学习/深度确定性策略梯度

引用本文复制引用

基金项目

国家自然科学基金(61725206)

国家自然科学基金(U20A20180)

中国科学院-奥地利合作项目(171111KYSB20200001)

出版年

2021
计算机研究与发展
中国科学院计算技术研究所 中国计算机学会

计算机研究与发展

CSTPCDCSCD北大核心
影响因子:2.649
ISSN:1000-1239
被引量7
参考文献量41
段落导航相关论文