首页 | 本学科首页   官方微博 | 高级检索  
     

基于深度强化学习的自适应虚拟机整合方法
引用本文:余显, 李振宇, 孙胜, 张广兴, 刁祖龙, 谢高岗. 基于深度强化学习的自适应虚拟机整合方法[J]. 计算机研究与发展, 2021, 58(12): 2783-2797. DOI: 10.7544/issn1000-1239.2021.20200366
作者姓名:余显  李振宇  孙胜  张广兴  刁祖龙  谢高岗
作者单位:1(中国科学院计算技术研究所 北京 100190);2(中国科学院大学 北京 100049) (yuxian@ict.ac.cn)
基金项目:国家自然科学基金;国家自然科学基金;中科院-奥地利合作项目
摘    要:能耗限制的服务质量优化问题一直以来都是数据中心虚拟机资源管理所面临的巨大挑战之一.尽管现有的工作通过虚拟机整合技术一定程度上降低了能耗和提升了系统服务质量,但这些方法通常难以实现长期最优的管理目标,并且容易受到业务场景变化的影响,面临变更困难以及管理成本高等难题.针对数据中心虚拟机资源管理存在的能耗和服务质量长期最优难保证以及策略调整灵活性差的问题,提出了一种基于深度强化学习的自适应虚拟机整合方法(deep reinforcement learning-based adaptive virtual machine consolidation method, RA-VMC).该方法利用张量化状态表示、确定性动作输出、卷积神经网络和加权奖赏机制构建了从数据中心系统状态到虚拟机迁移策略的端到端决策模型;设计自动化状态生成机制和反向梯度限定机制以改进深度确定性策略梯度算法,加快虚拟机迁移决策模型的收敛速度并且保证近似最优的管理性能.基于真实虚拟机负载数据的仿真实验结果表明:与开源云平台中流行的虚拟机整合方法相比,该方法能够有效地降低能耗和提高系统的服务质量.

关 键 词:数据中心  虚拟机资源管理  虚拟机整合  强化学习  深度确定性策略梯度
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机研究与发展》浏览原始摘要信息
点击此处可从《计算机研究与发展》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号