首页 | 本学科首页   官方微博 | 高级检索  
     

混合部署数据中心失效负载分析
引用本文:蒋从锋,殷继亮,胡海周,闫龙川,张纪林,万健,仇烨亮. 混合部署数据中心失效负载分析[J]. 计算机科学, 2021, 48(z2): 225-231,264. DOI: 10.11896/jsjkx.201200066
作者姓名:蒋从锋  殷继亮  胡海周  闫龙川  张纪林  万健  仇烨亮
作者单位:杭州电子科技大学计算机学院 杭州 310018;国家电网有限公司信息通信分公司 北京 100053;杭州电子科技大学网络空间安全学院 杭州 310018;浙江科技学院信息与电子工程学院 杭州 310023;阿里云计算有限公司 杭州 311121
摘    要:数据中心工作负载混合部署在显著提升云数据中心的资源利用率的同时,也增加了调度的复杂性和作业的失效率.以阿里云发布的数据中心日志数据集cluster-trace-v2018为例,从离线批处理工作负载角度出发,详细地分析了不同类型工作负载在成功率和资源利用上的特征.主要发现如下:1)少量类型作业的失效会影响集群整体作业成功率并造成集群资源的浪费;2)伏羲分布式调度系统在任务故障切换执行时间上满足高斯分布,在任务调度延迟方面满足齐夫分布;3)通过分析失败实例在集群节点上的分布,发现集群作业发生失败在空间上具有随机性,且失败的实例很容易再次发生失败,而在时间上集群整体失败率则存在不平衡性;4)以任务实例的失效为基准,计算了集群节点的平均无故障时间,大部分节点的平均无故障时间在1000 s左右,小部分节点的任务实例失效率低,其平均无故障时间可达10000 s以上.

关 键 词:混合部署  工作负载特征  分布式调度  失效分析

Analysis of Workload Failure in Co-located Data Centers
JIANG Cong-feng,YIN Ji-liang,HU Hai-zhou,YAN Long-chuan,ZHANG Ji-lin,WAN Jian,QIU Ye-liang. Analysis of Workload Failure in Co-located Data Centers[J]. Computer Science, 2021, 48(z2): 225-231,264. DOI: 10.11896/jsjkx.201200066
Authors:JIANG Cong-feng  YIN Ji-liang  HU Hai-zhou  YAN Long-chuan  ZHANG Ji-lin  WAN Jian  QIU Ye-liang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号