首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
计算机集群系统在具有高性价比的同时,带来了管理性差的缺点。首先设计了一种基于Web的集群监控模型,然后结合运行在集群系统上的某数据流服务给出实现策略,并详细描述了整个集群监控系统的开发过程。实践表明,该监控系统可以大大提高对计算机集群系统的管理效率。  相似文献   

2.
现在容器云平台容器数目日益增加,相关监控数据爆炸式增长,而现有的运行在容器内的微服务监控软件监控指标不仅种类繁多,配置繁琐,并且往往只是直接给出监控数据,没有根据得到的监控指标对系统的健康度进行度量。针对该问题,提出了一种新的基于粗糙集的容器云系统健康度评价模型。通过建立的粗糙集云系统健康度评价模型,可以直观地反映整个集群的健康程度。首先通过信息熵对监控到的连续属性进行断点分割,离散化处理,然后利用粗糙集理论实现对监控数据进行知识约简、一致性检查和决策表建立,从而建立了基于粗糙集和信息熵的集群健康度指标模型。最后,通过Kubernetes容器云平台分别进行计算密集负载和网络密集负载仿真实验,实验结果表明,该模型能够反映集群的性能和对异常进行检测。  相似文献   

3.
针对染色车间染缸集群集中监控的问题,通过现场工业总线技术和以太网技术,建立了染缸过程控制、数据通信和集中临控三位一体的系统构架,并提出了一种多智能体的染缸集群监控方法.该方法实现了染缸集群的生产计划、作业任务、生产过程、染色工艺温度、染缸能源消耗等的实时监控.某大型印染车间的染缸集群监控系统应用结果表明,该系统取得了满意的实际效果.  相似文献   

4.
本文提出了一种基于Web的流媒体集群监控系统。该系统实现了将离散的Helix流媒体服务器节点通过Web应用程序接口集中监控管理。此外,该系统作为集群监控系统,采用了灵活的模块化结构,并在LVS集群应用层的可靠性与容错方面做了不少工作。以上特性提高了集群系统的可扩展性和高可用性。  相似文献   

5.
一个良好的监控系统能够提高集群的可管理性,缩短集群系统非正常停机时间,降低系统总拥有成本TCO(Total Cost of Ownership)。本文针对大规模集群系统设计了一个基于Web的集群监控系统。该系统采用两级异步通信,能够实时地对大规模集群系统进行监控,对异常状态进行报警,大大提高了系统的可用性和可维性。  相似文献   

6.
文中针对多集群环境资源异构且地域分散、网络环境不可靠以及面向用户需求的特点,提出了一种采用消息模型的多集群作业管理方案。该方案采用全局一局部的层次调度方法,基于发布一订阅的消息模型,根据当前网络环境、用户作业的资源需求、各集群自身负载情况进行综合统一调度管理。实践证明,采用该方案设计实现的多集群作业管理系统实现了多集群环境下的资源监控、资源管理、作业调度、作业控制、数据管理等功能,有效解决了在资源异构及网络环境不可靠条件下的系统稳定性问题,显著提高了多集群系统作业吞吐能力。  相似文献   

7.
现有的集群监控系统不能反映云计算集群具有海量节点且高耦合的特性.针对该问题,设计一种基于热力学相空间理论的云计算专用监控系统.采用将节点运行参数向相空间映射的方式,使节点参数的变化转换为相空间中投影点的运动,从而对相空间图像和参数进行分析.测试结果表明,该监控系统可以即时有效地反映云计算集群的整体负载和运行状态,实现对云计算集群的宏观监控.  相似文献   

8.
测控集群系统随机Petri网模型与可用性分析   总被引:1,自引:0,他引:1  
研究并实现了一个应用于测控领域的高可用性实时集群系统,该系统充分采用冗余技术以消除系统中的单一故障点.首先阐述了系统的体系结构,然后在介绍随机Petri网基本概念的基础上,建立了系统的随机Petri网模型,并在此模型的基础上,分析了系统各部分的稳态可用度和系统的总稳态可用度.经理论计算表明,测控集群系统一年的平均故障停机时间约为3.44分钟,因此,系统具有较高的可用性,完全满足关键应用场所的高可用性要求.  相似文献   

9.
集群计算系统的模型结构   总被引:6,自引:2,他引:6  
对集群计算环境进行了抽象的分析和概述,并建立了一个集群计算系统的模型,该模型为理解、分析和评价一个实际的集群系统提供了有力的工具。  相似文献   

10.
基于Web的远程集群监控系统的设计与实现   总被引:2,自引:0,他引:2  
集群系统的商品化部件构成特点在具有高性价比优点的同时,也带来了可用性和可管理性差的缺点,因此集群系统的监控就变得特别重要。该文结合国家高性能计算中心(西安)的Linux集群系统给出了一种基于Web的集群监控系统的体系结构框架以及实现策略,详细介绍了数据采集、信息收集和存储以及状态的可视化各个模块的具体实现,基于WEB的实现策略使该系统具有平台无关性和监控远程性的优点。  相似文献   

11.
针对形式化建模方法导致的状态空间爆炸问题,提出了一种基于Petri网的高性能集群建模与性能评估方法.首先分析了高性能集群的系统架构,构建了模型的总体结构;然后针对集群系统建立了相应的任务产生子模型和调度子模型,并通过对Petri网进行着色,根据不同种类任务的执行特点设计了相应的任务处理模型.仿真结果表明,利用所建立的模型能够有效评估关键参数对集群性能的影响.  相似文献   

12.
集群体系下的大规模并行计算,是高性能计算的基础。遥感图像处理效率的提高,有赖于并行计算技术的应用。在分析已有网格计算环境下分布式任务分配方法的基础上,针对海上遥感图像目标物数量相对较少的特点,首先利用四叉树结构理念对目标区域进行划分,同时采用动态负载均衡的任务分配策略与并行计算思想,提出对目标区域图像进行融合处理的集群体系任务分配算法处理模型。通过对比验证,表明该集群体系下算法模型能有效地提高图像融合的速度。  相似文献   

13.
LilyTask是一种以任务为单位、基于任务并行的计算模型和程序设计模型。本文介绍的LilyTask系统基于LilyTask模型,对在分布内存环境下实现任务池系统进行了有益的尝试,较好地解决了任务并行在分布存储环境下遇到的任务间关系、嵌套任务、一致性等相关问题。此外,本系统还采用函数索引技术实现分布环境下的任务迁移,通过任务窃取策略有效地实现负载平衡。  相似文献   

14.
针对传感器网络系统(WSN)对任务完成所需能量有约束的特点,首先建立了WSN系统的网络模型和任务模型,引入了能量权函数,建立了基于任务的无线传感器网络系统可靠性模型,最后针对无线传感器网络的典型层次簇拓扑结构,给出了建模实例。该方法为WSN系统的任务级划分与拓扑结构的选择和优化提供依据和参考。  相似文献   

15.
针对云任务调度中存在的效率低、费用高等问题,提出一种基于改进K-means聚类算法的云任务调度算法。依据虚拟资源的硬件属性,使用改进聚类算法对虚拟资源进行聚类划分;计算任务偏好,使不同偏好的任务在不同的聚类中选择资源;考虑到调度费用问题,对每个聚类使用改进后的Min-min算法进行任务调度。针对K-means聚类算法初始聚类中心随机选取,易陷入局部最优解的问题,对聚类算法进行改进。最后,利用云仿真平台CloudSim进行实验,结果表明,与无聚类的调度算法相比,本文提出的算法在执行效率方面有所提高。  相似文献   

16.
异构云数据中心各类服务器的控制成本和性能上的差异将影响其运维管理成本及QoS博弈平衡关系,针对任务序列强度具有的时效性,提出了任务序列强度感知的大规模任务调度模型。依据当前到达数据中心的任务序列的强度以及集群中服务器的当前状态,在任务调度中强调节约服务器运维管理成本和各服务器负载均衡的基础上实现优化数据中心对任务序列处理的平均响应时间和系统的吞吐量。通过对实验结果的分析,验证了集群服务器控制模型在任务调度中的可信度大于95%,同时通过与当前应用广且具代表性的算法——最短任务优先,公平分发机制进行比较分析,其效果是三者中最好的,也验证了模型的有效性和可行性。  相似文献   

17.
万玮  杨志义 《计算机工程与设计》2005,26(10):2811-2813,2816
为了提高分布式计算集群系统的可靠性,增强系统的容错能力,使系统在局部出错的情况下仍能稳定正常运行,建立了一个容错系统模型,该模型采用两级容错机制即节点级容错和任务级容错。此模型为分布式计算集群系统下的容错的进一步研究建立了基础。  相似文献   

18.
当前GPU集群的主流编程模型是MPI与CUDA的松散耦合,采用这种编程模型进行编程,存在编程复杂度大、程序的可移植性差、执行效率低等问题。为此,提出一种面向通用计算GPU集群的任务自动分配系统StreamMAP。对编译器进行改造,以编译制导的方式提供集群任务的计算资源需求,通过运行时系统动态地发现、建立并维护系统资源拓扑,设计一种较为契合GPU集群应用特征的任务分配策略。实验结果表明,StreamMAP系统能降低集群应用程序的编程复杂度,使之较为高效地利用GPU集群的计算资源,且程序的可移植性和可扩展性也得到了保证。  相似文献   

19.
Storm on YARN是目前主流的分布式资源调度框架,但其存在需要人工干预和无法根据资源可用性实时调整系统资源的不足。根据流数据处理的实时延迟计算系统负载情况,在Storm平台上基于YARN设计分布式资源调度和协同分配系统。建立包含系统层和任务层的双层调度模型,系统层通过对流数据处理负载的实时监测进行资源分配预测,任务层利用ZooKeeper和YARN对集群资源的高效管理能力进行动态资源管理。实验结果表明,该系统可以实时调整集群资源分布,有效减小系统延迟。  相似文献   

20.
为了提高Web海量数据的抓掘效率,引入并行机群抓掘机制。为使机群中每个计算节点的能力得到充分发挥,应用向量度量技术解决抓取任务和计算节点能力匹配的问题。对抓取任务向量、计算节点向量进行定义,提出余弦向量匹配算法,描述相关并行算法。理论分析和实验表明,基于余弦向量匹配算法的挖掘任务分配模型具有良好的分配适应性和负载平衡性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号