共查询到19条相似文献,搜索用时 125 毫秒
1.
集群计算机系统的运算性能跨入百万亿次、千万亿次时代,节能降耗已成为集群计算机系统必须面对的重要问题之一,本文从系统级节能的角度出发,结合神威高性能集群计算机系统的系统监测、作业管理、IPMI带外电源管理和TuxOnIce系统休眠技术,设计并实现了基于资源调度的集群节能系统,通过对空闲结点的关机或休眠,能够有效地降低集群系统空闲时的能耗,使神威高性能集群计算机系统成为真正的绿色计算机。 相似文献
2.
高分子模拟计算网格为复杂材料研究人员提供了分子模拟软件、计算资源和信息共享的平台。设计和实现了网格作业管理模块,包括作业的提交、调度和监视,为用户提供了一个透明的网格资源的使用方法。该模块已经成功部署到高分子模拟计算网格系统中,试验结果表明,作业管理为网格用户提供更好的服务质量,实现了对网格资源的优化使用。 相似文献
3.
RB-FIFT--一种结合Firstfit及预约回填策略的机群作业调度算法 总被引:3,自引:0,他引:3
机群作业管理是机群系统软件的重要组成部分,作业调度策略则是机群作业管理系统的核心.作业调度策略的选择不仅关系到机群系统的效率,还影响了用户作业的响应时间.目前,Firstfit调度算法已经相当成熟并且广泛应用于机群作业调度.传统的Firstfit算法虽然着眼于减少资源碎片,但未能解决作业饥饿问题.曙光超级服务器作业管理系统JMS改进了既有的结合Firstfit和优先级的作业调度算法P-FIFT,将预约和回填策略与Firstfit相结合,引入了新的RB-FIFT调度策略.实验结果表明,与传统Firstfit算法及P—FIFT算法比较,RB-FIFT调度策略不但能够消除系统中作业的饥饿现象,而且大大减少了资源碎片,提高了系统的吞吐率和资源利用率. 相似文献
4.
文中针对多集群环境资源异构且地域分散、网络环境不可靠以及面向用户需求的特点,提出了一种采用消息模型的多集群作业管理方案。该方案采用全局一局部的层次调度方法,基于发布一订阅的消息模型,根据当前网络环境、用户作业的资源需求、各集群自身负载情况进行综合统一调度管理。实践证明,采用该方案设计实现的多集群作业管理系统实现了多集群环境下的资源监控、资源管理、作业调度、作业控制、数据管理等功能,有效解决了在资源异构及网络环境不可靠条件下的系统稳定性问题,显著提高了多集群系统作业吞吐能力。 相似文献
5.
对密集计算网格的资源进行角色分类,采用了基于作业优先级和资源优先级的作业调度算法,设计和实现了网格作业管理模块,为用户提供了一个有效的网格资源的使用方法,实现了对网格资源的优化使用,为网格用户提供了更好的网格资源服务共享。 相似文献
6.
一种面向服务的网格作业管理机制 总被引:14,自引:0,他引:14
开放网格服务体系结构(OGSA)的出现表明让网格资源以服务形式提供标准化的接口已成为趋势,然而目前的网格作业管理系统主要针对以程序形式提交的批处理类型作业,其管理的资源对象和调度目标主要面向科学计算,在基于服务的网格环境下远不能满足应用的需求:一方面,用户的使用模式从批处理为主转向带有交互性质的服务访问模式;另一方面,不同的应用对服务质量(QoS)有着不同级别的需求,为了解决这些问题,提出了一种面向服务的作业管理机制,它作为用户访问网格资源(服务)的代理,为用户提供透明的、与资源物理位置无关的并带有会话支持的作业服务接口。还引入了服务水平协议(SLA)的概念来表示用户需求的不同网格服务级别,作业管理系统则根据可定制的服务水平实现配置(SLAP)将sIA中规定的各项QoS特性映射到具体的作业管理行为,该作业管理机制已应用于织女星网格系统软件中,并能够为基于服务网格的应用提供灵活有效的支持。 相似文献
7.
PBS是广泛应用于高性能计算机的作业管理系统,它可以公平地为每个作业分配系统资源。其特点是,具有大量的命令行参数、环境变量、选项和结点配置信息,用户使用十分不便。本文主要介绍了一个基于Web的作业管理系统CWPBS,该系统使用简便,并且具有较好的平台无关性和可移植性。 相似文献
8.
调度技术是集群作业管理系统的关键技术之一。但是,目前大多数集群作业管理系统采用的调度技术,很少按照应用对系统资源的需求加以详细区分和权衡,无法同时满足不同应用在高吞吐量、高可用性和实时性等方面的要求,造成了资源的闲置和资源因为负载过重而无法正常工作。该文正是注意到了这种不足,根据不同应用的需求和实时收集到的资源信息,引入了多维QoS的概念,并给出了多维QoS的数学模型,提出了一种基于多维QoS的集群作业调度算法JSBMQ,充分提高了系统的资源利用率和平均响应时间,使集群可以提供不问断的高效的计算服务。 相似文献
9.
网格计算中作业管理系统的分析及设计 总被引:2,自引:0,他引:2
随着高性能应用需求的迅猛发展,单台高性能计算机已经不能胜任一些超大规模应用问题的解决。这就需要将地理上分布、系统异构的多种计算资源通过高速网络连接起来,共同解决大型应用问题,作业管理是随着集群技术和网格技术的应用发展而发展起来的一项技术。针对网格计算中的作业管理系统,该文主要分析了作业管理系统的设计、实现及关键技术,以及作业管理系统中的各种组件的工作原理,并在此基础上提出并设计出针对网格计算的作业调度器的框架。 相似文献
10.
11.
作业调度系统是高性能计算机的核心组件,其目标是在满足性能要求的前提下,使得所有任务消耗的总功耗最低。提出了一种自适应功耗管理策略,该策略采用遗传算法作为功耗调度算法,采用作业队列的能效比作为调度因素,与面向资源效率的传统作业调度算法相比,在确保提升资源利用率、减少资源碎片、提升作业吞吐率、减少饥饿作业的前提下,大幅提升了系统的能效比。实验证明该策略能有效提高整机能效,与传统作业调度策略相比能节约9%以上的能耗。 相似文献
12.
13.
基于PBS的机群任务调度管理中间件的设计与实现 总被引:1,自引:0,他引:1
介绍了基于PBS的机群任务调度管理中间件,是基于现在比较流行的调度系统PBS进行开发和封装,对上层提供了统一的接口.同时在该中间件中还封装了用户管理模块、配置模块和任务调度模块,采用基于XML的通信协议.该中间件具有很强的扩展性,可以扩展应用于LSF等多种流行的机群任务调度系统.最后,在该中间件之上,使用Java开发了前台图形界面,实现了一整套完备的具有实时监控和远程管理能力的机群任务管理系统. 相似文献
14.
15.
高能物理数据由物理事例组成,事例之间没有相关性。可以通过大量作业同时处理大量不同的数据文件,从而实现高能物理计算任务的并行化,因此高能物理计算是典型的高吞吐量计算场景。高能所计算集群使用开源的TORQUE/Maui进行资源管理及作业调度,并通过将集群资源划分成不同队列以及限制用户最大运行作业数来保证公平性,然而这也导致了集群整体资源利用率非常低下。SLURM和HTCondor都是近年来流行的开源资源管理系统,前者拥有丰富的作业调度策略,后者非常适合高吞吐量计算,二者都能够替代老旧、缺乏维护的TORQUE/Maui,都是管理计算集群资源的可行方案。在SLURM和HTCondor测试集群上模拟大亚湾实验用户的作业提交行为,对SLURM和HTCondor的资源分配行为和效率进行了测试,并与相同作业在高能物理研究所TORQUE/Maui集群上的实际调度结果进行了对比,分析了SLURM及HTCondor的优势和不足,探讨了使用SLURM或HTCondor管理高能物理研究所计算集群的可行性。 相似文献
16.
17.
网格环境下的集群系统作业管理研究 总被引:2,自引:4,他引:2
网格计算已经逐渐形成一个重要的新领域。相对于传统的分布式计算,它的显著之处在于它能够共享网络上的各种资源,包括地理上分布的各种计算资源。PBS是广泛应用于并行计算机的作业管理系统,它可以按照用户定义的配置参数相对公平地为每个作业分配系统资源。但是在网格环境范围内对集群系统进行管理仍然是一门有待研究的课题。利用网格系统软件和集群系统管理软件,实现了一种在网格环境下对集群系统作业进行管理的方法。 相似文献
18.
文章提出了一种新型远程作业管理系统框架。该框架基于JMX架构,融合了基于企业权限映射模型的安全机制、JSF(JavaServerFace)的可视化框架等多项技术,有效地改进了传统的作业管理系统的可扩展性差、安全机制不足和缺乏统一、完善的系统管理三点不足。并基于该框架实现了国家863项目“远程作业管理系统”,实现了灵活的系统组件动态配置,基于企业权限映射模型的高安全和可视化管理界面,比较了实现系统和传统系统的优点,讨论了其中涉及到的关键技术。 相似文献
19.
随着网络技术的发展,群机计算管理软件作为对群机计算资源进行统一管理的中间件,越来越受到人们的关注。如何合理地管理地理上相对分散的计算资源,达到资源共享的目标,是群机系统发挥性能的关键。文章首先给出了一个基于资源集合概念的资源管理模型,在此基础上,研究了群机系统的资源分配和负载管理问题,并结合作业调度过程说明了资源管理模型与策略的应用。 相似文献