共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
易国祥 《电脑技术——Hello-IT》1995,(8):2-3,36
计算机系统的可靠性一直为人们所关注。早期由继电器和真空管构成的计算机经常不能正常工作。随着人们对计算机依赖程度的不断提高,系统的可靠性就显得更为重要。提高计算机的可靠性有避错和容错两种方法。避错实际上是不容错的,乃是保守设计方法的产物,它以采用高可靠性零件、优化路线等质量控制管理的方法,来减低出错的可能性,但即使是最仔细的避错设计,故障也总有一天会出现,从而导致系统失效。容错是指在硬件或软件故障产生的情况下,仍能将指定的算法准确地完成,同时不使性能降低,即用冗余的资源使计算机具有容忍故障的能力。… 相似文献
4.
5.
对于某些容错计算系统,由于成功与故障之间没有明确的界限,用传统的可靠性指标难以准确地评价其容错性能,为此一些学者提出了若干与性能相关的可靠性指标。本文将这些指标概括成三类(即基于瞬时性能的指标、基于累积收益的指标和率模可靠性指标)加以介绍,并简要介绍了它们的求解方法。 相似文献
6.
容错服务是分布计算系统正常运作的有力保障。该文在一个基于多Agent的校园网格计算原型系统基础上,根据网格计算以及网格应用的本质,提出了网格容错服务的特征,采用Agent分而治之,自主容错的策略,将自主容错服务作为基础服务部署在校园网格计算原型系统的三个Agent层上,并对其实现和运作机制进行了详细的论述。 相似文献
7.
8.
9.
10.
本文介绍了容错计算的基本技术,重点介绍处理器、子系统以至多机系统、分布式系统和计算机网络等层次的容错技术。文中也简要介绍了容错软件技术。 相似文献
11.
分析了集群接入网格的过程中所面临的问题,研究了在网格环境下使用集群的方法,详细分析了集群接入网格需要提供的接口和服务,并实现了一个网格环境下集群管理的原型系统,将集群转化成为一种标准的、透明的资源接入网格.通过该系统用户能够在任何地方使用分布在各处的集群资源,系统能保证用户提交的作业正确、有效的运行,并及时向用户反馈提交作业的相关信息.实验分析表明,该系统能够有效的整合集群计算资源,从而提高计算能力,增大全局吞吐量. 相似文献
12.
分析了分布式虚拟环境仿真的特点,提出了基于网格的分布式虚拟环境仿真的海量数据管理框架.该框架结构采用分层结构,自底向上依次为网格节点、高性能通信系统、数据存储与处理系统和计算系统.给出了一个基于上述体系结构的原型系统.对该原型系统的仿真结果表明,该海量数据管理体系结构设计符合虚拟环境仿真实时性、稳定性和高可靠性的要求. 相似文献
13.
14.
提出了一个网格信任模型,用主观逻辑理论进行信任值的推导、综合。针对现有网格任务调度算法存在的问题,设计了一种任务和资源安全等级匹配的调度算法。通过安全需求对资源进行筛选,并使它满足最早完成时间。仿真实验表明,与传统经典网格任务调度算法比较,该算法提高了任务成功率,减少了任务完成时间,是网格环境下一种有效的资源调度模型。 相似文献
15.
计算作业网格执行环境的分析、设计与应用* 总被引:1,自引:0,他引:1
针对网格环境下科学计算遗产程序执行涉及到的关键问题进行了分析和设计,提出了一个基于固有计算执行环境+网格运行支持扩展的计算作业网格执行环境,以支持在网格环境下调用执行科学程序,并将其应用到了科学计算遗产程序包装成的网格服务运行中。计算作业网格执行环境很好地满足了传统科学计算遗产程序在网格环境下共享后的运行管理的需要,具有广泛的适用性和参考价值。 相似文献
16.
面向高性能计算环境的作业优化调度模型的设计与实现 总被引:1,自引:0,他引:1
高性能计算环境聚合了多个分布在不同地域、不同组织机构的高性能计算资源,面向用户提供统一的访问入口和使用方式,由系统中间件根据用户作业请求匹配合适的高性能计算资源。随着环境应用编程接口的开放以及作业请求数量的大幅增加,面对高并发作业提交请求时,目前采用的即时调度模型会由于网络等原因导致一定数量的请求处理失败,同时缺乏灵活性。针对此问题,优化了环境作业调度模型,引入作业环境队列,细化了作业系统层状态,增加了作业调度策略可配置性,并基于环境中间件SCE实现了系统原型。经测试,在单核心服务每分钟处理近200个作业提交请求的工作负载下,无因系统和网络原因引起的作业提交出错现象;在共计1 000个作业中,近500个作业提交命令请求在0.3s以内完成,800余个作业提交命令请求在0.5s以内完成。 相似文献
17.
网格环境下的集群系统作业管理研究 总被引:6,自引:4,他引:2
网格计算已经逐渐形成一个重要的新领域。相对于传统的分布式计算,它的显著之处在于它能够共享网络上的各种资源,包括地理上分布的各种计算资源。PBS是广泛应用于并行计算机的作业管理系统,它可以按照用户定义的配置参数相对公平地为每个作业分配系统资源。但是在网格环境范围内对集群系统进行管理仍然是一门有待研究的课题。利用网格系统软件和集群系统管理软件,实现了一种在网格环境下对集群系统作业进行管理的方法。 相似文献
18.
Yonghong Hu Xuebin Chi Debbi Chen David K. Kahaner David A. Yuen 《Concurrency and Computation》2015,27(17):4685-4703
Current assessments of supercomputing (high‐performance computing) primarily focus on system performance. Quantitative methods to measure the impact of supercomputing in a broad context have not been well developed. In this paper, the basic meaning of supercomputing development is analyzed. An evaluation index system for assessing the development status of supercomputing is constructed innovatively, and the SuperComputing Development Index (SCDI) is proposed to measure supercomputing development status. SCDI is a composite index combining various indicators into one benchmark measure that monitors and compares supercomputing development in the past years. This appears to be the first attempt to quantitatively measure the supercomputing ecosystem. As an example, the SCDI of the Chinese Academy of Sciences is obtained, which is based on the data collected from 130 research groups about and covers the period from 2006 to 2012. The results have demonstrated that the proposed evaluation index system is objectively reasonable. The constructed SCDI provides a scientific method to quantitatively evaluate the development status of supercomputing for institutions or organizations. 相似文献