首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 10 毫秒
1.
网络应用系统服务器集群技术研究   总被引:7,自引:0,他引:7  
本文从处理能力可扩展和容错的角度,给出了功能分布和对称的网络应用服务器集群结构,并讨论了实现存储部件容错的各种集群结构。  相似文献   

2.
We present a framework for the co-ordinated, autonomic management of multiple clusters in a compute center and their integration into a Grid environment. Site autonomy and the automation of administrative tasks are prime aspects in this framework. The system behavior is continuously monitored in a steering cycle and appropriate actions are taken to resolve any problems. All presented components have been implemented in the course of the EU project DataGrid: The Lemon monitoring components, the FT fault-tolerance mechanism, the quattor system for software installation and configuration, the RMS job and resource management system, and the Gridification scheme that integrates clusters into the Grid. This work from the EU DataGrid project was funded by the European Commission grant IST-2000-25182.  相似文献   

3.
高性能计算系统的资源管理以集群作业管理为主,这种粗粒度的管理方式缺乏有效的作业资源控制手段,不能准确了解作业的资源需求,在一定程度上仍然不可避免计算资源的浪费.针对高性能计算系统中高效利用系统计算资源的问题,提出并实现了基于操作系统的QoS服务质量框架,对作业资源使用进行细粒度的统计与控制,实现了资源的动态控制与协商机制,完善作业加载与调度策略,在高效利用系统资源方面取得了较好的应用效果.  相似文献   

4.
宇宙射线辐射所导致的瞬态故障一直是航天计算面临的最主要挑战之一.而随着集成电路制造工艺的持续进步,现代处理器的性能在大幅度提高的同时,其可信性也正日益面临着瞬态故障的严重威胁.当前针对瞬态故障的容错技术可大致分为两类:基于硬件实现和基于软件实现.相比较前者,后者由于在实现成本和灵活性等方面的优势而备受关注.本文首先概述...  相似文献   

5.
We have developed a bilingual interface to the Novell network operating system, called the Dialoguer. This system carries on a conversation with the user in Arabic or English or a combination of the two and attempts to help the user use the Novell network operating system. Learning to use an operating system is a major barrier in starting to use computers. There is no single standard for operating systems which makes it difficult for novice users to learn a new operating system. With the proliferation of client–server environments, users will eventually end up using one network operating system or another. These problems motivated our choice of an area to work in and they have made it easy to find real users to test our system.
This system is both an expert system and a natural language interface. The system embodies expert knowledge of the operating system commands and of a large variety of plans that the user may want to carry out. The system also contains a natural language understanding component and a response generation component. The Dialoguer makes extensive use of case frame tables in both components. Algorithms for handling a bilingual dialogue are one of the important contributions of this paper along with the Arabic case frames.  相似文献   

6.
海关自动化分拣系统优化设计   总被引:1,自引:0,他引:1  
本文针对海关快件自动分拣系统中检测数据处理量大、准确性、实效性要求高,提出了基于网络的以OPC通讯方式链接PLC与上层管理系统;并建立实时数据库与Oracle关系数据库之间的ODBC接口;以分散控制,集中监控的新思维,针对快件属性进行分拣判断,并实现快件的容错和定位。最终实现分拣、检测与监控一体化,使分拣系统高速、准确、稳定的工作。实际工程应用表明本方案可行且达到预期效果。  相似文献   

7.
嵌入式系统软件模拟器设计   总被引:2,自引:1,他引:2  
任彧  万健 《计算机应用》2004,24(7):144-146
利用软/硬件协同设计的方法,将嵌入式系统设计采用软件模拟系统环境来开发,通过对CPU行为、内存、中断控制器和操作系统等模块的设计,把硬件系统设计和软件系统仿真相结合。是目前嵌入式系统设计的全新的方法。通过实例对软件模拟器进行验证,表明了这种方法的可行性和可靠性,为嵌入式系统的开发提供软件系统仿真的经验。  相似文献   

8.
计算机系统的容错是一个不容忽视的问题。近年来,随着系统结构的复杂性增加,半导体制造工艺的发展,线宽的降低以及集成度的提高,从用户桌面系统到分布式计算环境,乃至大规模并行计算机系统,功耗和可靠性问题都很突出。本文首先介绍了计算机系统可靠性和容错技术的基本概念、基本方法和基本思想,然后回顾了近些年来一些具有代表性的硬件故障检测技术和硬件故障恢复技术,其中重点介绍了针对大规模并行计算机系统提出的容错方法。本文还介绍了我们在先前的研究工作中提出的一种优化的故障恢复技术,称为容错并行算法。最后,总结了一些可能的研究方向。  相似文献   

9.
主动式路由器操作系统TH-AOSR的设计与实现   总被引:4,自引:1,他引:4  
马洪军  张尧学  陈桦 《软件学报》1999,10(6):580-583
传统网络存在着自身难以克服的弊端,如新的网络协议、新的用户服务在现行网络上实施、推广困难.而主动网络计算则是解决这一问题的一个可行方案.文章设计并实现了一个主动式路由器操作系统——TH-AOSR(Tsinghua active operating system for router),它在兼容传统路由器功能的同时,还具有主动网络互连和计算能力,可以方便地为用户或应用提供定制服务.  相似文献   

10.
由于小卫星对星载计算机系统有性能高、重量轻、体积小、功耗低等许多苛刻的要求 ,使目前的技术在应用中受到了很大的限制。由于遥测数据的高速下行 ,自主操作及大规模数据的存储条件的要求 ,促使我们研制新一代的星载计算机系统。本文就星载计算机系统的硬件结构进行了简要的论述  相似文献   

11.
分布式计算技术提供了充分利用现有网络资源的有效途径。该文论述了基于解决生物计算中难解问题的具有开放接口的分布式并行计算系统的设计与实现技术。系统兼有开放式、异构性、容错性与易用性等特点。讨论了系统的容错性机制、检查点策略及任务调度算法。对Motif Finding问题的求解验证表明,分布式并行计算机制能大大缩短问题的求解时间,为计算领域的难解问题提供有效的解决途径。  相似文献   

12.
基于服务器集群的云检索系统的研究与示范   总被引:1,自引:0,他引:1  
安俊秀 《计算机科学》2010,37(7):179-182
在研究云计算及移动搜索引擎的基础上,依据当前技术发展,提出了基于服务器集群的云检索系统模型,该模型由云信息层、云检索集群系统和用户查询框组成.对云检索集群系统中数据存储技术进行了深入研究,提出了分布式云检索数据存储方案.为了提高云检索执行效率,提出了以程序流为核心的云检索软件执行模式.该模型的测试结果表明,系统功能能正确实现,性能表现较好且稳定.通过该模型的示范,给海量信息检索技术提供了拓展思维的方案.  相似文献   

13.
朱晓敏  祝江汉  马满好 《软件学报》2011,22(7):1440-1456
容错调度是调度问题中一个重要的研究内容,是提高系统可靠性的有效手段.目前已有很多集群系统中实时任务的容错调度算法,但是这些算法都没有考虑到任务的QoS需求问题.提出了一种异构集群系统中具有QoS需求的实时任务容错调度算法FTQ(fault-tolerant QoS-based scheduling).该算法采用主版本/副版本(primary/backup,简称PB)技术,综合考虑了任务的时间限制、任务的QoS需求、系统的可靠性和系统资源的利用率,能够自适应地根据系统负载情况动态地调整任务的QoS级别和副版本的执行模式,从而提高了系统的灵活性、可靠性、可调度性和资源的利用率.对系统的可靠性进行了定量分析,并将其引入到容错调度算法中,提高了系统的可靠性.同时,在调度过程中尽量提前主版本的开始时间,推迟副版本的开始时间,以使任务的副版本采用被动执行模式或者使任务主版本和副版本的重叠部分尽量少,提高了资源的利用率.此外,采用了副版本重叠技术,并分析了副版本的最晚开始时间及其约束条件,提高了任务的调度成功率.通过大量的模拟实验,对FTQ,NOFTQ和DYFARS算法进行了比较.实验结果表明,FTQ算法的性能优于其他方法,具有更好的调度质量.  相似文献   

14.
针对当前可重构资源模型难以实现或资源利用率低等不足,提出一种新的资源模型。基于此模型,设计一种能够调度周期和非周期任务的混合实时任务调度算法。把周期任务分成若干组,在FPGA上为每组任务预留一个槽。当有非周期任务到达时,预先调度当前忙碌期内的所有周期任务,在保证当前忙碌期内周期任务满足截止期限且不影响下一个忙碌期内周期任务执行的情况下,把非周期任务调度到某个槽内执行。实验结果表明,该算法能够充分利用可重构资源,满足所有接收任务的截止期限。  相似文献   

15.
一个可靠的集群簇/网格监控系统   总被引:2,自引:0,他引:2  
魏文国  张凌  董守斌  梁正友 《计算机应用》2004,24(5):143-144,147
以开放源代码的Ganglia为基础设计和实现了一个具有更高可靠性的集群簇/网格监控系统,该系统能够抵御汇集节点和与之相连的线路的失效。并对可靠性的设计、定量分析与实现,性能的理论分析与实际测试作了论述。理论分析和实验都表明,系统的实现在几乎没有牺牲性能的情况下,取得了更高的可靠性。  相似文献   

16.
随着信息化建设的推进,地理信息系统在网管系统中的地位越来越重要。但是不同项目对地理信息系统有着不同的使用需求,同一套软件框架需要进行大量的适应性修改,才能同时适应不同的地理信息系统。针对两套地理信息系统进行了统一的接口封装,使软件框架对于不同的地理信息系统可以采用同样的接口调用,从而降低了软件开发的复杂度,提高了开发效率。  相似文献   

17.
一种基于网络存储协议的OS远程启动机制   总被引:1,自引:0,他引:1  
文章提出了一种基于网络存储协议的操作系统远程启动机制,解决了基于文件下载的远程启动协议难以支持多文件内核操作系统(如Win2000/XP等)的问题,并给出了实现示例的性能测试结果。  相似文献   

18.
云计算集群服务器系统监控方法的研究   总被引:1,自引:0,他引:1  
随着云计算技术越来越多地应用到信息产业的各个领域,云计算环境下集群服务器系统的监控与管理的需求越来越大。云计算下的集群服务器系统主要是通过一系列基于分布式架构的服务器集群组成,其下的服务器数量可能多达上万台。要管理好数量如此大的云计算集群服务器系统,保证其高性能运行,必然需要一套有效的云计算集群监控系统对其进行监测与调控。但是,传统的集群监测系统存在一些不足与弊端。本文对于云计算集群系统的高性能监测调度方案进行了研究,从云监控系统的架构、数据采集、负载均衡调度方面进行了探讨,构建了一个保证云计算集群系统高性能运营的云系统方案。  相似文献   

19.
传统集群计算系统无法充分利用本地磁盘的存储资源和I/O,大量网络I/O成为系统瓶颈,导致资源利用率降低,并造成高昂的存储和网络成本.使用Hadoop处理分析作业可有效利用本地磁盘存储和I/O资源,而集群资源统一管理工具Mesos则使用轻量化的设计和高效的通信机制,能在不同计算集群之间动态共享集群资源.为此,分析高能物理数据处理的特点,利用Mesos构建异构集群间资源共享的高能物理实验数据处理系统,实现Torque/Maui和Hadoop集群的集成.测试结果表明,该系统能够在集群间动态分配集群资源,并利用本地存储和磁盘I/O显著降低网络I/O,提高集群资源利用率.  相似文献   

20.
结构脆弱性是大规模分布式系统的典型脆弱性类型之一.针对大规模分布式系统实体间复杂的依赖关系和冗余备份机制,构建了实体拓扑模型.该模型采用简单有向图描述实体间依赖关系,采用故障容忍机制刻画节点间的冗余关系,并引入权值刻画节点或边失效对于业务流程的影响.在此基础上,提出了基于权值的大规模分布式系统结构脆弱性分析算法,该算法通过权值计算和基于故障传递的剪枝方法发现并验证结构脆弱性.通过算法分析和实现充分验证了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号