首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 93 毫秒
1.
分布式系统故障卷回恢复技术研究与实践   总被引:1,自引:0,他引:1       下载免费PDF全文
对时间要求苛刻的系统对可靠性的要求愈来愈高,尤其是在一些至关重要的领域如国防、航天技术等。本文介绍了分布式系统故障卷回恢复的关键技术。  相似文献   

2.
分布式网络故障检测及恢复技术研究   总被引:2,自引:0,他引:2       下载免费PDF全文
IEC 62439系列协议专为高可用性工业自动化网络所设计,它们各具特点,着重分析IEC 62439-6 DRP(分布式冗余协议)的通信机理以及故障检测与恢复机制。根据DRP环形网络循环周期、网络交换设备数量、报文处理时间等一系列参数,提出了一种关于故障检测至恢复所需时间的算法。经测试平台的验证,DRP网络能迅速地检测出节点和链路的故障,并能在短时间内恢复网络的通信功能,满足现代工业网络对网络高可用性的要求。  相似文献   

3.
高可用实时系统中故障检测及故障恢复技术的研究   总被引:3,自引:2,他引:3       下载免费PDF全文
随着国防、航天等今天对系统的可用性和实时性的要求不断提高,如何保证这些应用系统的高可用及强实时,成为一个亟待解决的问题。本文论述了高可用实时系统听故障检 测及故障恢复技术。  相似文献   

4.
分布式实时系统双工容错技术研究   总被引:3,自引:0,他引:3       下载免费PDF全文
本文介绍一个高可用性的分布式实时双工系统。文中首先建立了系统模型,通过模型给出了系统高可用性的定量公式,最后着重介绍了实现双工的几种主要技术,包括机组切换、数据恢复和双工结果处理等。  相似文献   

5.
分布式实时系统中任务调度问题的研究   总被引:1,自引:0,他引:1  
胡金初 《计算机科学》2003,30(7):130-131
1 引言由于大规模集成电路的集成度越来越高,在一个系统中,要进一步大幅度提高单个计算机的性能就变得越来越困难。随着网络和通信技术的发展,现在使用一组计算机来完成一个分布式应用已经变得很普遍了。在实际应用中,采用多计算机的系统往往成为一种现实而又经济的选择。并行计算机和分布式系统的出现为高性能计算的应用开辟了广阔的天地。  相似文献   

6.
分布式实时系统的高可靠性研究与实现   总被引:16,自引:2,他引:16  
将实时特性引入分布式系统将会给系统可靠性与分析带来许多新的变化。  相似文献   

7.
在分析DRP分布式环形网络冗余协议故障诊断和恢复机理的基础上,建立DRP故障恢复时间模型,将故障恢复的时间分为故障定位等待时间、故障报警时间和故障处理时间,分别针对交换设备管理模块故障扣通信链路故障,以及DRP方法对不同故障的探测方式,分析影响不同故障恢复时间的各种因素,并根据算法得出制约故障恢复时间提高的主要因素,并通过实验验证各种不同故障在EPA现场网络中故障恢复时间.  相似文献   

8.
为解决配电网络接入分布式电源后,潮流变为双向流动,无法使用传统馈线自动化技术进行故障处理的问题,提出在分布式电源条件下定位故障区域的简单方法,并提出分布式电源因故障切除后,非故障区域快速恢复供电的计算方法.通过某地区配电环网算例,证明了两种方法的正确性及实用性.  相似文献   

9.
可扩展的分布式邮件系统的研究与实现   总被引:1,自引:0,他引:1  
提出了一种可扩展、分布式的邮件系统设计方案.通过远程过程调用和负载的动态分配,可以将邮件储存在多个服务器上,解决了单台服务器CPU、磁盘I/O性能不足的问题;通过邮件的同步备份实现了故障冗余.通过用户映射表结构,可以将用户分配到各个服务器上,当系统中有服务器发生故障或者新增加服务器时,能够对用户进行重新分配,动态地维持每一个服务器的管理责任.实际的测试结果表明,系统性能随着服务器数量的增加基本呈线性增长,邮件服务不会由于部分服务器发生故障而终止.  相似文献   

10.
一种新的用于分布式系统的恢复技术   总被引:1,自引:0,他引:1  
本文提出了在总线型局部网络结构的分布式系统中,针对单节点机发生故障的情况下,以进程间的通讯关系来设置断点的方法,建立相应的进程通讯关系表,从而提出一种新颖的系统恢复算法。该算法的主要思想是:若某节点机发生故障,则该位置,以使进程通讯关系表恢复到一致状态。在本算法中,回郑时所要作废的通讯总次数最大为U-Uq1+1,它的算法复杂度最大为:O。  相似文献   

11.
高钰  王栋  戴千旺  窦文生  魏峻 《软件学报》2023,34(12):5578-5596
分布式系统的可靠性和可用性至关重要.然而,不正确的失效恢复机制及其实现会引发失效恢复缺陷,威胁分布式系统的可靠性和可用性.只有发生在特定时机的节点失效才会触发失效恢复缺陷,因此,检测分布式系统中的失效恢复缺陷具有挑战性.提出了一种新方法 Deminer来自动检测分布式系统中的失效恢复缺陷.在大规模分布式系统中观察到,同一份数据(即共用数据)可能被一组I/O写操作存储到不同位置(如不同的存储路径或节点).而打断这样一组共用数据写操作执行的节点失效更容易触发失效恢复缺陷.因此, Deminer以共用数据的使用为指导,通过自动识别和注入这类容易引发故障的节点失效来检测失效恢复缺陷.首先, Deminer追踪目标系统的一次正确执行中关键数据的使用.然后, Deminer基于执行轨迹识别使用共用数据的I/O写操作对,并预测容易引发错误的节点失效注入点.最后, Deminer通过测试预测的节点失效注入点以及检查故障征兆来暴露和确认失效恢复缺陷.实现了Deminer原型工具,并在4个流行的开源分布式系统ZooKeeper、HBase、YARN和HDFS的最新版本上进行了验证.实验结果表明Demine...  相似文献   

12.
王准  陈俊亮 《软件学报》1999,10(4):430-435
在由多进程组成的分布式系统中,为了保证系统在失效之后进程状态恢复的一致性,某一进程的状态回卷将引起所有与之有依赖关系的进程的后退.已有的依赖关系定义过于严格,该文重新定义了进程状态之间的依赖关系,可以减小进程状态卷回所造成的影响.  相似文献   

13.
数据库资源是企业和社会一种无可替代的财富,数据库系统恢复在信息时代的今天变得越来越重要。简述了数据库恢复原理和基本策略,提出了系统观点并对数据库系统恢复进行了深入思考。  相似文献   

14.
FlexRay is a vehicular communication protocol designed to meet growing requirements in hard real time automotive systems and to support time triggered as well as event triggered paradigms. Thus, there has been a lot of recent interest in timing analysis techniques in order to provide bounds for the message communication times on FlexRay. In this paper, we present an approach to compute the WCRT (worst case response time) for periodic and sporadic tasks, within a FlexRay node, responsible for sending messages on the FlexRay SS (static segment) and DS (dynamic segment). On the other hand, we propose a scheduling table for messages transmitted over the FlexRay SS. An interesting innovation would be the use of a scheduling algorithm performed on a FlexRay node to guarantee the arrival of the right data on the right time and to ensure that every task meets its deadline. As application, we will use the extended SAE (society of automotive engineers) benchmark for the FlexRay network to identify the static and dynamic tasks, and calculate the response time, based on a hybrid scheduling model to further prove that the deadline of the SAE benchmark applications is insured.  相似文献   

15.
石油行业上游信息系统涉及勘探与生产的静态、动态数据,数据范围覆盖了上游业务的多个专业。针对石油专业数据的特点,结合一个系统容灾实施案例,对数据建设如何成功实施,并就如何应用灾备方案实现油田数据的本地和异地备份以及在异地提供远程数据查询接替服务给出了具体措施和建议。  相似文献   

16.
This paper presents an efficient, writer-based logging scheme for recoverable distributed shared memory systems, in which logging of a data item is performed by its writer process, instead of every process that accesses the item logging it. Since the writer process maintains the log of data items, volatile storage can be used for logging. Only the readers' access information needs to be logged into the stable storage of the writer process to tolerate multiple failures. Moreover, to reduce the frequency of stable logging, only the data items accessed by multiple processes are logged with their access information when the items are invalidated, and also semantic-based optimization in logging is considered. Compared with the earlier schemes in which stable logging was performed whenever a new data item was accessed or written by a process, the size of the log and the logging frequency can be significantly reduced in the proposed scheme.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号