期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

曹旻吴耿锋徐白昱宋毅《计算机工程与应用》2004,40(6):100-104

论文提出一种结构化新方法,它能通过动态配置支持基于组件的分布式软件的容错。采用面向图形的编程模型,基于组件的分布式软件的软件体系结构可用一个逻辑图来表示,该逻辑图可以精化为一个明确的对象并分布到网络中,软件的动态配置通过执行定义在图上的一系列操作来实现,发生错误时通过动态重配置软件来支持容错。论文描述了该方法的基本模型、系统结构及其在CORBA上的实现原型。相似文献

2.

支持动态配置的分布式程序设计模型 总被引：2，自引：0，他引：2

柳颖陈道蓄谢立曹建农《软件学报》1999,10(9):952-955

分布式系统的动态配置问题近年来引起了各国研究者的广泛关注.该文对面向图结构的分布式程序设计模型GOM(graph-oriented model)进行了扩充和改进,提出了支持动态配置的程序设计模型ExGOM(extended graph-oriented model).ExGOM提供了多种基于图结构的配置操作.用户可在配置文件中描述系统结构的动态变化,也可在程序中利用配置操作进行动态配置.这一特性使得系统可支持不可预计的动态配置.文章还给出了以多Agent机制实现ExGOM的系统结构. 相似文献

3.

一种可行的分布式硬实时容错调度算法

朱萍阳富民涂刚张杰周正勇《软件学报》2012,23(4):1010-1021

针对分布式硬实时系统发生处理机故障后,当前周期内的任务实例和后续实例相对截止期限的不同紧迫程度,提出非紧迫周期内延迟策略——DNUP(delay in non-urgent period).该策略能够尽可能地推迟非紧迫实例的执行,使得低优先级实例有更多的机会完成其紧迫周期内的执行,从而实现处理器空闲(slack)资源的合理挪动.仿真实验结果表明,与其他几个著名的分布式容错调度算法相比,DNUP策略能够提高任务的可调度性,从而有效减少了所需处理机的数目. 相似文献

4.

一种面向软件体系结构的动态重配置方法*

智永锋张骏《计算机应用研究》2008,25(8):2380-2383

通过在整个软件生命周期建立开发模型,研究了当前软件工程与实际需求之间差异。利用基于XML的中间脚本,提出一种事务处理软件开发模型,实现用户功能需求到表单流、事件流和数据流的转换,动态重配置出不同应用的事务处理软件。建立了企事业信息综合事务处理系统开发平台,分析了平台体系结构和中间脚本,表明可以根据业务变化进行整个系统功能重组而不需要编写一句程序,验证了该模型的可行性和有效性。相似文献

5.

一种验证分布式协议活性属性容错机制的模型检测方法

陆超逸聂长海张成志《计算机学报》2021,44(8):1714-1731

云计算是一种通过网络以服务的方式向用户提供按需收费的计算资源的模式,目前企业逐渐将业务部署、数据处理转移到云计算平台上进行.因为可扩展性、性能等各方面需求,所以云平台部署在分布式系统上.由于分布式系统采用大量的商品机通过复杂的结构进行搭建,因此分布式系统中组件发生故障是无法避免的.为了提高分布式系统的可靠性,技术人员在... 相似文献

6.

分布式容错计算机系统的一个冗余结点配置

汪东升杨孝宗《小型微型计算机系统》1998,19(1):14-19

ＦＴ－ＨＩＴ是我们自行研制的一个网络结点机。它采用三模冗余结构，具有容错计算和分布处理功能。本文以ＦＴＨＩＴ系统为背景，论述一种分布式容错计算机系统的结点配置技术，包括系统冗余级别的确定，互连结构的选择以及它的冗余管理技术等。相似文献

7.

动态分布式系统中多层次配置文件的形式描述及管理 总被引：3，自引：0，他引：3

柳颖谢立陈道蓄曹建农《计算机学报》1999,22(6):603-607

介绍了分布式程序设计模型ＥｘＧＯＭ（ＥｘｔｅｎｄｅｄＧｒａｐｈ－ＯｒｉｅｎｔｅｄＭｏｄｅｌ）中一种新型多层次配置文件的结构及相关的配置描述。基于树型结构的多层次的配置文件为分布式系统的动态重配置提供了灵活,清晰的结构和丰富的基于图结构的配置操作,一个树型结构的分布式应用的配置文件包含若干人处于不同层次的深度不大于２的子树,这些子树通过装配对规则可装配成一棵大树,它就是分布式应用程序的逻辑图结构,通相似文献

8.

一种面向多核的可重构容错方法

张绍林杨孟飞刘鸿瑾姜宏王若川《计算机科学》2014,41(5):59-63

随着二代导航、载人航天、深空探测等空间应用对星载电子产品的低功耗和抗辐射容错能力提出更高的需求,传统多机冗余设计星载计算机面临着亟需进行设计升级换代。将可重构技术应用到多核片上系统的设计中,提出了一种基于动态可重构的容错体系结构,在硬件层提高系统的容错能力和扩展性对未来空间工程应用具有重要意义。首先介绍了多核片上系统和可重构技术的基本概念,简要分析了国际宇航可重构系统的研究案例。随后提出了一种基于动态可重构的容错体系结构,即通过基于系统降级的重构策略来实现系统级容错。在方案验证环节,采用LEON3作为处理单元,对容错模块功能进行了仿真验证。仿真结果表明,容错控制满足预期的设计需求。最后对后续工作做了简要规划,并对可重构容错方法设计进行了总结。相似文献

9.

一种容错的分布式服务器复制与更新协议

熊莉陈松《电脑开发与应用》2005,18(8):16-18

针对分布式环境提出一种容错的文件数据复制与更新机制,其算法/协议建立在分布式算法理论的基础上,具有较强的容错性、故障恢复透明性和较高的效率,支持服务器同步和异步两种复制模式以及客户机启动与服务器启动两种工作方式。该机制可广泛应用于Internet分布式文件系统、分布式数据库、WEB镜像服务器以及分布式软件分发、群集服务器等应用中。相似文献

10.

分布式容错计算机通讯系统的实现

暴建民黄仲伟《小型微型计算机系统》1996,17(6):59-63

本文叙述了按照分布式的动态更换通讯模式协议，简称ＤＤＣＣＰＰ（ＤｉａｔｒｉｂｕｔｅｄＤｙｎａｍｉｃＣｈａｎｇｅＣｏｍｍｕｎｉｃａｔｉｏｎＰａｔｔｅｒｎＰｒｏｔｏｃｏｌ）设计和实现的实用于分布式容错计算机的通讯系统，它为系统提供了可靠的硬核，实际运动结果令人满意。相似文献

11.

基于数据流分析的软件容错策略 总被引：4，自引：1，他引：4

刘云龙陈俊亮《软件学报》1998,9(7):537-541

该文就软件容错中备查点与卷回机制展开深入讨论,提出一种基于数据流分析技术的软件容错新方法.首先对软件容错进行简介,指出数据错是一切控制系统软件失效的根源与最终表现以及对数据采取强有力的容错措施的必要性.然后将数据流分析技术应用于软件容错,通过求解程序变量的到达-定值数据流方程来静态地确定任何数据在任何引用点出错时的最小充分卷回,通过求解活跃变量的数据流方程来静态地确定程序在执行各个基本块时需动态保存的变量集合,得出最小充分卷回定理与备查点数据范围定理,从而解决了时间冗余容错途径中必须回答的两个基本问题.此外,还给出了恢复块定义有效的充分条件.最后,以电信系统为应用实例,介绍了该方法的一种具体实施.该方法在简单地扩展后可被广泛应用于各种容错软件的设计中. 相似文献

12.

面向分布式图计算作业的容错技术研究综述

张程博李影贾统《软件学报》2021,32(7):2078-2102

随着图数据规模的日益庞大和图计算作业的日益复杂,图计算的分布化成为必然趋势.然而图计算作业在运行过程中面临着分布式图计算系统内外各种来源的非确定性所带来的严峻的可靠性问题.首先分析了分布式图计算框架中不确定性因素和不同类型图计算作业的鲁棒性,并提出了基于成本、效率和质量3个维度的面向分布式图计算作业的容错技术评估框架,... 相似文献

13.

分布式计算系统回卷恢复容错的仿真设计

董奇 黄斌 颜耀 李韦韦 曾玮妮 张恒 《计算机与现代化》2017,(4):48

为了解决分布式计算系统回卷恢复容错的验证评估问题,设计一种分布式计算系统的回卷恢复容错算法的仿真机制,依据分布式计算系统回卷恢复容错的总体架构,将分布式计算系统中的节点任务过程使用离散事件模拟,在网络系统仿真工具的应用层增加支持多任务回卷恢复容错仿真的模块,并设计用于回卷恢复容错仿真的结构、功能模块和系统参数设定。结果表明本文提出的仿真机制能够实现分布式计算系统的回卷恢复容错算法的模拟验证,为不同容错算法间对比、改进与优化提供参照。  相似文献

14.

容错的分布式系统通用死锁模型检测解除算法

程欣刘宏伟董剑杨孝宗《计算机研究与发展》2007,44(5):798-805

分布式系统技术为采用低成本购建高性能系统提供了有效的途径,但是由于资源的分配与需求可能产生冲突,造成系统中发生死锁,导致系统运行陷入停滞.在不可靠的分布式系统中,故障会干扰正常的死锁检测,但现有的死锁检测算法不具有容错功能.对失效形式进行了归类,提出一个容错的死锁检测解除算法.算法建立在通用的AND-OR 模型基础上,采用扩散计算和集中规约方式,不仅能够检测到死锁,而且能给出死锁环的全部成员.若死锁拓扑处于静态且为环状,算法的消息复杂度的上限为e+n-1,时间复杂度为d,其中e为死锁等待图中边的个数,n和d为构成死锁环的节点的个数,分析表明算法性能等于或优于同类算法. 相似文献

15.

实时分布式计算机系统的容错技术研究

黎珊珊《计算机与数字工程》2002,30(6):61-64,31

本文提出了一种具有容错功能的实时分布式计算机系统的体系结构，同时对实时分布式计算机系统中的容错技术进行了研究，特别对实时分布式计算机系统中的节点机容错技术及实时性的实现方面做了较深入的讨论，并提出了实现方案。相似文献

16.

软件容错：技术与展望

下载免费PDF全文

孙鹏赵军锁张文君《计算机工程与科学》2007,29(8):88-93

本文主要给出现有主流软件容错技术的一个综述。首先从传统软件容错技术开始，介绍设计多样性和数据多样性；然后介绍主流的软件容错新技术，如重配置与重恢复、指令复制错误探测、SWIFT等，同时，站在软件容错用于处理嵌入式系统硬件暂态故障的角度对这些技术进行了分析；最后在对它们比较的基础上探讨软件容错技术的可能发展方
向。相似文献

17.

异构分布式负载均衡容错算法研究

下载免费PDF全文

邓建波张立臣《计算机工程》2011,37(5):62-64

基于基/副版本技术提出一种异构分布式容错调度模型,并在该模型上提出HDL算法。该算法克服了以前算法在故障发生前后负载均衡性不稳定问题,并在一定程序上实现均衡可控性,同时在模拟实验中给出一种基于协方差反映负载均衡性的方法。实验结果证明,该算法的负载均衡性在故障发生前后是稳定的。相似文献

18.

Supporting Cost-Effective Fault Tolerance in Distributed Message-Passing Applications with File Operations 总被引：1，自引：0，他引：1

Ouyang Jinsong Maheshwari Piyush 《The Journal of supercomputing》1999,14(3):207-232

In this paper we present an approach to reliable distributed computing, which incorporates fault tolerance into applications at low cost, in terms of both run-time performance and programming effort required to construct reliable application software. In our model fault tolerance is based on distributed consistent checkpointing and rollback-recovery integrated with a user-level reliable transmission protocol. By employing novel techniques 8and algorithms, our approach is distinguished from other consistent checkpointing schemes by the following features: first, minimum communication overhead for constructing a consistent distributed checkpoint and catching messages in transit during checkpointing; second, tolerance to message losses due to site failures or unreliable non-FIFO networks; and third, efficient checkpointing and recovery of persistent state, i.e., user files. Based on the model, a software library prototype called Libra has been implemented for supporting fault tolerance in distributed message-passing applications with file operations. The library provides an easy to use programming interface including message-passing and file I/O primitives, which hides the complexity of both fault-tolerant network communications and checkpointing and recovering user files from the application level. Experience with a number of long-running distributed applications shows that Libra can provide fault tolerance in a cost-effective manner. 相似文献