期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

傅强《测控技术》2013,32(5):32-34

针对航空发动机发生故障时系统的容错能力问题,设计了基于特征结构配置方法的容错控制系统。首先分析了被动容错控制的特点和优点,然后采用特征结构配置的方法,在配置系统极点的同时,还配置系统的特征向量,并对系统进行重新调节以获得整个系统在故障发生后的稳定性与可靠性,给出了特征结构配置方法的具体设计步骤。最后,针对某型航空发动机的设计工况点模拟系统发生故障,即参数发生摄动时,对所设计的容错系统鲁棒性进行了分析计算。仿真算例结果表明,所设计的容错系统具有较好的抗干扰能力,即较好的鲁棒性。相似文献

2.

基于动态事件触发的混沌系统故障容错同步问题

马大中李晓瑜孙秋野《控制与决策》2018,33(12):2184-2190

针对混沌系统故障容错同步问题进行研究,设计基于动态事件触发的同步控制器以实现混沌系统的故障容错同步.首先,针对系统中存在的故障环节构造故障容错的系统模型,在此基础上采用输入-状态稳定性(ISS)的方法,将控制器求解问题转化为求解所对应故障容错系统的稳定性问题;然后,通过构造Lyapunov函数给出混沌系统故障容错同步的充分条件,通过引入动态变量,使得所设计的触发条件可以根据系统的运行状态进行动态调整,在实现系统故障容错同步的同时,最大程度地降低网络的占用率;最后,通过数值仿真验证所提出方法的有效性. 相似文献

3.

一类非线性系统的故障重构与容错控制

王旭沈艳霞吴定会《测控技术》2018,37(10):148-152

针对一类满足Lipschitz条件的仿射非线性系统,提出一种执行器故障重构与容错控制方法。通过非奇异变化矩阵对系统进行降阶,设计出滑模故障重构观测器,优化滑模策略,使滑模故障重构观测器渐进估计系统的状态,并给出稳定性分析。运用等价输出控制方法直接获取故障信息,实现执行器故障的检测与重构。设计出主动容错控制器,通过补偿控制,完成执行器故障的容错控制。最后通过数值仿真验证了方法的可行性与有效性。相似文献

4.

容错计算网格作业调度模型的研究 总被引：14，自引：1，他引：14

金海陈刚赵美平《计算机研究与发展》2004,41(8):1382-1388

网格技术的发展对网格系统的效率和服务质量提出了更高要求．在综合研究目前网格作业调度环境的基础上，提出一种容错计算网格作业调度的随机Petri网模型，并给出了网格作业分派策略和计算站点内的作业选择策略，以及容错计算网格的性能评价指标．仿真实验对容错计算网格的性能进行有效的分析，反映故障对网格中不同类别作业的影响．相似文献

5.

一种基于数据流分析的故障序列生成方法

谭兰芳谭庆平徐建军《小型微型计算机系统》2012,33(4):716-721

故障注入是一种测评容错机制的有效方法,它通过有意识地向目标系统引入故障来加速测试容错机制的试验过程.目前大多数故障注入实验中采用的故障序列都是通过随机抽样获取的,容易造成故障潜伏,从而导致容错机制的评测结果不准确.本文提出一种基于数据流分析的故障序列生成方法.提出<故障注入位置,故障注入时间,故障类型,故障掩码>的单粒子故障模型.在此基础上,通过数据流活跃变量分析计算得出故障注入位置属性,以及定值-引用分析确定了故障注入时间属性.并以PowerPC8548处理器和它对应的Trace模拟器为实验平台,验证了该故障序列生成方法具有90%以上的失效加速比,较好地解决了故障潜伏问题. 相似文献

6.

基于滑模控制的卫星姿态控制算法研究

下载免费PDF全文

王飞《计算机测量与控制》2018,26(5):69-72

针对卫星姿态控制系统存在外部扰动和执行器故障的情况下,提出一种基于非线性观测器技术和滑模控制理论的容错控制器设计方案。首先,建立含有外部扰动和执行器故障的刚体卫星姿态控制系统运动学方程和动力学方程。然后,通过非线性干扰观测器估计系统中的未知故障,进而利用故障信息基于滑模控制策略设计容错控制器。通过Lyapunov函数证明闭环姿态控制系统的稳定性。最后通过数值仿真验证该容错控制方案的鲁棒性和可行性。相似文献

7.

一类受扰非线性系统存在执行器及元件故障时的容错控制 总被引：1，自引：1，他引：0

范玲玲宋永端《自动化学报》2011,37(5):623-628

本文研究了一类受扰非线性系统存在执行器及元件故障时的镇定控制问题。新的容错控制算法不需要对执行器故障范围界值进行分析估算,因此与现存的方法相比,设计的控制策略结构更加简单,也不需要大量的在线计算。结果表明,应用所设计的控制方法,不仅保证执行器及元件故障下系统的稳定性,也能够有效抑制那些与状态相关不断增长的干扰对系统的影响。通过Lyapunov稳定性理论分析和仿真,均证明了所设计控制算法的有效性,能保证系统同时存在外界干扰、参数不确定性以及执行器/元件故障时的稳定性. 相似文献

8.

基于网络感知的容错志愿计算

樊沛沈锐《计算机科学》2011,38(6):38-40,63

针对志愿计算系统中节点分布在不同地理位置的特性,分析了传统主一从计算模型在志愿计算系统中的缺陷,提出了基于网络感知的容错志愿计算模型,该模型考虑了节点的网络因素,将节点划分到不同的子集中,基于该模型能够处理由于网络因素造成的故障。另一方面对传统的覆盖容错策略进行了改进并将其应用到容错志愿计算中。实验结果表明,基于网络感知的模型和改进覆盖容错策略能够显著地提高志愿计算系统的可靠性和性能。相似文献

9.

基于滑模观测器的临近空间飞行器容错控制

林常青李学虎《控制工程》2012,19(3):394-398

针对临近空间飞行器中结构未知的执行器故障,提出一种基于滑模观测器的容错控制方法。采用Edwards-Spurgeon观测器结构设计滑模观测器,实现对执行器故障的鲁棒估计。根据所得的故障信息设计模型参考滑模容错控制器,控制律的非线性增益分为两部分,保证系统的鲁棒容错性能。一部分利用参数不确定的界值条件设计,一部分基于鲁棒故障估计信息设计。基于李雅普诺夫稳定性理论证明了系统的渐近稳定性。仿真结果表明,该方法能有效实现对执行器故障的鲁棒估计,并保证故障条件下飞行器对参考模型的稳定跟踪性能,达到了期望的容错效果。相似文献

10.

基于神经网络的非线性系统故障检测及容错控制方法 总被引：8，自引：1，他引：8

李庆国冯玉珠佟绍成柴天佑《信息与控制》1998,27(6):440-445

利用神经网络的非线性建模能力，提出了一种非线性系统的故障检测及容错控制方法。在本方法中，首先应用神经网络设计故障估计器，在线估计系统故障向量，实现故障检测；在此基础上，引入补偿控制器，消除故障对系统运行的影响，从而实现容错控制。同时基于Ｌｙａｐｕｎｏｖ方法进行了稳定性分析。相似文献

11.

Proactive process-level live migration and back migration in HPC environments

Chao Wang Frank Mueller Christian Engelmann Stephen L. Scott 《Journal of Parallel and Distributed Computing》2012

As the number of nodes in high-performance computing environments keeps increasing, faults are becoming common place. Reactive fault tolerance (FT) often does not scale due to massive I/O requirements and relies on manual job resubmission. 相似文献

12.

云数据管理索引技术研究 总被引：7，自引：3，他引：4

马友忠孟小峰《软件学报》2015,26(1):145-166

数据的爆炸式增长给传统的关系型数据库带来了巨大的挑战,使其在扩展性、容错性等方面遇到了瓶颈.而云计算技术依靠其高扩展性、高可用性、容错性等特点,成为大规模数据管理的有效方案.然而现有的云数据管理系统也存在不足之处,其只能支持基于主键的快速查询,因缺乏索引、视图等机制,所以不能提供高效的多维查询、join等操作,这限制了云计算在很多方面的应用.主要对云数据管理中的索引技术的相关工作进行了深入调研,并作了对比分析,指出了其各自的优点和不足;对在云计算环境下针对海量物联网数据的多维索引技术研究工作进行了简单介绍;最后指出了在云计算环境下针对大数据索引技术的若干挑战性问题. 相似文献

13.

Analyzing the techniques that improve fault tolerance of aggregation trees in sensor networks

Laukik Alin Sanjay 《Journal of Parallel and Distributed Computing》2009,69(12):950-960

Sensor networks are finding significant applications in large scale distributed systems. One of the basic operations in sensor networks is in-network aggregation. Among the various approaches to in-network aggregation, such as gossip and tree, including the hash-based techniques, the tree-based approaches have better performance and energy-saving characteristics. However, sensor networks are highly prone to failures. Numerous techniques suggested in the literature to counteract the effect of failures have not been carefully analyzed. In this paper, we focus on the performance of these tree-based aggregation techniques in the presence of failures. First, we identify a fault model that captures the important failure traits of the system. Then, we analyze the correctness of simple tree aggregation with our fault model. We then use the same fault model to analyze the techniques that utilize redundant trees to improve the variance. The impact of techniques for maintaining the correctness under faults, such as rebuilding or locally fixing the tree, is then studied under the same fault model. We also do the cost-benefit analysis of using the hash-based schemes which are based on FM sketches. We conclude that these fault tolerance techniques for tree aggregation do not necessarily result in substantial improvement in fault tolerance. 相似文献

14.

提升大规模集群上并行计算软件系统可靠性和服务性的方法与实践

下载免费PDF全文

林彦宇陈虎苗军韩佳龙媚赖路双《计算机工程与科学》2015,37(1):1-6

大规模集群上的并行计算软件需要具备处理部分节点、网络等失效的容错能力,也需要具有易于管理、维护、移植和可扩展的服务能力。针对星形计算模型,研究和开发了一套并行计算框架。利用调度节点内部的可变粒度分解器、相关队列等方法,实现了全系统容错,且具有较好的易用性、可移植性和可扩展性。系统目前可以实现300TFlops计算能力下连续运行超过150h,而且还具有进一步的可扩展能力。相似文献

15.

TMR计算机系统分布与容错工作方式间的切换 总被引：1，自引：1，他引：0

汪东升杨孝宗《小型微型计算机系统》1996,17(10):12-15

ＦＴ－ＨＩＴ是我们自行研制的三模冗余航天容错计算机。系统采用硬件三模冗余结构和主要由软件实现容错的冗余管理模式，具有容错计算和分布处理两种工作方式，保证了航天容错计算机的高可靠性和强大的处理能力。本文主要论述其容错和分布两种工作方式间的切换机理并给出具体的实现算法，算法对于一相似文献

16.

Reliability-aware performance model for optimal GPU-enabled cluster environment

Supada Laosooksathit Raja Nassar Chokchai Leangsuksun Mihaela Paun 《The Journal of supercomputing》2014,68(3):1630-1651

Given that the reliability of a very large-scaled system is inversely related to the number of computing elements, fault tolerance has become a major concern in high performance computing including the most recent deployments with graphic processing units (GPUs). Many fault tolerance strategies, such as the checkpoint/restart mechanism, have been studied to mitigate failures within such systems. However, fault tolerance mechanisms generate additional costs and these may cause a significant performance drop if it is not used carefully. This paper presents a novel fault tolerance scheduling model that explores the interplay between the GPGPU application performance and the reliability of a large GPU system. This work focuses on the checkpoint scheduling model that aims to minimize fault tolerance costs. Additionally, a GPU performance analysis is conducted. Furthermore, the effect of a checkpoint/restart mechanism on the application performance is thoroughly studied and discussed. 相似文献

17.

利用DRBD和OpenSSI构建高可用集群系统

龚念袁由光《计算机与数字工程》2007,35(8):45-47,116

为提高集群系统的可靠性和计算性能并降低成本,提出将单一系统映像的集群系统(Single System Image)和分布式复制块设备技术(DRBD)结合起来构建一种高可用集群(SSI-DRBD集群).这种利用单一系统映像和DRBD技术所构建的集群具有高性能、高可靠、实时性强、易管理和低成本等特点,可作为周期性、高强度和多元信息处理的平台. 相似文献

18.

MPI程序容错系统的分析和设计

下载免费PDF全文

张庆成金海张浩《计算机工程与科学》2005,27(6):89-92

MPI是大规模集群和网格平台中最通用的编程环境,但其运行环境经常会因为节点或网络的故障而出现错误,所以有必要为MPI编程提供容错机制。本文分析了实现MPI程序容错的关键技术,并针对运行MPICH-P4的LINUX集群,利用检查点和消息日志技术,通过改造和扩充MPI底层的P4通信库,提出了一套MPI程序容错系统的具体实施方案。相似文献

19.

大规模并行计算机系统硬件故障容错技术综述

下载免费PDF全文

富弘毅杨学军《计算机工程与科学》2010,32(10):38-43

计算机系统的容错是一个不容忽视的问题。近年来,随着系统结构的复杂性增加,半导体制造工艺的发展,线宽的降低以及集成度的提高,从用户桌面系统到分布式计算环境,乃至大规模并行计算机系统,功耗和可靠性问题都很突出。本文首先介绍了计算机系统可靠性和容错技术的基本概念、基本方法和基本思想,然后回顾了近些年来一些具有代表性的硬件故障检测技术和硬件故障恢复技术,其中重点介绍了针对大规模并行计算机系统提出的容错方法。本文还介绍了我们在先前的研究工作中提出的一种优化的故障恢复技术,称为容错并行算法。最后,总结了一些可能的研究方向。相似文献

20.

基于反射的容错CORBA系统的设计与实现

李征吴俊敏黄刘生吴敏《计算机工程》2005,31(17):84-86

容错是实现系统可靠性的一个重要手段。单一的容错策略已经不能满足当今分布式系统动态变化的要求,因此容错策略可配置的重要性就凸现出来。该文结合编译期反射和运行期反射,提出了可配置CORBA容错结构,并使用OpenC＋＋和拦截器实现了一个容错CORBA原型系统。该方法不需要修改CORBA ORB,而只需要对应用作极少的改动。相似文献