首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 328 毫秒
1.
探讨高性能计算机的可靠性技术与发展趋势   总被引:1,自引:0,他引:1  
随着电子计算机信息技术的不断发展,高性能计算机系统所具有的性能也开始不断提升,整个硬件规模较之以前相比,扩大较为明显.怎样从根本上保证计算机系统实现可靠稳定运行,是现阶段高性能计算机研制过程中面临的一个重要挑战,本文主要介绍了计算机可靠性技术的实际运用状况,对其发展趋势进行了深入探讨,从而提升有关工作人员对计算机中的可靠性技术认识水平.  相似文献   

2.
介绍了复杂可编程逻辑器件EPM3256E在数字通讯系统中的应用.给出系统的硬件电路设计,包括DSP串口扩展电路以及人机接口电路的设计.这一应用使系统有足够的冗余和灵活性,并提高可靠性和可升级性.  相似文献   

3.
杜永良  高亚奎 《测控技术》2015,34(6):150-153
本研究的主要目的是在保障可靠性需求的前提下,减少飞行控制系统设计中的硬件冗余.所提出的策略主要包括:信息冗余、解析冗余、时间冗余、气动冗余等.将信息冗余从编码范畴扩展到飞控系统线路与传感器故障的检测,同时在充分分析飞控系统信号之间的关系的基础上,给出了它们之间的转换关系,讨论了时间冗余对瞬态故障抑制的作用,并研究了控制面间气动冗余的相互补偿作用.所提供的故障诊断与信号重构方法几乎涉及飞控系统所有重要信号,因此使用这些策略可以降低硬件冗余,同时降低系统复杂度、重量、空间、费用以及研发时间.  相似文献   

4.
空间机器人冷热双冗余CAN总线系统的研制   总被引:1,自引:0,他引:1  
设计实现了一种能应用在空间机器人计算机控制系统中的冷热双冗余CAN总线系统。详细论述了这种冗余CAN总线系统的硬件电路设计方案,以及该总线系统相较其他冗余方式的不同特点,并给出了配合硬件结构的软件容错策略,建立系统模型进行了可靠性分析。最后对该系统的冗余功能和系统性能进行了实际测试。  相似文献   

5.
针对汽车自适应前照灯系统(AFS),分别从硬件设计和软件设计两方面进行了可靠性论述,并通过软硬件协同工作来提高系统整体可靠性;设计了两路主从冗余控制,并分析了系统的可靠性.  相似文献   

6.
FD-2000城市消防远程监控系统是一个实时监控系统,它对实时性和可靠性都有很高要求。该系统通过采用分布式软件系统、硬件设备冗余、容错技术等来提高系统的可靠性。实践证明,这些容错技术在该系统中的应用是非常有效的。  相似文献   

7.
嵌入式系统是将应用程序和操作系统与计算机硬件集成在一起的系统,目前对嵌入式系统数据处理需求在不断提高,单纯依靠提高处理器的性能,来提高系统的实时性已经无法满足.提出了一种新的架构,在系统中使异构多处理器来保证实时性,采用并行技术,同样有助于提高系统的处理能力,再加上系统采用冗余备份,有助于提高可靠性,在设计中采用国产处理器,双机冗余备份及存储系统,动态热备份技术,对要求可靠性高、速度快的实时控制领域具有重要意义.  相似文献   

8.
高可用性是对通信系统的主要要求之一,冗余设计是提高系统可用性的有效方法。通信系统的冗余设计包括设计高效、可靠的系统架构,系统及部件可靠性分析,冗余部件及冗余方式选择,全面、准确的告警机制设计,高速的切换互锁机制设计,高效的冗余数据同步方式设计等。冗余设计可以提高系统的可靠性,也提高了系统成本和系统复杂度,增加设计的难度,如何合理而有效地进行系统冗余设计,是值得研究的课题。  相似文献   

9.
结合客户需求,通过热备硬件和软件冗余程序设计控制系统冗余方案.从热备硬件和冗余程序设计的角度分别分析了冗余系统的可靠性和系统主备站切换时间,实践证明冗余系统的可行性与有效性.  相似文献   

10.
对系统可靠性的探讨一直是航天飞行器设计过程中的首要议题,飞行控制系统作为核心系统,一旦出现故障会导致整个飞行任务的失败。以提升飞行可靠性需求为出发点,提出了一种基于1553B总线的飞行控制计算机三冗余设计方案,给出了冗余飞控系统的架构设计、控制板硬件构成、三模块同步方案和表决算法等设计方法,完成了飞行控制系统的冗余设计策略研究。为适应飞控系统的国产化、小型化、轻质化设计趋势,采用了基于国产SoC芯片的SiP模块以实现工程化。为研究三冗余系统方案可靠性,分析其工作状态建立了Markov模型。最后以Simulink图形化建模方法完成了相关仿真,通过对系统进行典型故障注入验证了冗余管理算法,仿真结果表明提高系统故障检测覆盖率有利于增强系统可靠性。  相似文献   

11.
基于进化硬件的自修复TMR系统设计及其可靠性分析   总被引:2,自引:0,他引:2  
将进化硬件与传统TMR容错设计思想相结合,提出了一种具有在线自修复功能的自修复TMR系统设计方法。该系统具有多重容错和修复机制:总体采用TMR,可自动检测到故障模块;系统中每个模块均采用组件备份法,可通过组件切换法快速修复模块故障;而模块中每个组件也可通过进化进行修复。因而具有更强的容错能力和更高的可靠性。以具有片内三模冗余的2 bit乘法器为例进行了验证。最后,给出了该系统的可靠性模型,推出了可靠性计算公式,从理论上对该系统的可靠性进行了分析。结果表明:该系统能有效修复stuck-at故障,具有更长的使用寿命和更高的可靠性。  相似文献   

12.
王之元  杨学军  周云 《软件学报》2012,23(4):1022-1035
随着系统规模的扩大,并行计算的性能不断提高,但可靠性却也在不断下降,因此需要采用某种容错机制来容忍或恢复硬件故障和数据错误.目前常用的容错机制Checkpoint/Restart和多模冗余均引入了额外的开销,这些开销均在某种程度上制约了并行计算的可扩展性.因此,在高性能计算需求不断增长的今天,可扩展容错机制的设计显得尤为迫切和重要.以三模冗余(triple modular redundancy,简称TMR)为典型案例,描述了传统TMR在大规模MPI 并行计算上的实现方法,分析了该机制所面临的实际问题,进而指出传统TMR制约了并行计算的扩展.根据该技术所面临的问题,设计了可扩展三模冗余(scalable triple modular redundancy,简称STMR),并进一步验证了其有效性和可扩展性.该机制不仅能够处理Checkpoint/Restart针对的fail-stop故障,还能够解决绝大部分硬件不能直接感知的数据错误.最后,借用BlueGene/L的系统参数进行模拟,预测当系统规模增大时,在分别采用TMR和STMR的情况下并行计算可扩展性的变化,结果进一步验证了STMR是可扩展的容错机制.  相似文献   

13.
Task allocation policy and hardware redundancy policy for distributed computing system (DCS) are of great importance as they affect many system characteristics such as system cost, system reliability and performance. In recent years, abundant research has been carried out on the optimal task allocation and/or hardware redundancy problem, most of which took a reliability-oriented approach, i.e., the optimization criterion was system reliability maximization. Nevertheless, besides system reliability, other system characteristics such as system cost may be of great concern to management. In this paper, we take a cost-oriented approach to the optimal task allocation and hardware redundancy problem for DCS, which addresses both system cost and system reliability issues. A system cost model which could reflect the impact of system unreliability on system cost is developed, and by minimizing the total system cost, a satisfactory level of system reliability could be reached simultaneously. In the reliability modeling and analysis of DCS, we take both hardware reliability and software reliability into account. Two numerical examples are given to illustrate the formulation and solution procedures, in which genetic algorithm is used. Results show that based on the developed system cost model, appropriate decision-makings on task allocation and hardware redundancy policies for DCS could be made, and the result obtained seems to be a fairly good trade-off between system cost and system reliability.  相似文献   

14.
冗余技术提高PLC控制系统可靠性的研究   总被引:1,自引:0,他引:1       下载免费PDF全文
针对工业现场对PLC控制系统可靠性提出更高的要求,提出利用冗余技术提高其可靠性。分析了硬件冗余和软件冗余在PLC控制系统中的应用,详细阐述了PLC控制器、输入输出口、通讯网络和电源各自的冗余方法,并着重以西门子300/400系列PLC为例进行了软硬件冗余的架构和原理分析。最后对冗余控制系统的可靠性进行分析,结果表明,使用冗余技术可使PLC控制系统的可靠性得到明显提高。  相似文献   

15.
In recent years, we have witnessed a growing interest in high performance computing (HPC) using a cluster of workstations. This growth made it affordable to individuals to have exclusive access to their own supercomputers. However, one of the challenges in a clustered environment is to keep system failure to the minimum and to achieve the highest possible level of system availability. High-Availability (HA) computing attempts to avoid the problems of unexpected failures through active redundancy and preemptive measures. Since the price of hardware components are significantly dropping, we propose to combine both HPC and HA concepts and layout the design of a HA-HPC cluster, considering all possible measures. In particular, we explore the hardware and the management layers of the HA-HPC cluster design, as well as a more focused study on the parallel-applications layer (i.e. FT-MPI implementations). Our findings show that combining HPC and HA architectures is feasible, in order to achieve HA cluster that is used for High Performance Computing.  相似文献   

16.
针对航天测控系统的可靠性需求,提出了一种紧凑型PCI总线测控系统的冗余容错设计方案。系统下位机采用了基于VxWorks嵌入式操作系统来保证实时性,并在VxWorks系统中实现了高可用热插拔技术用于提高系统的冗余容错性能。提出了利用基于概率神经网络(PNN)的故障诊断方法对热冗余设备进行在线故障诊断。仿真与实验验证的结果表明,该系统具有良好的冗余容错性能,该设计方法可以有效提升系统的可靠性。  相似文献   

17.
为了确保飞行控制系统的任务可靠性和安全可靠性,国外先进民机飞行控制计算机均采用余度技术。非相似余度技术采用完全不同的硬件和软件组成余度通道,产生和监控飞行控制信号,可避免多通道余度系统共性故障的产生,达到较高的可靠性。文中针对非相似余度设计技术,深入研究波音和空客飞机飞控计算机的余度技术,分析其飞控系统的可靠性,再根据我国的技术实力和研发能力,提出了我国民机飞控计算机余度设计的一种方案,并且用可靠性理论进行了验证。  相似文献   

18.
徐新海  杨学军  林宇斐  林一松  唐滔 《软件学报》2011,22(10):2538-2552
近年来,为了缓解日益严重的功耗问题,异构并行体系结构已成为超级计算机发展的一个重要趋势.图形处理器(graphics processing unit,简称GPU)凭借其超高的计算性能和性能功耗比,作为一种高效的加速部件已被广泛应用于高性能计算领域.但是,GPU先天的可靠性缺陷势必加剧超级计算机的可靠性问题.目前,国际上关于CPU-GPU异构系统容错技术的研究工作主要将GPU从异构系统中独立出来,以每次调用为粒度对其进行容错处理.设计了一种面向CPU-GPU异构系统的Lazy容错方法,给出了基于编译指导命令的容错框架及其约束,并讨论了相关的编译实现和优化方法,最后通过实验验证了该方法的正确性.实验结果表明,与现有的容错方法相比,利用所设计的LazyFT容错方法对GPGPU(general purpose computation on graphics hardware)程序进行容错处理,可以明显降低容错代价.  相似文献   

19.
多余度技术能够满足飞机管理系统中高安全性、确定性和可靠性的需求,而交叉通道数据链路( CCDL)是余度计算机之间进行数据和信息交换的重要途径,是保证余度飞机管理计算机正常运转的关键部件。文中基于三余度飞机管理计算机系统需求,给出CCDL硬件逻辑设计的体系架构,对CCDL的关键点进行分析,设计了一种在1394总线上进行点对点可靠传输、防止故障蔓延的交叉通道数据链路,并进行了FPGA实现和验证。实验结果表明,该设计能够高效可靠地满足系统的应用要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号