共查询到20条相似文献,搜索用时 835 毫秒
1.
文中设计了一种容错系统,该系统是建立在应用程序层之下、操作系统层之上位置结构的中间件。系统由三模冗余与其之间的通信链路组成系统的硬件结构以及由故障检测模块(对节点的检测和对应用程序的检测)、故障处理模块所组成的软件部分构成。基于VxWorks实时操作系统,设计了一种高可用的容错中间件系统,分析了系统的组成原理,给出了基于心跳检测的故障检测机制和N版本编程方法进行故障检测,以及前向和后向任务恢复方法进行故障恢复,并实现了原型系统。试验表明:给出的容错中间件系统具备了基本的容错能力,可有效提高系统的可用性和可靠性。 相似文献
2.
3.
基于SRAM型FPGA的实时容错自修复系统设计方法 总被引:1,自引:0,他引:1
为提高辐射环境中电子系统的可靠性,提出了一种基于SRAM型FPGA的实时容错自修复系统结构和设计方法。该设计方法采用粗粒度三模冗余结构和细粒度三模冗余结构对系统功能模块进行容错设计;将一种细粒度的故障检测单元嵌入到各冗余模块中对各冗余模块进行故障检测;结合动态部分重构技术可在不影响系统正常工作的前提下实现故障模块的在线修复。该设计结构于Xilinx Virtex誖-6 FPGA中进行了设计实现,实验结果表明系统故障修复时间和可靠性得到显著提高。 相似文献
4.
在工业控制中使用双机系统实现控制的地方非常多,本文给出了一种独立于STD工业控制机的其它功能模板的双容错系统。分析这种双容错系统设计的容错比较冗余模块的组成,给出了实现容错的相应软件。其中包括故障检测、故障机判别、定时、同步逻辑、系统恢复、卷回机制及输出控制等技术的实现。 相似文献
5.
6.
为了提高三模冗余容错计算机的故障恢复效率,缩短故障恢复时间,提出并设计实现了一种基于硬件监视的关键数据链表式管理恢复算法,克服了传统容错计算机在故障恢复方面的缺陷.利用系统运行过程中CPU的空闲时间与串行数据交换通道,在不中断系统工作的情况下,对三模冗余容错计算机进行无缝恢复,保证了系统在故障恢复时工作的连续性,同时给出了系统的具体恢复过程和测试结果.实验结果验证了该方法的可行性和可靠性. 相似文献
7.
针对在普通的硬件和网络环境下实现系统数据的高可用性的目标,设计了一个由两个松耦合的模块组成的容错机制。该机制的核心使用了高效的共识算法Paxos。描述了这一容错机制的架构和主要模块,日志层的实现算法和数据层冗余机制。给出了该机制能够处理的各种故障。实验证明系统的稳定可靠,性能良好。 相似文献
8.
针对敏感行业中分布式应用的容错需求问题,分析介绍Agent、多Agent系统和容错中间件技术,根据Agent和中间件特性结构上的相似性,对利用多Agent技术构建容错中间件作了尝试,并着重研究了失效检测与恢复系统;建立局部检测与全局检测互相结合的双层失效检测模型,提出融入定点恢复和异机恢复的改进型REDO失效恢复策略;最后给出基于JADE的一个系统实现。实验结果显示双层检测模型和改进型REDO恢复策略是可行的、高效率的。、 相似文献
9.
提出一种外部扰动/内部白噪声复合干扰和间歇性故障下的再入段变结构高超声速飞行器故障诊断和容错控制方法.首先给出再入姿态系统模型以及间歇故障模型.然后基于所研究的随机固定幅值故障模式对角速率系统中的周期性外部扰动进行预处理,根据处理结果,通过引入滑动时间窗设计一种残差信号.由于系统中存在白噪声,根据噪声分布特性并基于改进的残差信号提出两个假设检验,进而设计检测故障的两个阈值区间以检测间歇故障的发生和消失时间.与传统残差设计方法相比,改进的残差信号对于故障发生和消失时间的检测更准确.基于扩张系统设计一个自适应估计律用于估计故障,并使得估计误差满足$L_2$-增益干扰抑制.最后提出一个自适应容错控制算法使得系统的姿态角输出能够跟踪给定的参考信号.利用Lyapunov函数证明了系统的稳定性, Matlab仿真结果验证了所提出方法的有效性. 相似文献
10.
中间件是大型分布式系统的核心,可以为系统应用程序提供双机热备、双网冗余服务.针对分布式冗余系统可靠性问题,利用马尔可夫模型对可修复分布式冗余系统进行可靠性分析.按照优先恢复应用程序功能的修复策略,由系统状态转移关系建立系统状态转移图,进而得出了系统可靠度的计算方法.仿真结果表明,应用程序故障对系统可靠性的影响大于网络故障,提高修复优先级较高模块的维修率可有效增加系统的可靠度. 相似文献
11.
为解决虚拟化条件下云平台故障排除不及时的问题,在开源云平台Open Stack上设计并实现一种虚拟化故障检测恢复系统。该系统由GUI层、调度层、逻辑层和功能层组成,以事件驱动机制为核心,将系统中传递的信息作为事件按时序进行处理。以感知模块、策略模块、执行模块为主体,调用Open Stack API和Libvirt API实现与虚拟机管理层的交互。建立以信息获取、分析处理、故障恢复为主要内容的故障检测恢复体系,通过对云平台运行环境的实时检测,获取状态参数,根据策略对参数进行分析判断并制定应对措施,实现对故障的自动恢复。实验结果证明,该系统可以在无代理情况下对云平台进行实时检测和故障自动恢复,增强云环境的安全性,提升云平台的高可用性。 相似文献
12.
数据库访问中间件是所有中间件中最成熟的一种,它支持应用程序和本地或异地的同构或异构数据源进行通信。数据访问中间件负责数据访问客户端和数据库服务器之间的通信并提供应用程序服务,利用数据访问中间件用户可以在客户端发出数据查询命令,经过中间件处理,由服务器完成数据查询,再通过中间件将结果送回。论述了数据库访问中间件技术的发展,提出了一种由客户交互模块、远程访问模块、安全控制模块、缓冲区、操作评价模块和连接管理模块6部分组成的数据库访问中间件构造模型方案。 相似文献
13.
14.
针对嵌入式网络设备的服务可靠性问题,现有的网口容错主要采用双网卡冗余设计,研究针对单网卡多网口的情况,提出了一种网口容错方法,该方法能有效利用系统带宽资源。提出的网口容错方法包括一种网口状态检测机制和故障网口服务数据迁移方法,并设计了相应的功能模块。故障检测模块实现基于Loopback的检测方法,容错处理模块则实现在检测到故障后,可将故障网口的服务负载数据根据迁移策略迁移到其余正常网口。所提出的方法实现了对网口工作状态的快速检测和负载数据的有效容错。该方法具有应用无关性、资源占用率低的特点,通过测试验证了该方法的可行性。 相似文献
15.
16.
17.
18.
基于ICE的局域网监控设计与实现 总被引:2,自引:0,他引:2
介绍了利用ICE(internet communication engine)中间件开发应用程序方法和优势,提出了一种基于ICE的局域网监控系统方案.阐述了整个方案的实现功能和关键技术.该方案采用ICE中间件技术实现了一种分布式的通信代理模块,使得各个模块之间可以透明的通信,提高了系统的安全性、健壮性、可扩展性和可维护性. 相似文献
19.
20.
基于信号重构的可重构机械臂主动分散容错控制 总被引:1,自引:0,他引:1
针对可重构机械臂系统传感器故障,提出一种基于信号重构的主动分散容错控制方法. 基于可重构机械臂系统模块化属性,采用自适应模糊分散控制系统实现正常工作模式时模块关节的轨迹跟踪控制. 当在线检测出位置或速度传感器故障时,分别采用数值积分器或微分跟踪器重构相应信号,并以之代替故障信号进行反馈实现系统的主动容错控制. 此方法充分利用了冗余信息,避免了故障关节控制性能的下降对其他关节的影响. 数值仿真结果验证了所提出容错控制方法的有效性. 相似文献