首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
林泉  宋文强  田东 《计算机应用》2007,27(4):825-827
针对网格系统故障检测的需求,提出了一种基于动态灰色预测的网格故障检测算法。基于不可靠故障检测思想,建立了网格系统及故障检测模型;结合心跳策略和灰色预测方法,设计了一种动态心跳机制,并给出了预测模型和实时预测策略;提出了基于该动态心跳机制的网格故障检测算法,分析了算法的可靠性,并通过仿真实验验证了算法的正确性和有效性。  相似文献   

2.
一种网格环境下的动态故障检测算法   总被引:6,自引:0,他引:6  
针对现有网格系统出错几率较大、已有故障检测算法不能有效满足网格系统需求问题,提出了一种网格环境下的动态故障检测算法.根据网格系统的特点,基于不可靠故障检测思想,建立了网格系统模型和故障检测模型;结合心跳(heartbeat)策略和灰色预测方法,设计了一种动态心跳机制,并给出了预测模型和实时预测策略;提出了基于该动态心跳机制的网格故障检测算法,分析了算法的可靠性.仿真实验结果表明,该算法是正确、有效的,可用于网格环境下的故障检测.  相似文献   

3.
分布式系统中心跳检测是节点故障检测机制的关键技术之一,心跳频率设定的合理性将影响到故障检测的准确性和完整性。针对大数据环境下,分布式系统产生故障受到网络、节点、作业多方面影响,为了提高心跳频率在多方面因素影响下的合理性设定,提出一种多因素心跳检测综合指标评价模型。在该模型下同时考虑网络负载情况和节点CPU工作状态及节点作业的大小对心跳检测过程的影响。在此基础上,提出了基于多因素评价模型的自适应心跳检测算法。该算法可以随网络环境、节点CPU占用率、作业任务大小自适应地改变心跳频率,综合各因素给出心跳频率设定的最优方案。最后通过实验验证了多因素对心跳频率自适应调整的影响。  相似文献   

4.
故障检测器是构建可靠的iSCSI存储系统所必需的基础组件.本文实现了一种iSCSI系统中自适应故障检测器iAFD(adaptive failure derector for iSCSI).根据心跳(heartbeat)策略,设计了一种自适应心跳机制.故障检测器通过估计预期到达时间来提供一个探测时间,并动态地估算心跳消息超时时限,以适应系统状态的变化,减少故障检测服务的错误.实验表明,该方法与其它的故障检测方法相比,故障检测出错次数较少,检测时间较短,并能够适应高可靠计算系统状况的变化,在侦测的实时性和正确性上提供较好的平衡.  相似文献   

5.
针对无线自组网的拓扑结构,设计一种基于分簇的无线自组网节点故障检测架构和对应的故障检测算法。分簇时分别确定主用簇和备用簇管理节点,冗余簇管理节点负责对内部成员实施异常检测,给出故障检测模块的心跳发送、心跳监控、心跳预判与实时调整机制,通过增加心跳预判实时调整机制,确保算法能够动态适应自组网易变的拓扑结构,并通过备用簇管理节点和簇间共享异常信息机制,提高系统故障检测的可靠性。利用仿真实验对故障检测机制的性能进行评估,结果表明,提出的故障检测算法具备较好的检测准确率,能够有效满足上层应用在系统可靠性设计方面的需求。  相似文献   

6.
一种适用于P2P存储系统的自反馈故障检测算法   总被引:2,自引:1,他引:1  
在构建高可用性P2P存储系统的过程中,针对系统中节点的高度动态特征,设计了一种自反馈的心跳故障检测算法。它结合心跳策略和无偏灰色预测模型,根据应用需求和网络环境的变化动态地改变检测的质量,在保持一定检测时间的前提下,提高了故障检测的精度。实验表明,根据该算法实现的故障检测器具有较好的性能,提高了P2P存储系统的可用性。  相似文献   

7.
研究网格环境下的故障检测服务问题.从识别网格环境对故障检测服务的特殊需求出发,研究了网格环境下故障检测服务的实现机理,对现有实现方法的优缺点作了深入比较,针对现有方法在满足网格特定需求方面的缺陷,提出设计动态自适应故障检测服务的手段,通过对分布式系统中已有动态自适应故障服务的分析,设计了解决的办法.  相似文献   

8.
张健 《传感技术学报》2015,28(8):1188-1193
针对无线传感器网络节点故障原因复杂,基于灰色预测理论,提出一种故障检测方法。算法通过分析在某一采样间隔内,观测节点数据变化趋势是否与邻居节点变化趋势一致,从而确定节点是否异常。仿真实验表明,算法故障检测能力较强,且避免了节点瞬间失效情况的出现。同时该算法设计简单,易于硬件实现。  相似文献   

9.
研究大数据环境下网格动态故障检测的方法。大数据来源范围广博,数据类型极复杂;数据的广泛性,资源的高度异构和不同地理上的分布,使网格故障发生成为影响系统应用的主要问题。目前网格故障检测方式,不能满足网格动态故障检测需要。利用"灰色预测理论"的算法,依据动态心跳的原理,设计动态故障检测架构,给出了预测模型;提出了网格动态故障检测方法。实验结果证实是有效的和准确的,提出的动态故障检测算法优于静态故障检测算法,解决了大数据环境下网格动态故障检测问题。  相似文献   

10.
提高故障诊断能力对于确保水下机器人AUV系统的稳定运行具有重要意义。针对水下机器人推进器系统,提出一种基于离群点检测的AUV故障检测方法。首先,将传感器采集的数据进行灰色预测处理;然后,提出了一种结合K-mean和DBSCAN的改进迭代聚类(Iterative K-mean DBSCAN,IKD)算法进行离群点检测;最后,与K-mean和DBSCAN算法相比,仿真实验结果表明基于灰色预测和KID离群点检测算法的故障检测准确率高,能够有效地实现水下机器人AUV的无监督故障诊断。  相似文献   

11.
面向高可靠智能应用的分布计算系统,首先提出一组故障侦测服务的QoS度量标准,其次给出一种自适应故障侦测方法.该方法使用一个无需统计行为的高度动态的计算方法,动态地估算心跳消息超时时限,并协商改变心跳消息的发送周期,以适应分布计算系统计算节点和网络状态变化,提高故障侦测服务的QoS.模拟实验表明,该方法能够适应分布计算系统状况的变化,在侦测的实时性和正确性上提供较好的平衡.  相似文献   

12.
Information security management has become an important research issue in distributed systems, and the detection of failures is a fundamental issue for fault tolerance in large distributed systems. Recently, many people have come to realize that failure detection ought to be provided as some form of generic service, similar to IP address lookup. However, this has not been successful so far; one of the reasons being the fact that classical failure detectors were not designed to satisfy several application requirements simultaneously. More specifically, traditional implementations of failure detectors are often tuned for running over local networks and fail to address some important problems found in wide-area distributed systems with a large number of monitored components, such as Grid systems. In this paper, we study the security management scheme for failure detector distributed systems. We first identify some of the most important QoS problems raised in the context of large wide-area distributed systems. Then we present a novel failure detector scheme combined with self-tuning control theory that can help in solving or optimizing some of these problems. Furthermore, this paper discusses the design and analysis of implementing a scalable failure detection service for such large wide-area distributed systems considering dynamically adjusting the heartbeat streams, so that it satisfies the bottleneck router requirements. The basic z-transformation stability test is used to achieve the stability criterion, which ensures the bounded rate allocation without steady state oscillation. We further show how the online failure detector control algorithm can be used to design a controller, analyze the theoretical aspects of the proposed algorithm and verify its agreement with the simulations in the LAN and WAN case. Simulation results show the efficiency of our scheme in terms of high utilization of the bottleneck link, fast response and good stability of the bottleneck router buffer occupancy as well as of the controlled sending rates. In conclusion, the new security management failure detector algorithm provides a better QoS than an algorithm that is proposed by Stelling et al. (Proceedings of 7th IEEE symposium on high performance distributed computing, pp. 268–278, 1998), Foster et al. (Int J Supercomput Appl, 2001).  相似文献   

13.
基于代理群的网络管理中群首选举算法的研究   总被引:1,自引:0,他引:1  
基于代理群的网络管理是一种动态的分布式管理模式,群首在代理群中是最关键的节点,群首的选举则是动态群管理中的最关键问题之一。针对选举问题,本文在建立的部分同步系统模型基础上,提出了一种三段式的群首选举算法,该算法具有较高的效率和一定的容错能力;同时应用故障检测器相关理论解决了选举的触发问题,并对相关参数的确定进行了讨论。  相似文献   

14.
Web应用服务器的适应性失效检测   总被引:9,自引:1,他引:9  
陈宁江  魏峻  杨波  黄涛 《软件学报》2005,16(11):1929-1938
失效检测是分布式系统的基本可靠性保障技术,它对运行时系统的存活状态进行及时检测.作为网络分布计算环境中的主流中间件,Web应用服务器(Web application server,简称WAS)需要提供良好的检测机制,并且要能满足适应性的需求.适应性失效检测要求失效检测器能够根据应用需求和系统环境的变化而动态地改变检测的质量.首先给出了WAS的多层失效检测模型,然后基于失效检测器的服务质量规约,提出了适应性失效检测算法,并设计了一个WAS的适应性失效检测框架.它能够满足动态调整失效检测质量和灵活集成失效检测器的要求.该工作在OnceAS应用服务器中进行了实现,并给出了OnceAS平台上的实验及数据.  相似文献   

15.
分布式系统中基于复制的动态容错模型   总被引:1,自引:0,他引:1  
基于C/S模型的分布式应用系统中,服务器上服务进程的失效往往会导致系统崩溃或系统性能的下降。文章从提高分布式系统软件容错能力的角度出发,提出一种基于复制的动态容错模型。采用进程复制技术,将复制的服务进程分布到不同主机运行,复制进程通过与主服务进程共享消息缓冲队列,动态地保持运行轨迹一致,当主服务进程失效后,从复制的进程中选取一个作为主服务进程,使系统继续运行。  相似文献   

16.
The grid provides an integrated computer platform composed of differentiated and distributed systems. These resources are dynamic and heterogeneous. In this paper, a novel fault-tolerant grid-scheduling model is presented based on Stochastic Petri Nets (SPN) to assure the heterogeneity and dynamism of the grid system. Also, a new grid-scheduling strategy, the dependable strategy for the shortest expected accomplishing time (DSEAT), is put forward, in which the dependability factor is introduced in the task-dispatching strategy. In the end, the performance of the scheduling strategy based on the fault-tolerant grid-scheduling model is analyzed by an software package, named SPNP. The numerical results show that dynamic resources will increase the response time for all classes of tasks in differing degrees. Compared with shortest expected accomplishing time (SEAT) strategy, the DSEAT strategy can reduce the negative effects of dynamic and autonomic resources to some extent so as to guarantee a high quality of service (QoS).  相似文献   

17.

电力物理网络通过构建信息网络进行优化调控并构成信息物理融合系统, 实现大规模分布式系统的优化控制, 随之而来的问题是病毒、黑客入侵、拒绝服务等来自信息网络的威胁, 导致物理系统恶意破坏. 鉴于此, 以攻击可检测为前提, 建立攻击信号下的电力系统分布式动态模型, 设计动态状态估计器检测受攻击的信号, 并估计其原始信号. 最后通过3 机9 节点分布式电网系统仿真实验验证了所设计的状态估计器对于数据攻击检测的有效性.

  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号