首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
云计算环境的复杂性、动态性和开放性特征,使得云计算系统的规模和结构日益复杂,产生的故障越来越多.现有的动态故障模型只关注于故障及故障间的关联关系,忽略了对故障特征的分析与处理,未动态关联故障与故障特征.因此,本文提出了一种云计算环境下服务故障模型动态建立方法.首先,预处理服务运行数据;其次,从预处理后的服务运行数据集中...  相似文献   

2.
随着云上微服务系统规模的不断扩大,微服务之间的依赖关系变得更加紧密复杂,某个微服务的故障可能会通过微服务之间的互相调用传播至其他微服务,进而导致整个微服务系统发生异常。面对依赖关系复杂的微服务系统,考虑到故障的传播性,设计了一种云上微服务故障自动定位方法MicroAFL。首先,MicroAFL实时监测与收集微服务系统运行指标数据,基于自编码器模型对运行指标数据进行分析,判断微服务系统是否存在异常;一旦检测到异常,MicroAFL通过解析云上微服务运行实例之间的通讯数据获取微服务之间的调用关系,进而构建服务调用关系图以刻画故障传播途径;其次,将各个微服务的运行状态与系统资源利用率相关联从而计算服务调用关系图中每个节点的异常权重,并通过改进的加权PageRank算法推断和定位引发异常的故障微服务;最后,在华为云上搭建名为Sock-shop的微服务系统对MicroAFL的故障定位准确性进行评估,实验结果表明MicroAFL的故障定位准确率相较对比方法有所提升。  相似文献   

3.
微服务软件系统由于其具有大量复杂的服务依赖关系和组件化模块,一个服务发生故障往往造成与之相关的一个或多个服务发生故障,导致故障定位的难度不断提高.因此,如何有效检测系统故障,快速准确定位故障根因问题,是当前微服务领域研究的重点.现有研究一般通过分析故障对服务、指标的作用关系,构建故障关系模型,但存在运维数据利用不充分、故障信息建模不全面、根因定位粒度粗等问题.因此,本文提出了AmazeMap,该方法设计了多层次故障影响图建模方法以及基于多层次故障影响图的微服务故障定位方法.其中,多层次故障影响图建模方法通过挖掘系统运行时指标时序数据与链路数据,考虑不同层次间的相互关系,能够较全面地建模故障信息;基于多层次故障影响图的微服务故障定位方法通过缩小故障影响范围,从服务实例和指标两个方面发现根因,输出最有可能的故障根因节点和指标序列.本文基于开源基准微服务系统和AIOps挑战赛数据集,从有效性和效率两个方面设计了微服务软件故障定位实验,并与现有方法进行对比,实验结果验证了AmazeMap的有效性、准确性和效率.  相似文献   

4.
在对工业过程故障进行根本原因诊断时,由于过程的自身特性和反馈控制等因素的干扰,使得变量因果图过于复杂从而使故障传播路径难以解释且不能找到导致故障的根本变量。提出一种简化因果图的方法,通过两步走对收敛交叉映射法构建的因果图实现简化,保留主要的故障传播路径。首先采用模糊综合评判法判别因果图中不确定性的关系;然后通过求解最大生成树,得到赋权无向图,并根据变量间因果关系选取根节点,分析赋权无向图获得新路径,从而将其改进成赋权有向图。在田纳西—伊斯曼过程进行验证实验,并与传统收敛交叉映射法进行比较,结果表明所提出方法的有效性。  相似文献   

5.
张伟  张为群 《计算机科学》2011,38(2):148-151
基于构件的软件可靠性分析往往把构件的可靠性当作自身固有不变的属性,忽略了在不同的运行路径下因构件所处的交互环境不同造成的实际可靠性的变化。因此,提出一种改进的基于路径的构件软件可靠性模型,它引入构件动态迁移图来建立构件软件运行路径和构件可靠性关系,给出一种改进的基于路径的用以计算构件软件可靠性的方法。最后通过实例验证了该方法的有效性和可行性。  相似文献   

6.
一种改进的基于迁移计划图的移动Agent迁移策略*   总被引:1,自引:0,他引:1  
在分析了现有迁移策略的基础上,提出一种改进的基于迁移计划图的结构化迁移策略。该迁移策略能根据当前网络的软硬件环境及其他负载信息,在满足预算约束条件下考虑服务质量和服务价格等因素,动态地为移动Agent规划出一条最佳迁移路径;该策略还能避免网络断连、主机故障及服务失效引起的迁移失败。  相似文献   

7.
目前主流云计算服务实现涉及到多节点协同、多虚拟机协同、多云协同等混合计算模式,这一特点增加了系统实现的复杂程度,提高了故障的发生概率.系统运行过程中如果无法及时发现故障的存在,则会导致系统无法正确运行.针对这一问题,提出了一种基于数据分析的故障感知系统,该系统通过数据采集、数据分析与对比、故障研判、故障报告4个步骤,实现云计算环境中故障的自动检测与预警,提高了云计算系统对故障的感知能力.  相似文献   

8.
故障注入是研究软错误故障传播的传统手段,但随着程序复杂性不断增加,采用故障注入对大量软错误的故障传播进行研究将花费巨大的时间成本。提出一种基于程序动态指令进行分析和建模从而快速获取软错误结果的方法。将程序转化为动态指令序列,通过体系结构正确执行分析将所有可能的软错误划分为对程序运行结果有影响和没有影响两部分;基于动态依赖图建立软错误故障传播分析模型,并建立判断程序崩溃的标准,进而提出一个算法对任意制定的能够影响程序运行结果的软错误进行故障传播分析并重点预测程序崩溃的发生。实验显示,预测的漏报率和分析单个软错误的平均用时明显低于现有方法。  相似文献   

9.
面向服务计算倡导以松耦合的方式构建开放、动态、高质量的网络服务,容错技术可以增加网络服务的服务质量,而故障转移则是其中的一个关键技术点,它能在系统资源部分损失的情况下,对剩余可用资源进行重新配置并恢复需要继续执行的服务状态.目前大多数的故障转移策略都不能保证服务的可用性,无法满足面向服务环境下网络应用的需要.针对这些问题,提出了一种面向服务的快速透明故障转移策略SOFailover.该策略基于服务器热备份,结合被动复制和消息日志协议保存服务状态,采用可靠UDP协议进行主备服务器间的信息交互和数据传输,并通过修改Linux内核加以实现.实验结果表明,SOFailover具有较短的故障转移延时和较低的系统开销,能够在保证服务可用性前提下高效透明地进行故障转移.  相似文献   

10.
微服务架构得到了广泛的部署与应用, 提升了软件系统开发的效率, 降低了系统更新与维护的成本, 提高了系统的可扩展性. 但微服务变更频繁、异构融合等特点使得微服务故障频发、其故障传播快且影响大, 同时微服务间复杂的调用依赖关系或逻辑依赖关系又使得其故障难以被及时、准确地定位与诊断, 对微服务架构系统的智能运维提出了挑战. 服务依赖发现技术从系统运行时数据中识别并推断服务之间的调用依赖关系或逻辑依赖关系, 构建服务依赖关系图, 有助于在系统运行时及时、精准地发现与定位故障并诊断根因, 也有利于如资源调度、变更管理等智能运维需求. 首先就微服务系统中服务依赖发现问题进行分析, 其次, 从基于监控数据、系统日志数据、追踪数据等3类运行时数据的角度总结分析了服务依赖发现技术的技术现状; 然后, 以基于服务依赖关系图的故障根因定位、资源调度与变更管理等为例, 讨论了服务依赖发现技术应用于智能运维的相关研究. 最后, 对服务依赖发现技术如何准确地发现调用依赖关系和逻辑依赖关系, 如何利用服务依赖关系图进行变更治理进行了探讨并对未来的研究方向进行了展望.  相似文献   

11.
随着Web服务迅猛发展,基于SOA的服务组合容错性研究成为了业界关注的焦点.服务组合中组件的失效,会导致整个组合执行失败,而资源不足、服务器负载过重是引发组件失效的主要原因之一.云计算作为一种新的计算泛型,其资源整合、动态分配的特点为解决传统SOA下因资源受限而引发的失效提供了新的容错思路.FTEL层将中间件技术应用到服务组合容错上,借助云环境完成服务替换,对传统SOA下较难解决的由于资源问题引起的组件失效进行了容错.  相似文献   

12.
Service‐oriented computing and cloud computing are playing critical roles in supporting business collaboration over the Internet. Thanks to the latest development in computing technologies, various large‐scale, evolving, and rapidly growing service ecosystems emerge. However, service failures greatly hamper the usability and reputation of service ecosystems. In the previous work, service failure is not adequately studied from an ecosystem's perspective. To address this gap, we propose a service failure analysis framework based on a complex network model of service ecosystem. This framework comprises a feature model of failed services and several service failure impact indicators. By applying the framework, empirical analysis of failed service features and failure impact assessment can be implemented more easily and precisely. Moreover, to provide failure tolerance strategies for service ecosystems, a novel composition‐based service substitution method is designed to replace the failed services with functional similar ones, such that the service systems are more robust when a failure occurs. As the new substitution method requires fewer structural data of services, it is more convenient to be applied in present RESTful Representational State Transfer (REST) service environment. Both the framework and the service substitution method are tested on real‐world data set, and their usability and efficiency are demonstrated. Copyright © 2014 John Wiley & Sons, Ltd.  相似文献   

13.
Web服务是云计算中资源调用的有效方式。单一Web服务功能往往有限,只能完成特定任务。服务组合则可以将多种Web服务形成有效的调用序列,实现更为强大的功能。服务发布量以及服务请求量的迅速激增带来了新的安全问题。首先,现有的服务组合方案均以服务质量(QoS)为依据进行Web服务选择,但服务质量通常由服务发布者提供,存在服务发布者发布虚假QoS值诱骗用户的欺诈现象;其次,传统的服务组合方案只生成一条最优路径,当恶意请求持续访问时,会造成某服务节点瘫痪,甚至整个服务组合系统失效。因此,针对服务质量恶意欺诈的问题,文章提出一种可信的QoS计算模型,根据Web服务发布者的信用综合评估服务质量;针对单一最优路径无法满足大量请求的问题,文章提出一种路径发现和负载均衡的多路径方法。仿真结果表明,文章提出的方法不仅能提高服务组合的成功率,满足用户的需求,而且能找到更多的服务组合方案执行。  相似文献   

14.
This paper aims to advance the management and delivery of services in large, heterogeneous, uncertain, and evolving cloud computing environments. The goal is important because such systems are becoming increasingly popular, yet existing service management methods do not scale well, and nor do they perform well under highly unpredictable conditions. If these problems can be solved, then Information Technology (IT) services can be made to operate in more scalable and reliable manner. In this paper, we present a peer-to-peer approach for managing services in large scale, dynamic, and evolving cloud computing environments. The system components such as virtualized services, computing servers, storage, and databases self-organize themselves using a peer-to-peer networking overlay. Inter-networking system components through peer-to-peer routing and information dissemination structure is essential to avoid the problems of management bottleneck and single point of failure that is predominantly associated with traditional centralized and hierarchical distributed (grids/clouds) system design approaches. We have validated our approach by conducting a set of rigorous performance evaluation study using the Amazon EC2 cloud computing environment. The results prove that managing services based on peer-to-peer routing and information dissemination structure is feasible and offers significant performance benefits as regards to overall system reliability, scalability, and self-management.  相似文献   

15.
Cloud computing can be realized by service interoperation and its essence is to provide cloud services through network. The development of effective methods to assure the trustworthiness of service interoperation in cloud environment is a very important problem. The essence of cloud security is trust and trust management. Combining quality of service (QoS) with trust model, this paper constructs a QoS-aware and quantitative trust-model that consists of initial trust value, direct trust value, and recommendatory trust value of service, making the provision, discovery, and aggregation of cloud services trustworthy. Hence, it can assure trustworthiness of service interoperation between users and services or among services in cloud environment. At the same time, based on this model, service discovery method based on QoS-aware and quantitative trust-model (TQoS-WSD) is proposed, which makes a solid trust relationship among service requestor, service provider and service recommender, and users can find trustworthy service whose total evaluation value is higher. Compared to QoS-based service discovery (QoS-WSD) method, it is proved by the experiment for TQoS-WSD method that more accurate result of service discovery will be achieved by service requestor, while reasonable time cost is increased. Meanwhile, TQoS-WSD method strongly resists the effect of service discovery by untrustworthy QoS values and improves service invocation success-rate and thus assures trustworthiness of services interoperation.  相似文献   

16.
针对大规模分布式云计算系统中的服务可信度辨别问题,提出一种基于凸函数证据理论的关联感知云服务信任模型。对云计算系统中云服务提供商、服务和用户之间的信任关系进行形式化描述,充分挖掘了同一服务商中的不同云服务之间的关联性,利用凸函数证据理论对有序命题的处理能力,构建了云计算系统中的可信服务推荐方法,根据用户需求为其提供合理可靠的云服务。与经典证据理论方法的对比结果表明,基于凸函数证据理论的关联感知云服务信任模型在保证有效性和健壮性的同时,充分利用了云计算系统中云服务之间的关联信息,能够根据用户的请求提供合理的云服务。  相似文献   

17.
In diverse and self-governed multiple clouds context, the service management and discovery are greatly challenged by the dynamic and evolving features of services. How to manage the features of cloud services and support accurate and efficient service discovery has become an open problem in the area of cloud computing. This paper proposes a field model of multiple cloud services and corresponding service discovery method to address the issue. Different from existing researches, our approach is inspired by Bohr atom model. We use the abstraction of energy level and jumping mechanism to describe services status and variations, and thereby to support the service demarcation and discovery. The contributions of this paper are threefold. First, we propose the abstraction of service energy level to represent the status of services, and service jumping mechanism to investigate the dynamic and evolving features as the variations and re-demarcation of cloud services according to their energy levels. Second, we present user acceptable service region to describe the services satisfying users’ requests and corresponding service discovery method, which can significantly decrease services search scope and improve the speed and precision of service discovery. Third, a series of algorithms are designed to implement the generation of field model, user acceptable service regions, service jumping mechanism, and user-oriented service discovery.We have conducted an extensive experiments on QWS dataset to validate and evaluate our proposed models and algorithms. The results show that field model can well support the representation of dynamic and evolving aspects of services in multiple clouds context and the algorithms can improve the accuracy and efficiency of service discovery.  相似文献   

18.
云计算中TSP问题求解服务的定价机制   总被引:1,自引:1,他引:0  
曾栩鸿  曾国荪 《计算机科学》2011,38(12):194-199
旅行商问题(TSP)是一个典型的路径优化问题,在城市交通规划、物流运输、通信网络设置等领域都存在类似的问题和应用。但是,TSP问题的求解是NP难的,当问题规模很大时,必须借助大规模并行计算环境,例如云计算平台,以较大的计算开销来获得可行解。以TSP问题为具体实例,研究云计算服务的定价机制。一般情况下,定价机制要满足公平、灵活、动态、自适应。从公平合理角度来看,影响计算服务定价的因素主要有两方面:一是求解问题的难度,包括计算时间复杂性、空间复杂性、输入输出数据规模等;二是求解服务质量,即服务契约,包括可以作为服务等级协定指标的求解精度、响应时间、资源要求等。由此,提出了一种新的云计算中的服务定价机制:CloudPricing。该机制给出了服务定价的一般和具体原则,并给出了相应的定价公式。针对TSP问题求解,进行了具体的定价实例分析,这对云计算中NP难问题求解服务的定价有参考意义。  相似文献   

19.
杨娜  刘靖 《软件学报》2019,30(4):1191-1202
通过提供高效且持续可用的容错服务以保障云应用系统的可靠运行是至关重要的.采用容错即服务的模式,提出了一种优化的云容错服务动态提供方法,从云应用组件的可靠性及响应时间等方面描述云应用容错需求,以常用的复制、检查点和NVP(N-version programming)等容错技术为基础,充分考虑容错服务动态切换开销,分别针对支撑容错服务的底层云资源是否足够的场景,给出可用容错即服务提供方案的最优化求解方法.实验结果表明,所提方法降低了云应用系统支付的容错服务费用及支撑容错服务的底层云资源的开销,提高了容错服务提供商为多个云应用实施高效、可靠容错即服务的能力.  相似文献   

20.
雷阳  姜瑛 《计算机科学》2021,48(1):295-300
当前,越来越多的用户选择将服务部署到云计算环境中.然而,云计算服务的多样性以及部署环境的动态性,会导致云计算节点出现异常.传统的节点异常检测方法只针对异常的单一节点,忽略了异常节点对关联节点的影响,从而造成异常传播和关联节点失效等问题.文中提出了一种云计算环境下关联节点的异常判断方法.首先,将Agent部署在各节点上,...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号