首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
何华  李航 《微机发展》2005,15(3):60-62,126
由于计算系统结构日趋复杂,系统可靠性技术研究面临新的挑战。为了把握这一技术的发展趋势,进行更深入的研究,需要清晰了解历史和现状。文中讨论如何从计算系统的设计开发到运行过程中保证系统可靠性,包括设计时对错误的避免、开发时对错误的排除和运行时对错误的处理。重点对系统运行时的软件容错技术从不同角度进行了分类,并对它们的优缺点进行了比较。这几类技术都是针对避免系统运行故障,从运行角度提高了系统可靠性。  相似文献   

2.
随着高性能计算机的性能不断提升、系统规模不断提高,系统和应用的错误率也不可避免地持续增多.快速发现和定位系统及应用级的错误、为用户提供高质量服务,成为了超级计算机系统设计开发过程中急需考虑的问题.超级计算机系统中硬件故障与异常、软件程序的错误等都会导致用户大规模并行应用的错误、挂死与退出.如何快速准确定位错误现场,让管理员或用户以此为基础查看异常发生的故障进行高精度、高效率的诊断,是维护高性能计算系统可靠性的重要基础.高性能计算机传统的故障定位主要通过硬件异常跟踪、系统日志分析和程序主动探测等方法,缺乏对无日志信息、无明显故障现象的程序挂死问题的定位手段,并且技术的扩展性也面临挑战.针对“新一代神威超级计算机”体系结构和SW26010-Pro众核处理器特点,提出一种运行时故障定位方法,包括基于消息传递的故障关联分析、基于全局聚合信息的在线综合分析诊断、面向申威众核处理器的异常线程过滤方法等关键技术,阐述了如何有效检测、收集、处理大量系统资源和并行进程的异常信息问题,为应对未来超大规模高性能计算中故障高效定位难题提供有效支撑.  相似文献   

3.
系统的静态分析能在设计开发阶段发现错误,从而避免了在运行时错误检测技术在系统执行期间带来的负面影响.基于尽可能避免静态错误这一构件测试策略的基本思想提出了一种对构件化软件系统进行静态测试的方法.采用通信模型对数据库服务构件系统进行抽象建模,并结合用于描述构件系统中构件之间交互的形式化方法行为协议,通过对构件系统构件行为协议的一致性验证,从而测试构件交互的正确性.  相似文献   

4.
计算机系统的高可靠性技术是一门研究如何尽量避免系统发生错误和故障,如何使系统在发生错误或故障时仍能正确运行且迅速恢复成正常状态,如何保护系统内信息的安全和保密等一切保障系统可靠性的综合技术。本文分别从硬件系统、软件系统及数据三个方面对SEIS的高可靠性技术作了全面介绍。  相似文献   

5.
针对传统的复杂计算系统面临的各种可靠性问题.总结了虚拟化技术在增强系统可靠性方面的优势,并将SOA体系结构的松散耦合、平台无关性等特点有机的结合,提出一种增强计算系统可靠性的系统架构--面向服务的虚拟化SOV(service oriented virtual-ization).对SOV系统在遭受可能的各种可靠性威胁分析归纳,然后运用虚拟化技术和体系结构的各种机制克服底层硬件故障、虚拟基础设施层运行错误、操作系统和应用服务程序运行错误、遭受攻击引起的故障等问题,综合增强系统的可靠性.  相似文献   

6.
配电系统的可靠性分析主要是对影响系统安全运行的因素进行分析,避免这些因素对配电系统造成更大的影响,从而实现系统的安全、可靠运行。从配电系统可靠性分析的特点入手,分析了配电系统的可靠性技术完善方法和评估算法,进一步加强配电系统可靠性分析实际应用的必要性。  相似文献   

7.
故障树分析是可靠性分析中比较常用的方法之一.本文采用故障树方法对于CPR1000堆型中阳江核电站一期工程安全级DCS保护系统的可靠性进行分析,分析结果有助于完善DCS性能分析.通过计算结果表明保护系统DCS安全可靠,满足合同要求,对于其他保护系统的定量分析提供借鉴.同时提出人因错误对系统可靠性的影响也需要同样重视.正确分析人因错误发生的概率对保护系统可靠性的影响,防止和减少人为错误,确保机组的安全、稳定、高效运行.  相似文献   

8.
杨栋  史浩  董威  刘宗林  周戈 《软件学报》2018,29(5):1360-1378
无人飞行系统(Unmanned Aerial Systems,UAS)的软、硬件存在缺陷以及遇到外部恶意攻击,会给UAS的安全性带来极大威胁.由于UAS的运行环境复杂多变,很多因素在开发过程中难以准确预测,因此研究有效的运行时安全保证机制具有重要意义.本文提出一种基于运行时验证的UAS安全威胁检测方法.首先对UAS可能遇到的多种安全威胁进行分析并采用离散时间时序逻辑进行描述,提出相应的UAS-DL语言描述安全监控规约;然后基于交错自动机提出了自动生成安全威胁监控器的算法,并利用参数化方法实现对多UAS的安全监控.为了提高检测的准确性,进一步研究了将运行时验证和贝叶斯网络推断结合的方法.采用实际的UAS开发仿真平台Ardupilot进行了实验,并设计了将监控器独立部署在FPGA硬件上的方法,避免对UAS计算资源的过多占用.实验结果表明上述方法能够有效检测UAS的安全威胁.  相似文献   

9.
于素萍  杨偱杰 《微机发展》2008,18(3):128-131
系统的静态分析能在设计开发阶段发现错误,从而避免了在运行时错误检测技术在系统执行期间带来的负面影响。基于尽可能避免静态错误这一构件测试策略的基本思想提出了一种对构件化软件系统进行静态测试的方法。采用通信模型对数据库服务构件系统进行抽象建模,并结合用于描述构件系统中构件之间交互的形式化方法行为协议,通过对构件系统构件行为协议的一致性验证,从而测试构件交互的正确性。  相似文献   

10.
面向监控的软件运行时验证(Monitor-oriented Runtime Verification:MRV)方法可以有效的提高系统可靠性,但是在传统基于单核处理器架构的嵌入式系统中采用MRV方法会给目标系统性能造成较大的影响.本文对基于多核处理器架构的MRV方法进行了初步研究,分析并设计了在线验证、离线验证以及单监视器设计与多监视器设计等多种模式的MRV方法,给出了相应的MRV实现方案,并在几个开源项目中进行了MRV实例应用.实验数据分析表明,在不同模式下,基于多核处理器架构的MRV方法能够从不同程度上有效提高系统运行时验证的性能.本文工作为进一步设计有效的多核架构下MRV方法提供了基础.  相似文献   

11.
The drive to rapidly develop layered, interconnected, and flexible systems has eclipsed consideration of resource costs. Consequently, large Java applications suffer from runtime bloat: a large and pervasive infrastructure tax, where simple transactions require a few hundred thousand method calls, and a server with 1 Gbyte of memory sometimes can only support a few hundred users. Current Java optimizers and garbage collectors are of little help for these systemic problems. Enterprises face greatly reduced scalability, increased power consumption, and missed deliveries. In this article, the authors detail four global software development trends, along with some widely held myths, that lead to bloat in Java applications. They illustrate their consequences with anecdotes drawn from real applications suffering severe performance and memory issues. While these trends are inevitable, runtime bloat is not. Understanding the sources of bloat can help programmers craft appropriate solutions for the future.  相似文献   

12.
运行时优化在程序运行期间,根据采集到的相关信息,确定程序的热点并进行优化,从而加速程序的执行。然而,运行时优化本身有一定的开销,有时候会抵消甚至超出优化得到的效果。该文设计和实现了一个基于SMP/IPF(英特尔安腾系列)/Linux架构的自适应二进制代码优化/编译框架,其中包含了运行时优化。分析了运行时优化的阶段和开销,并介绍了在设计和实现该框架的过程中,为减小这种开销所提出的思路和采用的方法。  相似文献   

13.
The internet of things (IoT) attracts great interest in many application domains concerned with monitoring and control of physical phenomena. However, application development is still one of the main hurdles to a wide adoption of IoT technology. Application development is done at a low level, very close to the operating system and requires programmers to focus on low-level system issues. The underlying APIs can be very complicated and the amount of data collected can be huge. This can be very hard to deal with as a developer. In this paper, we present a runtime model based approach to IoT application development. First, the manageability of sensor devices is abstracted as runtime models that are automatically connected with the corresponding systems. Second, a customized model is constructed according to a personalized application scenario and the synchronization between the customized model and sensor device runtime models is ensured through model transformation. Thus, all the application logic can be carried out by executing programs on the customized model. An experiment on a real-world application scenario demonstrates the feasibility, effectiveness, and benefits of the new approach to IoT application development.  相似文献   

14.
陈星  兰兴土  李隘鹏  郭文忠  黄罡 《软件学报》2017,28(7):1881-1897
随着云计算技术的普及,涌现出众多不同用途、不同类型的云计算平台.为了满足遗产系统整合和动态资源扩展等需求,常常需要构造混合云来统一管理不同云平台中的计算和存储资源.然而,不同云平台的管理接口和管理机制存在差异,使得开发混合云管理系统难度大、复杂度高.本文提出一种基于运行时模型的混合云管理方法:首先,在云平台管理接口基础上,构造单一云平台的运行时模型;其次,根据云平台领域知识,提出一种云平台软件体系结构的统一模型;最后,通过模型转换,实现云平台统一模型到运行时模型的映射.于是,管理程序可以建立在云平台统一模型的基础上,降低了混合云管理系统开发的难度和复杂度.本文还实现了基于运行时模型的CloudStack和亚马逊EC2混合云管理系统,并对方法的可行性和有效性进行了验证.  相似文献   

15.
16.
陈星  张颖  张晓东  武义涵  黄罡  梅宏 《软件学报》2014,25(7):1476-1491
多样化的受管资源和不断变化的管理需求,使得云管理面临很大的难度和复杂度.面对一个新的特定的管理需求,管理员往往是在已有管理软件的基础上进行二次开发,通过管理功能的获取和组织来构造新的管理系统.然而,由于缺乏通用的方法,二次开发的难度和复杂度依然很大.为了能够根据管理需求快速定制、集成、扩展已有的管理软件,提出一种基于运行时模型的多样化云资源管理方法.首先,在系统管理接口的基础上构造不同受管资源的运行时模型;其次,通过对不同的运行时模型进行合并,来构造包含所有目标受管资源的组合模型;最后,通过组合模型到用户特定模型的转换,来满足特定的管理需求.在OpenStack与Hyperic两款独立管理软件的基础上,实现了基于运行时模型的虚拟机软、硬件资源统一管理系统,验证了方法的可行性和有效性.  相似文献   

17.
18.
软件体系结构驱动的运行环境   总被引:1,自引:0,他引:1  
由于软件体系结构以隐性的方式存在,结构的问题被传播到平台内,运行时软件体系结构不能在应用层次上被观察和控制,系统难以联机动态演化.在现有的中间件平台之上设计了一个面向应用、开放的、软件体系结构驱动的分布式远行环境SADRE(Software Architecture—Driven Runtime Environment),软件体系结构在可运行系统中以一类实体显性地表示,体系结构描述作为核心元素被整个分布式运行环境共事,成为系统调度、通信的依据.从而驱动用户应用的运行.SADRE为灵活的动态体系结构提供了良好的支持,提高了系统的柔性和扩展性.  相似文献   

19.
Using Architectural Models to Manage and Visualize Runtime Adaptation   总被引:2,自引:0,他引:2  
The architectural runtime configuration management approach provides an accurate model of adaptive software system behavior over time. ARCM improves the visibility and understandability of runtime adaptive processes while allowing human input into the adaptation-control loop.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号