共查询到20条相似文献,搜索用时 421 毫秒
1.
2.
设置检查点是保存和恢复进程运行状态的一种重要技术,是实现容错、卷回调试和进程迁移的重要手段。本文研究了全透明检查点系统Epckpt在系统Ⅴ共享内存方面的实现方法和不足,给出了自己的改进,从而更好地实现了系统Ⅴ共享内存的保存与恢复。 相似文献
3.
4.
GECISM中的回滚、备份与设障 总被引:1,自引:0,他引:1
检查点技术用来对系统中正常运行的程序有效状态进行备份,当系统出现故障时,可以根据最近的检查点恢复当前失效的进程,减少计算的损失。由不同的代理构成的计算机免疫系统GECISM(GEneral Computer Immune System Model)是把生物免疫系统的机理用于计算机安全领域的一个产物。通过比较多种不同的检查点机制,选择利用缓冲回滚系统BRAS(Buffering RollbAck System)检查点机制实现GECISM中类TD代理功能,使系统回卷到以前洁净点状态。 相似文献
5.
工作站机群系统已成为分布式并行处理发展的主流方向之一,随着机群系统应用领域的逐渐拓展和规模的不断扩大,人们对其可靠性的要求日益提高,设计高可靠的群机系统,需要着重研究其系统容错技术,本文叙述了并行异构回卷恢复和检查点派生,实现透明的可移植容错和负载均衡能力,避免调整检查点就构成全局一致性状态,不仅使BSP应用程序自治容错能力,而且能够在机群(Clusters)间迁移,保持系统负载均衡,重点介绍了检查点设置,检查点派生、卷回、进程迁移技术。 相似文献
6.
使软件系统基于当前状态恢复先前某一状态的方法通常有两种:检查点和反向计算.为比较这两种方法的实现代价,以如何实现最低代价的可逆排序为例,将增量检查点技术应用于简单选择排序算法,实现了一种通过增量保存程序运行时系统状态的变化信息以恢复系统先前某一状态的排序算法,并通过反向计算技术实现了一种无需系统状态历史信息仅通过系统当前状态和程序自身逻辑便恢复先前状态的可逆排序算法.通过大量测试用例验证了上述两类算法的正确性,并得出在大规模且数据交换频繁的场景下反向计算排序算法远优于检查点排序算法的结论. 相似文献
7.
分布式系统检查点算法中程序卷回时文件系统的状态恢复 总被引:3,自引:0,他引:3
检查点技术,也称为“回溯恢复”,是软件容错的重要手段,它主要用于保存和恢复程序的运行状态。在分布式计算和并行计算系统中有十分重要的作用。该文从减少检查点的开销角度,对分布式系统检查点算法中关于程序卷回时文件系统状态的恢复问题进行了分析讨论和进一步的研究。 相似文献
8.
9.
容错系统中文件状态的保存与恢复算法 总被引:1,自引:0,他引:1
在机群计算环境中实现容错是人们日益关心的热点。许多著名的机群计算环境都使用检查点实现了容错的功能。但目前的检查点算法在使程序卷回执行的同时,不能相应地恢复文件系统的状态,因而对应用程序访问文件系统有较多的限制。本文在原子操作和并发控制的基础上,提出了能够恢复文件系统状态的SCR算法,进一步发展了文件系统可恢复性的概念,SCR算法与检查点机制结合使用,便可支持分布式应用程序在容错运行时对文件系统的任 相似文献
10.
Linux中检查点(Checkpoint)的核心支持——ckpt文件系统的设计 总被引:1,自引:0,他引:1
检查点(Checkpoint)是一种软件容错机制,它的目的是提高系统可靠性、减少运算损失,同时检查点机制也是并行系统中进程迁移和负载平衡的基础。在一些检查点系统中,由于对进程的状态检查/状态恢复只具有用户级支持,所以有许多局限性,比如不能完成进程外部状态检查。而在作者的设计与实现中由于具有了核心级的支持,所以能够充分地克服这些局限性。 相似文献
11.
检查点是一种用于回溯和恢复的技术,执行程序的状态每隔一段时间被保存到磁盘文件中,用来进行错误时的恢复,近来一系列减少检查点文件写开销的技术得到发展,本文将介绍Libckpt,一个基于UNIX环境的可移植的检查点工具。Libckpt一方面可以对用户完全透明,一方面也支持直接向用户的检查点生成,这种直接面向用户的方式是Libckpt的一大改进。 相似文献
12.
在基于Linux检查点机制的Apache服务器进程迁移过程中,实现了打开文件状态的一致性恢复。简要阐述了Apache服务器的体系结构及其在集群系统内的进程迁移实现技术。分析了目的结点上迁移进程恢复运行后打开文件状态不一致的原因,进行了相应的理论研究。最后给出了Apache服务器进程迁移过程中文件状态一致性恢复的具体实现。 相似文献
13.
14.
Minix进程检查点机制的实现 总被引:1,自引:0,他引:1
通过将进程用户栈和核心上下文数据存入数据段,可把与检查点有关的进程上下文简化为用户级寄存器上下文和用户数据段。检查点机制的状态检查操作就是将进程在该运行时刻的用户级寄存器上下文和用户数据段保存到检查点文件中,状态操作是状态检查的递操作,文章给出了Minix进程检查点机制的核外实现技术,并对该实现技术作了适当的优化。 相似文献
15.
异步检查点容错PVM 总被引:1,自引:0,他引:1
以工作站簇为代表的计算环境是当前分布式系统和并行计算的研究重点之一,PVM所提供的消息传递机制支持了高效的异构网络计算。但标准PVM缺乏对系统容错的支持,这可以通过使用检查点的回滚恢复方式予以弥补。该文对如何在用户级实现PVM全局容错,分析其设计思想和实现技术。主要思想是使用进行消息记录的异步检查点算法,并利用PVM守护进程和全局调度进程进行控制,所有操作对应用程序都是透明的。利用该系统还可以进一步实现PVM的透明进程迁移和负载均衡。 相似文献
16.
17.
Solaris系统多线程检查点设置与卷回恢复 总被引:1,自引:0,他引:1
文章利用UNIX进程检查点设置思想,结合多线程在Solaris系统中的实现特点,提出了一种适合于Solaris操作系统的多线程检查点设置与恢复技术,其检查点设置与恢复技术具有在用户级实现、对用户透明和简单高效的特点。文章主要介绍检查点信息的保存与恢复、函数换名、包裹,线程号映射等关键技术。 相似文献
18.
本文介绍了容错重复恢复技术中的向后滚动检查点算法,并针对减少系统开销的问题,提出了在虚拟存贮器中的一种实现方案。 相似文献
19.
工作站机群系统已成为分布式并行处理发展的主流方向之一 .随着机群系统应用领域的逐渐拓展和规模的不断扩大 ,人们对其可靠性的要求日益提高 .设计高可靠的群机系统 ,需要着重研究其系统容错技术 .本文叙述了并行异构环境回卷恢复和检查点派生 .实现透明的可移植容错和负载均衡能力 .避免调整检查点就可以构成全局一致性状态 .不仅使 BSP应用程序自治容错能力 ,而且能够在机群 (Clusters)间迁移 ,保持系统负载均衡 .重点介绍检查点设置、检查点派生、卷回、进程迁移技术 相似文献
20.
《软件》2017,(7):137-142
检查点机制是高性能计算平台的一项重要特性。它能够在程序运行的某一时刻保存程序的运行状态,并在系统故障后恢复程序状态继续执行。由于文件操作在应用程序中的普遍性,支持文件回卷对于检查点技术来说是十分必要的。文件数据备份可以使文件在回卷后恢复到正常状态,但是开销太大。本文提出了一种基于行为特征的文件检查点优化策略(BBFC),能够提供文件数据的正确恢复,有效保证了程序回卷恢复到上一个检查点时文件状态与进程其它状态保持一致。BBFC对文件行为特征进行分类,并根据这些行为特征采取相应的保存恢复策略,从而在很大概率上减少了检查点间隔需要保存的文件内容,降低了文件检查点的时间、空间开销。它对用户透明,简单易用。 相似文献