首页 | 本学科首页   官方微博 | 高级检索  
     

基于内存缓存的异步检查点容错技术
引用本文:易会战,王锋,左克,杨灿群,杜云飞,马亚青.基于内存缓存的异步检查点容错技术[J].计算机研究与发展,2014(6).
作者姓名:易会战  王锋  左克  杨灿群  杜云飞  马亚青
作者单位:国防科学技术大学计算机学院;北方车辆研究所;
基金项目:国家自然科学基金项目(60903059,61003087,61170049,61120106005);国家“八六三”高技术研究发展计划基金项目(2012AA01A309);“核高基”国家科技重大专项基金项目(2009ZX01036-001-003-001)
摘    要:高性能计算机系统规模越来越大,系统可靠性问题越来越严重.检查点技术是最典型的容错方法,但是因为并行文件系统的性能提高相对缓慢,数据写带宽低,传统检查点方法产生了严峻的性能问题.针对当前计算机系统计算和存储资源丰富,而并行文件系统写带宽提高相对滞后的特点,提出了基于内存缓存的异步检查点容错技术,传统的检查点技术被划分为两步:检查点文件首先被缓存在计算结点的局部内存,然后使用一个独立的帮助任务将数据拷贝到并行文件系统.利用局部内存带宽高以及帮助任务和计算任务并行执行的特点,新方法极大减小了检查点容错引入的时间开销,模拟和实际程序测试验证了异步检查点容错技术的有效性.

关 键 词:内存缓存  异步  检查点  容错  JASMIN
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号