首页 | 本学科首页   官方微博 | 高级检索  
     

三层架构超级计算环境容错框架*
引用本文:戴志辉,肖海力,曹荣强,迟学斌,曹宗雁. 三层架构超级计算环境容错框架*[J]. 计算机应用研究, 2011, 28(7): 2576-2579. DOI: 10.3969/j.issn.1001-3695.2011.07.049
作者姓名:戴志辉  肖海力  曹荣强  迟学斌  曹宗雁
作者单位:1. 中国科学院计算机网络信息中心超级计算中心,北京100190;中国科学院研究生院,北京100049
2. 中国科学院计算机网络信息中心超级计算中心,北京,100190
基金项目:国家“863”计划资助项目(2006AA01A116);中国科学院信息化专项项目(INFO-115-B01);中国科学院知识创新工程青年人才领域项目(CNIC_QN_10004)
摘    要:为确保建成的中国科学院“十一五”信息化重大专项超级计算环境提供稳定可靠的服务,提出三层架构超级计算环境的容错框架。对计算环境可靠性和计算节点可靠性两大部分,通过作业可靠性、服务可靠性和网格节点可靠性三个主要方面的可靠性研究,提出并实现了三层架构超级计算环境的可靠性解决方案。该框架重点解决了单点故障对环境的影响,确保单点故障发生后系统能够继续提供高可用的高性能计算服务。

关 键 词:超级计算; 可靠性; 容错; 网格; 作业管理

Resilience framework of three-layer supercomputing environment
DAI Zhi-hui,XIAO Hai-li,CAO Rong-qiang,CHI Xue-bin,CAO Zong-yan. Resilience framework of three-layer supercomputing environment[J]. Application Research of Computers, 2011, 28(7): 2576-2579. DOI: 10.3969/j.issn.1001-3695.2011.07.049
Authors:DAI Zhi-hui  XIAO Hai-li  CAO Rong-qiang  CHI Xue-bin  CAO Zong-yan
Affiliation:(1. Supercomputing Center, Computer Network & Information Center, Chinese Academy of Sciences, Beijing 100190, China; 2.Graduate School of Chinese Academy of Sciences, Beijing 100049, China)
Abstract:Based on the three-layer supercomputing environment, developed a resilience framework for this environment to provide stable and reliable supercomputing service. Designed the solution to the resilience of the environment and implemented the solution job b
Keywords:supercomputing   resilience   fault-tolerance   grid computing   job management
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号