三层架构超级计算环境容错框架* |
| |
作者姓名: | 戴志辉 肖海力 曹荣强 迟学斌 曹宗雁 |
| |
作者单位: | 1. 中国科学院计算机网络信息中心超级计算中心,北京100190;中国科学院研究生院,北京100049 2. 中国科学院计算机网络信息中心超级计算中心,北京,100190 |
| |
基金项目: | 国家“863”计划资助项目(2006AA01A116);中国科学院信息化专项项目(INFO-115-B01);中国科学院知识创新工程青年人才领域项目(CNIC_QN_10004) |
| |
摘 要: | 为确保建成的中国科学院“十一五”信息化重大专项超级计算环境提供稳定可靠的服务,提出三层架构超级计算环境的容错框架。对计算环境可靠性和计算节点可靠性两大部分,通过作业可靠性、服务可靠性和网格节点可靠性三个主要方面的可靠性研究,提出并实现了三层架构超级计算环境的可靠性解决方案。该框架重点解决了单点故障对环境的影响,确保单点故障发生后系统能够继续提供高可用的高性能计算服务。
|
关 键 词: | 超级计算 可靠性 容错 网格 作业管理 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|