首页 | 本学科首页   官方微博 | 高级检索  
     

基于通信优化的Infiniband集群MPI作业加载*
引用本文:曹宗雁,牛铁,赵毅,朱鹏,迟学斌.基于通信优化的Infiniband集群MPI作业加载*[J].计算机应用研究,2011,28(11):4256-4259.
作者姓名:曹宗雁  牛铁  赵毅  朱鹏  迟学斌
作者单位:1. 中国科学院计算机网络信息中心超级计算中心,北京100190;中国科学院研究生院,北京100049
2. 中国科学院计算机网络信息中心超级计算中心,北京,100190
基金项目:国家“863”计划重点资助项目(2010AA012301);中国科学院“十一五”信息化专项资助项目(INFO-115-B01);中国科学院知识创新工程青年人才领域项目(CNIC_QN_10004)
摘    要:针对如何缓解Infiniband集群中因通信冲突引起的MPI程序性能下降问题进行了研究,从系统管理的角度出发,提出了通过改变进程映射来优化MPI作业加载方案从而优化应用程序通信性能的方法,设计了用于评价MPI作业加载方案的通信性能损失系数(CPLR)指标,基于模拟退火算法设计了优化加载方案的搜索算法,并对所提出的指标和算法进行了实现和测试。测试结果表明,经过优化加载后的MPI程序在通信性能上有一定程度的提高。

关 键 词:高性能计算机    Infiniband    集群    MPI    作业加载    通信优化

MPI job launching based on communication optimization on Infiniband clusters
CAO Zong-yan,NIU Tie,ZHAO Yi,ZHU Peng,CHI Xue-bin.MPI job launching based on communication optimization on Infiniband clusters[J].Application Research of Computers,2011,28(11):4256-4259.
Authors:CAO Zong-yan  NIU Tie  ZHAO Yi  ZHU Peng  CHI Xue-bin
Affiliation:CAO Zong-yan1,2,NIU Tie1,ZHAO Yi1,ZHU Peng1,CHI Xue-bin1(1.Supercomputing Center,Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,China,2.Graduate School of Chinese Academy of Sciences,Beijing 100049,China)
Abstract:This paper unexpected performance loss of MPI parallel programs caused by the communication congestions on Infiniband clusters. Standing on the point of supercomputer system management and administration,proposed a method to get better communication performance for MPI applications on Infiniband clusters by launching MPI jobs with optimized process mapping schemes.It introduced the CPLR (communication performance loss rating) indicator to evaluate the quality of job launching scheme.Then it adopted simulated annealing algorithm to search the optimal job launching scheme according to the indicator.It presented detail experiments on the test platform. The results demonstrate that optimized launching scheme will benefit the communication performance of MPI applications.
Keywords:high-performance computer  Infiniband  cluster  MPI  job launching  communication optimization
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号