首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
基于PC集群系统的MPICH大规模并行计算实现与应用研究   总被引:5,自引:2,他引:5  
在Win2000 Server操作系统环境下采用MPICH并行技术,建立了基于PC局域网平台的并行集群系统,并通过VC 6.0调用消息传递库MPI函数完成了3个并行计算实例。符合MPICH规范的PC并行集群系统配置简便、系统稳定、界面友好、性价比高,能够持续利用计算机现有资源和大幅度提高计算效率。  相似文献   

2.
基于linux集群的并行计算   总被引:12,自引:0,他引:12  
集群计算机技术是高性能并行计算机系统中的一个研究热点。对于有密集运算需求的企业和研究机构来说,集群系统是他们的最佳选择。本文简要介绍了linux集群技术和并行程序设计的概念,并给出了一个并行程序实例,对linux集群系统进行了性能评测。  相似文献   

3.
并行计算广泛地应用到各个领域,基于Liux集群的MPI并行环境是一个廉价而高效的并行计算系统.对网络文件系统NFS、Secure Shell(SSH)、消息传递接口MPI和集群系统作简单的介绍.详细记录配置NFS、SSH、MPI等软件的实现过程,并对设计的集群系统并行运算环境进行测试,测试结果说明这种并行计算环境具有良好的性能.  相似文献   

4.
首先研究了并行计算技术,然后对现行仿真系统中的并行算法、模型分配等机制进行分析,提出优化方法和设计评估方法,实现了一种实体运动集群仿真系统.  相似文献   

5.
基于Lustre文件系统的MPI检查点系统实现技术与性能测试   总被引:1,自引:0,他引:1  
基于协同式检查点的回卷恢复是在大规模并行计算机系统中得到采用的一项重要容错技术,其性能开销主要为协同协议和检查点映像存储所决定.描述了一个在MPICH2中实现的应用透明的并行检查点系统,相比已有的技术,该系统有以下特点:1)协同协议操作利用了并行应用的近邻通信特性,通过虚连接方法减少协议的处理开销;2)采用Lustre文件系统简化检查点映像文件管理的复杂性;3)通过并行I/O操作提高性能,优化检查点映像的存储过程.实际应用的测试表明,该检查点系统具有较小的运行时间开销和良好的可扩展性.  相似文献   

6.
戴永涌 《计算机工程》2005,31(22):78-80
在对MPI程序的检查点系统LAM/MPI以及互联技术Myrinet的通信过程等进行简单介绍的基础上,采用协调一致性的设计方法,实现了一个基于Myrinet及其通信协议GM的检查点系统。描述了设计过程,并对实现结果进行了测试,结果表明了该设计与实现的可行性,并在结论中对还存在的问题进行了分析和讨论。  相似文献   

7.
针对空中交通管制系统(ATC)中对飞行数据集群处理的可靠性要求,提出了一种基于Linux的用户级进程检查点设置与恢复方案.对基于该Linux用户级的进程检查点的飞行数据集群处理的各个主要模块进行了介绍,在此基础上给出了系统设计框架.从进程的初始化数据段、堆、栈和打开的文件的保存与恢复,给出了该方案的详细实现方法.该进程检查点设置与恢复方案不但可以在主机崩溃重启后恢复进程在重启前的运行状态,更重要的是可以在分布式系统通过进程迁移将保存的进程检查点迁移到其它主机运行,从而有效的提高系统的可靠性,减少运算损失.  相似文献   

8.
在大规模机群环境下,检查点和恢复机制是一种必不可少的容错技术。该文提出一种基于机群通信系统的可靠性机制,在不作全局同步的情况下获取通信系统全局状态的方法,并利用该方法实现了一个对应用程序透明的并行检查点系统。该系统通过底层通信系统的支持降低了并行检查点的实现复杂度和执行开销,适用于大规模机群应用。  相似文献   

9.
刘勇燕  刘勇鹏  冯华  迟万庆 《计算机科学》2011,38(5):287-289,305
检查点机制是高性能并行计算系统中重要的容错手段,随着系统规模的增大,并行检查点的可扩展性受文件访问的制约。针对大规模并行计算系统的多级文件系统结构,提出了cache式并行检查点技术。它将全局同步并行检查点转化为局部文件操作,并利用多处理器结构进行乱序流水线式写回调度,将检查点的写回时机合理分布,从而有效地隐藏了检查点的写回开销,保证了并行检查点文件访问的高性能和高可扩展性。  相似文献   

10.
为了满足采用Monte-Carlo方法(下面简称MC方法)进行探测器设计的计算资源要求,本文构建了一个基于MPI的Beowulf集群系统,并给出了在MPI环境下的求解探测器效率的并行算法和具体实现。结果表面,Beowulf集群系统能够在基于MC方法的探测器设计计算方面取得接近线性加速比的良好性能,在4个处理器的情况下,加速比达到3.59。  相似文献   

11.
介绍了一种基于tspaces的共享存储的分布计算模型的设计和实现,重点给出了通信以及动态加入和撤出的具体实现,最后和MPI作了分析和比较。  相似文献   

12.
王之元  杨学军  周云 《软件学报》2012,23(4):1022-1035
随着系统规模的扩大,并行计算的性能不断提高,但可靠性却也在不断下降,因此需要采用某种容错机制来容忍或恢复硬件故障和数据错误.目前常用的容错机制Checkpoint/Restart和多模冗余均引入了额外的开销,这些开销均在某种程度上制约了并行计算的可扩展性.因此,在高性能计算需求不断增长的今天,可扩展容错机制的设计显得尤为迫切和重要.以三模冗余(triple modular redundancy,简称TMR)为典型案例,描述了传统TMR在大规模MPI 并行计算上的实现方法,分析了该机制所面临的实际问题,进而指出传统TMR制约了并行计算的扩展.根据该技术所面临的问题,设计了可扩展三模冗余(scalable triple modular redundancy,简称STMR),并进一步验证了其有效性和可扩展性.该机制不仅能够处理Checkpoint/Restart针对的fail-stop故障,还能够解决绝大部分硬件不能直接感知的数据错误.最后,借用BlueGene/L的系统参数进行模拟,预测当系统规模增大时,在分别采用TMR和STMR的情况下并行计算可扩展性的变化,结果进一步验证了STMR是可扩展的容错机制.  相似文献   

13.
双精度浮点并行计算将不能满足高性能计算领域对计算精度的要求,但是目前还没有高性能的超双精度并行计算的解决方法。基于并行编程语言MPI,本文提出了扩展双精度浮点的并行计算实现方法,并且使用精度敏感的圆周率计算BBP算法验证了该方法的正确性和性能。  相似文献   

14.
大规模并行作业的计算通常涉及海量的计算数据和众多的高性能计算设备.随着网格计算技术帮助人们进行计算的同时,大规模并行作业的数据规模的增长也越来越快,对计算速度的要求也越来越高,为了充分利用网格等计算平台上的资源,提高作业的计算效率,人们通常需要将待计算的数据进行分组,然后分别上传至不同的平台上进行计算,这对科学研究和数据管理造成了极大的不便.本文提出了一个针对大规模并行作业计算的统一数据管理空间,实现了异构网格和计算平台上数据的逻辑整合,从而大大提高了对计算数据的管理效率,加快了科学活动的进程.本文最后通过统一数据管理空间在大规模虚拟筛选中的应用,对该统一空间的数据传输效率和数据管理能力进行了分析.  相似文献   

15.
一种面向中规模科学计算的网络协议设计   总被引:1,自引:0,他引:1  
科学计算一直是计算机应用的一个重要领域。利用工作站机群进行集群计算(cluster computing)已经成为科学计算的一个重要方式.本文提出了一种新型的确定型通信机制及相应的上层专用网络协议设计.实验数据证明,该通信网络系统相对于以太网网络更适合于构造用于科学计算的计算机集群系统.  相似文献   

16.
数据融合系统中并行目标识别的研究与实现   总被引:1,自引:0,他引:1  
分析了将情报侦察数据融合系统中目标识别中心并行化的可行性,提出了基于航迹的任务划分策略,采取集中式动态负载平衡技术设计并实现了基于消息传递接口(MPI)的并行目标识别中心。同时给出了Dempster-Shafer证据理论在适当条件下的一种简化形式及其在并行环境下的应用方法。最后给出融合系统并行目标识别中心的性能测试结果,在保证识别可信度的基础上大大提高了处理速度,解决了融合系统的性能瓶颈问题。  相似文献   

17.
高性能计算技术以加速度迅猛发展,继千万亿次系统研制成功以后,超级计算机的性能又快速提升至数万万亿次,国际学术界与工业界普遍预期在2018年左右将出现极大规模并行的百万万亿次系统(Exascale Computing,简称E级系统)。本文从最新一届TOP500榜单入手分析了超级计算领域的技术动态,在此基础上,探讨了未来E级系统的发展趋势及其所面临的能耗、可扩展、可靠性和可编程性等关键技术问题。  相似文献   

18.
一种基于MPI和工作站群集的并行计算   总被引:1,自引:0,他引:1  
黄伟 《电脑学习》2005,(1):31-32
本文主要分析了消息传递的模型及其实现的一种方式MPI,构造了一个四节点基于MPI的工作站群集并实现了求π的并行计算,最后给出性能分析和负载平衡分析.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号