首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 61 毫秒
1.
在分子动力学并行计算的过程中,正确地处理好并行规模与PME(Particle-Mesh Ewald)方法的任务分配,对于提高分子动力学的并行效率具有非常重要的影响。以常用的分子动力学软件Gromacs[1-3]为例,利用上海超级计算中心"魔方"超级计算平台,就不同并行规模与不同PME任务分配方式下的计算性能进行测试。发现并行能在一定的范围内显著的提高Gromacs的计算效率,但是当并行规模超过一定值后,计算效率反而下降。另一方面,当并行规模较小时,不设置PME专属节点的计算效率较高;但当并行规模较大时,合理的设置PME专属节点,能显著地提高计算的效率。这一结果能对从事分子动力学模拟的研究人员合理分配并行资源提供帮助。  相似文献   

2.
GROMACS是著名分子动力学模拟软件之一,GPGPU技术能够使用图形处理器完成通用计算,是高性能计算的最新发展趋势.本文通过对Nvidia CUDAGPGPU编程模式以及GROMACS代码的研究分析,论证了将GROMACS移植到以GPGPU为计算核心的平台上的可行性,并通过算法和参数数据组织形式的改造实现了GROMACS中非键力计算函数从x86处理器向GPGPU的移植,获得显著的性能提升,计算加速比达到10倍以上,为GROMACS整体移植的实现奠定了基础.  相似文献   

3.
GROMACS是应用广泛的开源分子动力学模拟软件,当前主要通过CUDA使用NVIDIA GPU进行加速计算。ROCm是一个开源的高性能异构计算平台。基于ROCm平台的HIP编程语言,首次实现了GROMACS 2020系列在ROCm平台上的完整移植。在MI50 GPU上,以一个复杂离子液体模拟算例为目标,使用GPU性能分析工具rocprof对移植代码进行了性能分析。针对MI50硬件特性,先后对成键力核函数、静电力的PME核函数和短程非成键力核函数进行了优化,优化后运行目标算例的性能相比初始版本整体上获得了约2.8倍的加速比,在 MI50上的性能高于GROMACS原版OpenCL代码60.5%,相对纯CPU版本有约2.7倍的加速比。在另外2个具有代表性算例的单结点测试以及离子液体算例的多结点扩展性测试中,优化后的代码也达到了较好的性能提升,这表明所采用的优化操作具有一定的通用性。  相似文献   

4.
基于分布存储的工作站机群系统由于具有很高的性能价格比,越来越受到高性能计算领域的重视。用户在使用机群系统时,迫切地需要一种性能监视、评估和预测的工具。THPT系统就是为满足这一需要而设计开发的。 THPT系统由两个部分组成:网络并行计算环境的实时管理和性能监测子系统MMS以及并行计算性能分析和预测子系统PAPS。本文主要对PAPS子系统进行论述。  相似文献   

5.
并行计算的软件环境与硬件结构   总被引:2,自引:0,他引:2  
传统的冯·诺依曼串行计算模型对程序的执行顺序约束太多,欲从它得到更多的性能日益困难,人们把目光转向了大有希望的并行计算,但也带来了很多新的问题。本文将讨论并行计算所需解决的基本软件和硬件问题及当前研究现状。  相似文献   

6.
网络并行计算软件环境的分析与比较   总被引:3,自引:0,他引:3  
网络并行计算软件环境是现代并行计算的关键技术之一。该文对当前最具发展潜力的三个软件环境———PVM、MPI与HPF作一全面介绍,并分析和比较了各自的特色以及未来发展方向。  相似文献   

7.
为提高分子动力学的模拟运算效率,在Linux环境下以MPICH技术构建的小型SMP集群系统上,对模拟体系采用改进的原子分解算法进行并行计算.将要模拟的原子平均分配给各个计算节点进行计算,节点间通过MPI进行通信.对进程间的接收和发送进行捆绑操作并采取非阻塞通信取代原有的阻塞通信,从而避免了死锁情况.实验结果表明:优化后的并行算法可以有效地利用计算机资源,提高运算效率,解决了实际测试中出现的死锁问题,在该集群系统上获得3倍以上的加速比.  相似文献   

8.
在以MPICH技术构建的局域网集群系统下,利用分子动力学并行计算软件Protomol和三维分子模拟软件VMD构建大规模并行计算平台,完成若干复杂分子动力学典型实例的仿真运算。计算结果表明:采用并行计算能持续有效地利用现有计算机资源,同时大幅度提高计算效率,在现有并行集群系统下可以获得3倍以上的加速比,为实现复杂分子动力学的深入研究提供了可行方案。  相似文献   

9.
并行计算性能的“双流”分析   总被引:1,自引:1,他引:0  
The generalized speed-up is estimated according to the "double-stream" analyses. The term"decreasing ratio" is used to describe the influence of the hierarchical memory and the characteristics of parallel application on the performance. The optimization principles for parallel computation are also given.  相似文献   

10.
传统的并行计算的性能评价模型是加速比,文中讨论了加速比的缺点和不足,在此基础上提出了一种新的优化并行计算的性能评价模型(我们称之为优化加速比)。利用优化加速比分析了NAS基准测试程序MG和FT在IBM SP2(66mhz/wn)上的性能。  相似文献   

11.
研发适应国产异构计算环境的高性能计算算法与软件是非常重要的课题,对我国高性能计算软件研发匹配高性能计算硬件高水平发展的速度具有重要意义.本文首先简要介绍高性能计算应用软件的现状、趋势和面临挑战,并对几类典型高性能计算应用软件开展并行计算算法特征分析,涵盖了宇宙N体模拟、地球系统模式、计算材料相场动力学、分子动力学、量子计算化学和格点量子色力学等多个问题、尺度和领域.其次,我们讨论了面向国产异构计算系统的对策,提炼出若干典型应用算法和软件的共性问题,涉及核心算法、算法发展、优化策略等.最后,本文面向异构计算体系结构对高性能计算算法与软件进行了总结.  相似文献   

12.
徐顺  王武  张鉴  姜金荣  金钟  迟学斌 《软件学报》2021,32(8):2365-2376
研发适应国产异构计算环境的高性能计算算法与软件是非常重要的课题,对我国高性能计算软件研发匹配高性能计算硬件高水平发展的速度具有重要意义.首先,简要介绍高性能计算应用软件的现状、趋势和面临挑战,并对几类典型高性能计算应用软件开展并行计算算法特征分析,涵盖了宇宙N体模拟、地球系统模式、计算材料相场动力学、分子动力学、量子计...  相似文献   

13.
并行计算是CFD技术发展的必然趋势。本文从高超声速流动的特点出发,研究多分区结构网格下CFD并行计算方法,重点解决了区域之间流场信息的数据交换问题和边界处理问题,以保证流场的连续性。本文采用有限体积法求解高超声速流场,空间离散格式为Osher-Chakravarthy TVD格式,利用MPI消息传递模式完成数据交换,在自主搭建的PC集群上进行算例考核,验证了算法的可行性和正确性。  相似文献   

14.
Study on Parallel Computing   总被引:5,自引:0,他引:5       下载免费PDF全文
In this paper, we present a general survey on parallel computing. The main contents include parallel computer system which is the hardware platform of parallel computing, parallel algorithm which is the theoretical base of parallel computing, parallel programming which is the software support of parallel computing. After that, we also introduce some parallel applications and enabling technologies. We argue that parallel computing research should form an integrated methodology of "architecture algorithm programming application". Only in this way, parallel computing research becomes continuous development and more realistic.  相似文献   

15.
In this article we present a new parallel programming environment, called distributed object-oriented virtual computing environment (DOVE), for clustered computers based on distributed object model. In DOVE, a parallel program is built as a collection of concurrent objects each of which has its own computing power and which interacts with one another by remote method invocation. The parallelism is encapsulated within distributed objects, which can be handled the same way as local objects. The main goal of DOVE is to provide users with an easy-to-use transparent parallel programming environment while supporting efficient parallelism encapsulated and distributed among objects. For the experiment and evaluation of DOVE, two parallel application programs have been developed both on DOVE and PVM.  相似文献   

16.
根据分布式存储并行计算机的体系结构特点,设计了一个结构动力数值仿真两级并行计算系统.首先通过两级分区为并行计算准备数据,并将数据分布式存储在各节点的局部存储器上;在结构动力分析过程中,通过进一步缩减问题规模和有效地提高通信效率大幅度减少了界面方程求解时间以及系统求解总时间.文中详细阐述了该系统工作原理、并行计算流程和系统实现的相关软件开发工具.最后通过典型数值算例验证了该系统的有效性.  相似文献   

17.
为研究基于GPU的高性能并行计算技术,利用集成448个处理核心的NVIDIA GPU GTX470实现了脉冲压缩雷达的基本数据处理算法,包括脉冲压缩算法与相参积累算法;同时根据GPU的并行处理架构,将脉冲压缩、相参积累算法完成了并行优化设计,有效地将算法并行映射到GPU GTX470的448个处理核心中,完成了脉冲压缩雷达基本处理算法的GPU并行处理实现;最后验证了并行计算的结果,并针对处理结果效果与实时性进行了评估。  相似文献   

18.
分布式计算、并行计算、内存计算是目前提高计算性能的关键技术和热点研究领域。在大数据环境下,针对数据型统计分析系统性能劣化明显、不能满足用户使用需求的问题,提出了一种轻量级高性能对象化并行计算架构,研制了该架构的对象服务组件、对象管理服务组件和客户端代理组件,并将该架构和组件在国家电网资产质量监督管理系统中进行了验证应用,其效果表明该框架能大幅提升大数据处理效率。  相似文献   

19.
格点量子色动力学(QCD)是从第一原理出发求解QCD的非微扰方法,通过在超立方格子上模拟胶子场和费米子场相互作用,其计算结果被认为是对强相互作用现象的可靠描述,格点计算对QCD理论研究意义重大.但是,格点QCD计算具有非常大的计算自由度导致计算效率难以提升,通常对格子体系采用区域分解的方法实现并行计算的可扩展性,但如何提升数据并行计算效率仍然是核心问题.本文以格点QCD典型软件Grid为例,研究格点QCD计算中的数据并行计算模式,围绕格点QCD中的复杂张量计算和提升大规模并行计算效率的问题,开展格点QCD方法中数据并行计算特征的理论分析,之后针对Grid软件的SIMD和OpenMP等具体数据并行计算方式进行性能测试分析,最后阐述数据并行计算模式对格点QCD计算应用的重要意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号