首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
双精度浮点并行计算将不能满足高性能计算领域对计算精度的要求,但是目前还没有高性能的超双精度并行计算的解决方法。基于并行编程语言MPI,本文提出了扩展双精度浮点的并行计算实现方法,并且使用精度敏感的圆周率计算BBP算法验证了该方法的正确性和性能。  相似文献   

3.
分析了MPI环境下算法设计的特点,描述了在MPI环境下实现Mandelbrot集的三种算法,并对它们进行了比较。  相似文献   

4.
5.
在分布式存储系统上,MPI已被证实是理想的并行程序设计模型。MPI是基于消息传递的并行编程模型,进程间的通信是通过调用库函数来实现的,因此MPI并行程序中,通信部分代码的效率对该并行程序的性能有直接的影响。通过用集群通信函数替代点对点通信函数以及通过派生数据类型和建立新通信域这两种方式,两次改进DNS的MPI并行程序实现,并通过实验给出一个优化MPI并行程序的一般思路与方法。  相似文献   

6.
使用MPI的并行I/O实现及性能分析   总被引:1,自引:0,他引:1  
论文讨论了并行环境中I/O的基本方法——串行I/O方法和并行I/O方法,并使用MPI-1及MPI-2对这两种方法进行了实现。分析了不同的实现方法对I/O带宽产生的影响。通过理论分析和实验表明,基于MPI-2的并行I/O实现方法与其它I/O实现方法相比,可得到更高的I/O带宽,是解决I/O性能问题的有效途径。  相似文献   

7.
In this paper, a parallel implementation of the Iterative Alternating Direction Explicit method by D’Yakonov (IADE-DY) to solve 2-D telegraphic problem on a distributed system using Message Passing Interface (MPI) and Parallel Virtue Machine (PVM) are presented. The parallelization of the program is implemented by a domain decomposition strategy. A Single Program Multiple Data (SPMD) model is employed for the implementation. The implementation is discussed in relation to means of the parallel performance strategies and analysis. The model enhances overlap communication and computation to avoid unnecessary synchronization, hence, the method yields significant speedup. The level of speedup observed from tables as the mesh increases are in the range of 5–10%. Improvement has been achieved by numbers of tables and figures in our experiment. We present some analyses that are helpful for speedup and efficiency. It is concluded that the efficiency is strongly dependent on the grid size, block numbers and the number of processors for both MPI and PVM. Different strategies to improve the computational efficiency are proposed.  相似文献   

8.
The computational difficulty of econometric problems has increased dramatically in recent years as econometricians examine more complicated models and utilize more sophisticated estimation techniques. Many problems in econometrics are `embarrassingly parallel' and can take advantage of parallel computing to reduce the wall clock time it takes to solve a problem. In this paper I demonstrate a method that can be used to solve a maximum likelihood problem using the MPI message passing library. The econometric problem is a simple multinomial logit model that does not require parallel computing but illustrates many of the problems one would confront when estimating more complicated models.  相似文献   

9.
在介绍消息传递接口标准(MPI)和分析并行程序设计方法的基础上,提出了在并行程序设计中需要进行算法级分析和程序级测试,以此来对影响具体的并行程序执行效率的因素进行分析,并用实例验证了分析结果。最后对MPI的实现之一———MPICH1.2.5版本的不足,提出了改进的方法。  相似文献   

10.
MPI并行编程环境的研究   总被引:3,自引:0,他引:3  
以RISC工作站或高档微机通过LAN连接的机群系统已经成为并行计算的主流技术,研究适应机群系统的并行编程环境自然重要起来。在众多的并行编程环境中,应用较为广泛的有消息传递接口(MPI)标准和并行虚拟机(PVM)环境。本文重点分析了MPI编程环境,并出给了MPI并行程序设计的基本方法。  相似文献   

11.
基于MPI的并行程序设计   总被引:6,自引:0,他引:6  
在介绍消息传递接口标准(MPI)和分析并行程序设计方法的基础上,提出了在并行程序设计中需要进行算法级分析和程序级测试,以此来对影响具体的并行程序执行效率的因素进行分析,并用实例验证了分析结果。最后对MPI的实现之——MPICH1.2.5版本的不足,提出了改进的方法。  相似文献   

12.
分析了三维CT近似重建FDK快速算法理论基础,采用基于MPI并行环境地并行实现方案实现三维CT的并行重建,得到比较理想的重建时间结果和比较理想的加速比与效率。  相似文献   

13.
现代信息系统中,使用密码保存加密数据是维护数据保密性的基本方法。当需要解密未知密钥的加密数据时,通常需要几百万甚至几百万亿次的解密操作。这些解密操作虽然计算复杂度较高,但是不同的解密操作相互独立而易于并行。所以,使用高性能计算机(HPC)可以减少数据解密的时间。本文设计一个基于MPI的并行密码恢复框架(P2RF),该框架把需要解密的数据和候选密钥在任务级分布到不同的计算节点上,计算节点再根据节点计算资源配置的不同把计算分布到计算资源上。实验结果表明:P2RF的扩展性随着节点的增多而线性扩展。  相似文献   

14.
基于CMAC-PID并行控制的主动队列管理方法   总被引:1,自引:0,他引:1       下载免费PDF全文
主动队列管理对于解决日益严重的网络拥塞问题具有极其重要的意义。本文针对PID主动队列管理算法的参数整定难且不能实时调整,不能适应复杂、非线性网络环境的缺点,提出了一种基于小脑神经网络(CMAC)与PID控制相结合的主动队列管理算法。该算法利用CMAC前馈补偿来确保跟踪误差的快速收敛,降低超调量,采用PID控制器实现回馈控制,保证系统的稳定性,而且抑制扰动。仿真结果表明,基于CMAC-PID并行控制的主动队列管理方法适应于多变的网络环境,较之常规PID主动队列管理算法具有输出误差小、响应速度快、鲁棒性强的优点。  相似文献   

15.
并行处理是一项重要的技术,简要介绍MPI的定义,详尽描述了在Linux环境下如何安装和配置MPI,搭建并行程序实现的软件平台,以达到多机并行计算,或者单机多进程模拟多机并行计算.  相似文献   

16.
MPI及MPI的高效实现   总被引:1,自引:0,他引:1       下载免费PDF全文
本文描述了MPI的基本概念及两个MPI实现软件LAM和MPICH。MPICH是一个可移植的MPI实现,可容易地移植到其他MPP系统。我们在源码分析基础上 ,结合实践经验,给出了实现建议。  相似文献   

17.
刘彩云  陈忠  熊杰 《计算机工程》2010,36(19):200-202
现有蚁群系统在求解大规模组合优化问题时所需的计算时间较长。针对该不足,提出基于消息传递接口的粗粒度异步协作并行最大最小蚂蚁系统,能在保证解质量的前提下,降低并行计算中的通信开销。在曙光4000L并行机上进行的数值实验结果表明,该系统具有较优的并行加速比和加速效率,且适合于大规模TSP问题的求解。  相似文献   

18.
介绍了MPI并行编程环境和MPI并行程序设计的特点,讨论了在MPI并行程序设计中实现动态负载平衡的方法,提出一种根据计算节点的计算能力和实时负载情况进行任务迁移的动态负载平衡策略。  相似文献   

19.
基于MPI的并行八叉树碰撞检测   总被引:5,自引:1,他引:5  
通过对碰撞检测过程进行分析,发现各节点间相关性较小,存在并行化的可能.在对八叉树碰撞检测算法做适当修改的基础上,结合成熟的消息传递通信(MPI)并行编程环境,提出了基于MPI的并行碰撞检测算法.测试结果表明,碰撞检测效率有较大的提高.  相似文献   

20.
根据集群的特点和聚类的特性,从理论上探讨了聚类并行化的可行性,并在此基础上用实验进行了验证,结果表明通过这些改进能够获得比较理想的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号