首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
并行计算环境与数值并行算法研究   总被引:3,自引:0,他引:3  
本文介绍并行计算环境的一些最新进展,探讨我国当前数值并行算法研究的技术路线,特别强调高水平的基础研究与解决科学工程计算中重大挑战问题的结合。  相似文献   

2.
对本文的研究与创新工作概括如下 :( 1 )并行计算模型是研究并行计算可扩展性的基础。本文在深入分析已有并行计算模型的基础上 ,对常用并行计算模型进行分类 ,指出了它们的适用范围和优缺点。( 2 )深入分析了可扩展性与执行时间、可扩展性与单机性能之间的关系。结果表明 :如果片面强调执行时间或单机性能 ,可能会对可扩展性带来不利的影响。从理论和实验上分析了任务和数据分配策略对并行系统可扩展性的影响。( 3)首次从费用有效性的角度提出了近优可扩展模型。它不仅可以描述并行系统的可扩展能力 ,而且可以根据小规模系统的性能指标 ,预…  相似文献   

3.
利用IBM4381-P03型及CPU计算机进行并行处理功能的开发和并行计算的应用,得到较高的加速比。  相似文献   

4.
研究如何提高航空发动机包容性数值仿真并行计算效率的问题。由于仿真需要庞大的网格数量、高度的非线性和复杂的接触算法,并行计算效率一直比较低,已经成为制约工程应用的重要因素。为了提高航空发动机包容性数值仿真并行计算效率,提出了在共享内存并行模式(Share-Memory Parallel,SMP)下,采用自接触算法进行显式动力学分析,提高并行计算效率的方法。实际算例的比较表明,相比传统的面-面接触算法,采用自接触算法可以有效提高航空发动机包容性数值仿真并行计算效率。  相似文献   

5.
CG法分布式并行计算的实现   总被引:1,自引:0,他引:1  
叙述了在Windows环境下CG法的分布式并行计算的基本方法、结构与算法,并用Visual C++编写源代码具体实现。  相似文献   

6.
徐宁  杨庚 《计算机仿真》2003,20(9):53-55,93,94
该文采用有限元方法对动力模型进行了数值仿真。首先推导出模型方程,然后根据将要采用的数值方法提出了新的变量替换关系和无量纲化参数,再讨论了一般器件的边界条件,最后对具有亚微米级的GaAs MESFET进行了数值仿真,数值结果表明在一定的条件下,电子的流动具有跨音速特征。  相似文献   

7.
在以MPICH技术构建的局域网集群系统下,利用并行计算程序进行了超声速弧形翼-身组合体的三维绕流流场数值仿真,得到了弧形翼射弹的流场信息;并且通过对不同数量网格在集群不同结点数目下的计算结果进行分析比较,得出了加速比和并行效率随结点数目变化的规律,发现大规模网格在加速比和并行效率方面性能优越,更适合集群系统的并行计算,同时验证了此集群系统在数值仿真应用中的有效性和优越性,为进行大规模科学工程计算提供了技术支持.  相似文献   

8.
并行处理仿真为并行系统的建模分析,并行算法的模拟执行以及并行环境的性能评价提供支持,本文利用任务相关仿真时钟和重叠时间片建立了一种支持完全并和用户并发方式的并行多任务模型,并结合对不同调度算法和互连结构的仿真实验,着重分析了任务调度对系统性能的影响以及互连网络技术与通信开销的关系。同时,仿真环境还提供模拟执行的并发度曲线和任务执行踪迹供和户分析调试并行程序。  相似文献   

9.
为解决当前群体行为模型因规模扩大而导致计算量剧增的问题,采用并行离散事件方法构建了大规模群体行为模型,利用YH-SUPE仿真引擎实现了群体行为模型的并行计算。重点介绍了模型中仿真对象和仿真对象信息交互的设计方法,并对该模型在不同数量的节点和仿真实体的环境下进行了测试。实验结果表明,将并行计算引入群体行为建模之中,可以显著提高仿真个体的数量,更加有效地支持了群体模型的实时运行。  相似文献   

10.
基于Fluent的全机数值模拟及并行计算   总被引:3,自引:0,他引:3  
利用CFD商用软件Fluent对亚声速飞行飞机的三维绕流流场进行了数值模拟以及并行计算,得到了飞机附近的流场,实现了此软件在高性能并行计算机上的并行;并且通过对不同数量网格在不同结点数目机群上的计算结果进行分析比较,验证了此商用软件在并行平台上应用的有效性,也为进行大规模科学工程计算提供了技术参照。  相似文献   

11.
OilCL:一个面向油藏数值模拟并行计算的通信库   总被引:2,自引:0,他引:2  
OilCL是一个用于油藏数值模拟计算的可移植的通信库,虽然目前存在很多的通信库,如MPI,PVM等,但由于它们的通用性,而且其界面较低级而不适合油藏模拟数值计算,OilCL为油藏数值模拟计算程序员提供一个方便、自然的界面,它支持动态地建立和释放通信上下文/逻辑进程网格;支持基于源的消息选择;逻辑拓扑作为群通信子程序的参数并提供开发和运行模式,这些机制便于油藏数值模拟计算程序的设计,使程序可读性更强  相似文献   

12.
分布式计算、并行计算、内存计算是目前提高计算性能的关键技术和热点研究领域。在大数据环境下,针对数据型统计分析系统性能劣化明显、不能满足用户使用需求的问题,提出了一种轻量级高性能对象化并行计算架构,研制了该架构的对象服务组件、对象管理服务组件和客户端代理组件,并将该架构和组件在国家电网资产质量监督管理系统中进行了验证应用,其效果表明该框架能大幅提升大数据处理效率。  相似文献   

13.
并行计算是CFD技术发展的必然趋势。本文从高超声速流动的特点出发,研究多分区结构网格下CFD并行计算方法,重点解决了区域之间流场信息的数据交换问题和边界处理问题,以保证流场的连续性。本文采用有限体积法求解高超声速流场,空间离散格式为Osher-Chakravarthy TVD格式,利用MPI消息传递模式完成数据交换,在自主搭建的PC集群上进行算例考核,验证了算法的可行性和正确性。  相似文献   

14.
面向高性能数值计算的并行计算模型DRAM(h)   总被引:11,自引:0,他引:11  
张云泉 《计算机学报》2003,26(12):1660-1670
提出了一个基于存储层次的新并行计算模型DRAM(h),并在该模型下对两个经典并行数值计算算法的不同实现形式:四种形式并行下三角方程求解(PTRS)和六种形式无列选主元并行LU分解(PLU),进行了分析.模型分析表明,具有近乎相同时间和空间复杂性的同一算法不同实现形式,在该模型下会有完全不同的存储复杂度.作者在日立公司SR2201MPP并行机、曙光3000超级服务器和中国科学院科学与工程计算国家重点实验室(LSEC)的128节点Linux Cluster等三种并行计算平台上对模型分析结果进行了实验验证.结果表明,该模型分析在绝大多数情况下都能较好地与不同实验平台上的实验结果吻合.个别出现偏差的分析结果,在根据计算平台的存储层次特点修改模型分析的假定后,也能够进行解释.这说明了该模型对不同形式的算法实现进行存储访问模式区分的有效性.对在计算模型中加入指令/线程级并行的可行性和方法的研究是下一步的工作.  相似文献   

15.
莫则尧 《计算机学报》2004,27(10):1311-1319
复杂物理现象通常由多类复杂的物理过程紧耦合构成,其数值模拟也通常由适用不同物理过程的多类并行应用程序紧耦合完成.如何设计这些物理过程之间的联接算法,既要保证程序之间数据传递的高效,又要保证程序各自运行和总体模拟的高效,还要保证程序各自开发的独立,是一个值得研究的课题.该文基于广泛应用于高温高压多物理研究中的辐射流体力学和中子输运多物理并行数值模拟,在非结构网格上,提出了两种联接算法:完全松散联接算法和两层紧耦合联接算法,前者侧重于实现程序各自运行的高效和开发的独立,后者在前者的基础上,还权衡了数据传递和总体模拟的高效.在两台并行机的数百个处理机上,通信复杂度分析和数值实验结果表明两个算法均是有效的,可推广适用于辐射或中子输运与其他流体力学的多物理并行数值模拟应用中.特别地,两层紧耦合联接算法是高效可扩展的,取得了近似最优的并行性能.  相似文献   

16.
The development of intelligent transportation systems (ITS) and the resulting need for the solution of a variety of dynamic traffic network models and management problems require faster‐than‐real‐time computation of shortest path problems in dynamic networks. Recently, a sequential algorithm was developed to compute shortest paths in discrete time dynamic networks from all nodes and all departure times to one destination node. The algorithm is known as algorithm DOT and has an optimal worst‐case running‐time complexity. This implies that no algorithm with a better worst‐case computational complexity can be discovered. Consequently, in order to derive algorithms to solve all‐to‐one shortest path problems in dynamic networks, one would need to explore avenues other than the design of sequential solution algorithms only. The use of commercially‐available high‐performance computing platforms to develop parallel implementations of sequential algorithms is an example of such avenue. This paper reports on the design, implementation, and computational testing of parallel dynamic shortest path algorithms. We develop two shared‐memory and two message‐passing dynamic shortest path algorithm implementations, which are derived from algorithm DOT using the following parallelization strategies: decomposition by destination and decomposition by transportation network topology. The algorithms are coded using two types of parallel computing environments: a message‐passing environment based on the parallel virtual machine (PVM) library and a multi‐threading environment based on the SUN Microsystems Multi‐Threads (MT) library. We also develop a time‐based parallel version of algorithm DOT for the case of minimum time paths in FIFO networks, and a theoretical parallelization of algorithm DOT on an ‘ideal’ theoretical parallel machine. Performances of the implementations are analyzed and evaluated using large transportation networks, and two types of parallel computing platforms: a distributed network of Unix workstations and a SUN shared‐memory machine containing eight processors. Satisfactory speed‐ups in the running time of sequential algorithms are achieved, in particular for shared‐memory machines. Numerical results indicate that shared‐memory computers constitute the most appropriate type of parallel computing platforms for the computation of dynamic shortest paths for real‐time ITS applications.  相似文献   

17.
分子动力学模拟是对微观分子原子体系在时间与空间上的运动模拟,是从微观本质上认识体系宏观性质的有力方法.针对如何提升分子动力学并行模拟性能的问题,本文以著名软件GROMACS为例,分析其在分子动力学模拟并行计算方面的实现策略,结合分子动力学模拟关键原理与测试实例,提出MPI+OpenMP并行环境下计算性能的优化策略,为并行计算环境下实现分子动力学模拟的最优化计算性能提供理论和实践参考.对GPU异构并行环境下如何进行MPI、OpenMP、GPU搭配选择以达到性能最优,本文亦给出了一定的理论和实例参考.  相似文献   

18.
新一代数值预报模式GRAPES的并行计算方案设计与实现   总被引:3,自引:0,他引:3  
GRAPES (global and regional assimilation and prediction system)是由中国气象科学研究院灾害天气国家重点实验室自主研究开发的中国新一代数值天气预报系统,其目标是科研?业务通用.为了实现这一目标,结合高性能计算机的体系结构设计并实现模式的并行计算是必不可少的.作为核心开发技术之一,GRAPES系统设计并实现了模式的并行计算方案,包括中尺度有限区模式的并行计算和全球模式并行计算. GRAPES模式并行计算版本在IBM-Cluster1600上的测试表明,GRAPES模式的并行计算程序正确、稳定、有效,为其业务化之路奠定了基础,同时也为系统未来的可持续开发、优化创造了条件.  相似文献   

19.
Message Passing (MP) and Distributed Shared Memory (DSM) are the two most common approaches to distributed parallel computing. MP is difficult to use, whereas DSM is not scalable. Performance scalability and ease of programming can be achieved at the same time by using navigational programming (NavP). This approach combines the advantages of MP and DSM, and it balances convenience and flexibility. Similar to MP, NavP suggests to its programmers the principle of pivot-computes and hence is efficient and scalable. Like DSM, NavP supports incremental parallelization and shared variable programming and is therefore easy to use. The implementation and performance analysis of real-world algorithms, namely parallel Jacobi iteration and parallel Cholesky factorization, presented in this paper supports the claim that the NavP approach is better suited for general-purpose parallel distributed programming than either MP or DSM.  相似文献   

20.
采用计算流体力学方法,对高超声速流场进行了多区并行计算研究。基于MPI消息传递库采用Fortran语言编制了CFD并行计算程序,对NS方程采用AUSMPW+格式和LU-SGS方法求解。针对流场采用多区剖分,将每一个子区分配给相应节点进行计算。每一迭代步,相邻子区域间交换边界数据。计算表明,本文所建立的程序和方法是可行的,能够进一步延伸到大规模并行计算和工程应用中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号