共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
为了提高声场模型的计算效率以满足当前水声研究对声场计算速度的要求,针对对称多处理器集群系统多节点并且节点内存在多个处理器的特点,利用共享存储模型OpenMP和消息传递编程模型MPI(Message Passing Inter-face)对声学计算模型RAM(Range-dependent Acoustic Model)进行并行编程,构建了并行计算平台,实现了RAM模型在对称多处理器集群系统上节点间和节点内两级并行,并通过实验对该平台的性能进行了测试。实验结果表明,RAM模型适用于并行计算,该并行计算方法具有很高的并行效率,可以大幅度提高声场计算速度。 相似文献
3.
根据国产申威异构众核分布式存储计算机的体系结构特点,提出了一种结构瞬态有限元分层并行计算方法,对于提高国产申威异构众核分布式存储并行计算机下大型、超大型复杂结构系统的瞬态并行求解效率具有重要意义。该方法在分层通信和Newmark-HHT算法的基础上构建了大规模复杂结构系统的瞬态并行求解体系,不仅实现了计算过程中大量数据的分布式存储,显著改善了数据的内存访存效率;而且实现了计算过程的两层并行,有效改善了通信效率。因此,该计算方法能够充分利用国产申威异构众核分布式存储并行计算机的体系结构特点提升结构瞬态大规模并行计算效率。最后通过典型数值算例验证了该方法的正确性和有效性,并将其应用于某高层建筑,实现其上千万自由度、数万核的结构瞬态并行计算。 相似文献
4.
曙光一号共享存储并行计算机陈鸿安,刘金水,李国杰(国家智能计算机研究开发中心北京100080)由国家智能计算机研究开发中心研制成功的曙光一号共享存储多处理机系统是一个支持大规模事务处理、数据处理和科学计算应用开发的通用并行计算平台。系统设计的主要目标... 相似文献
5.
本文介绍有限元分析的并行环境及在不同半行环境下的有限元并行分析研究现状,其中包括作者基于网络半行机群环境所作的一些研究工作,分析了该领域的未来发展,指出网络并行机群环境下的有限元并行分析是今后计算力学发展的重要趋势之一。 相似文献
6.
介绍了基于并行计算机的声呐信号处理系统的实现,分别给出了声呐信号处理在分布式共享内存的机群式并行计算机上的功能级和算法级的并行策略。该实现方法在软件和硬件两方面都具有很强的通用性和可扩展性。 相似文献
7.
ICT图像重建时间长一直是困扰ICT系统的棘手问题。随着计算机软硬件成本的降低 ,越来越多的ICT系统开始采用并行处理技术提高图像重建速度。在ICT图像重建中一般采用的并行系统有阵列处理机、基于多个PC机的MIMD系统、由多个DSP和反投影专用处理器组成的多处理器系统和工作站机群 相似文献
8.
9.
基于稀疏存储技术和传统并行模态综合法提出了一种有限元结构模态分析多级分层并行计算方法。该方法在两级分区4次变换策略的基础上不仅实现了大量数据的分布式稀疏存储,提高了数据的内存访问效率,而且实现了系统整体缩减后的广义特征方程规模的有效降低,大幅度减少了广义特征方程的求解时间。此外,它还利用计算任务和异构众核集群硬件体系结构映射实现了计算过程的多级并行,不仅有效改善了不同层级的负载均衡,而且通过通信分离有效提高了通信效率。因此,它能够充分利用异构众核分布式存储并行计算机的体系结构特点提升大规模有限元模态并行计算效率。数值算例表明,相比于传统的并行模态综合法,稀疏存储格式模态多级分层并行方法能够大幅度节省内存空间和提高计算效率。 相似文献
10.
11.
曙光─号并行计算机的系统软件与特点樊建平,李国杰(国家智能计算机研究开发中心北京100080)曙光一号共享存储多处理器系统提供一个通用的并行计算平台,以支持人工智能应用、科学计算以及一般信息处理系统的开发。系统设计的主要目标一方面是如何攻克全对称多处... 相似文献
12.
多块结构化网格CFD并行计算和负载平衡研究 总被引:2,自引:0,他引:2
基于连续拼接多块结构化网格,通过求解雷诺平均Navier-Stokes方程研究并行计算中的负载平衡问题。利用组合优化中的排序理论设计负载平衡算法,实现了网格数据的自动划分和各处理机上计算任务的自动分配。在工作站集群MPI并行环境下,通过实例考察了负载平衡算法和并行计算的性能,16个处理机上的负载均方差和负载相对均方差分别为0.0084和0.1347%,并行计算结果和实验数据吻合良好,并行效率高。本文算法具有良好的可扩展性,适用于MIMD结构计算机上基于多块结构化网格并行计算中的负载平衡问题。 相似文献
13.
目前有限元分析软件多基于中央处理器的平台方式构建,在处理复杂高层结构非线性响应分析时暴露出计算耗时多、计算效率低以及对计算硬件要求高等问题。图形处理器由于其硬件构造的先天优势,可以提供十倍乃至上百倍于中央处理器的浮点运算和并行计算性能,因而为高层结构非线性计算所面临的瓶颈问题提供了一个切实可行的解决方法。该文在构建异构并行计算平台的基础上,提出一种适用于图形处理器加速的有限元并行数值计算方法。该方法利用精细化结构分析模型的自由度数据和图形处理器中的线程建立一一对应映射关系,对动力响应的隐式积分算法进行图形处理器线程级的并行化处理,并且结合EBE单元级的优化存储空间机制,降低系统方程组求解时对内存空间的需求。通过对比振动台试验结果对该方法进行验证,并对实际高层钢筋混凝土框筒结构工程进行弹塑性地震响应分析,结果显示该文所提方法在保证模型精度前提下能有效提高大型复杂高层结构非线性响应分析效率。 相似文献
14.
15.
16.
GPU具有优秀的浮点计算性能以及很高的存储带宽,是组建异构机群的首选加速处理器。在分析异构高性能机群典型体系结构的基础上,详细描述如何搭建CPU/GPU异构并行计算环境,并提出相应的程序设计框架。以国际上公认的并行程序测试集NPB为例,验证所提出的程序设计框架的有效性。 相似文献
17.
接触问题的MPI+OpenMP混合并行计算 总被引:1,自引:0,他引:1
针对接触计算问题中需要大量全局通信的特点,结合当前流行的多处理器集群系统,采用了MPI+OpenMP的混合并行模式,实现了接触问题的并行计算。以双重区域剖分并行算法为基础,内力计算部分在采用MPI并行基础上,使用基于分块结构的OpenMP并行编程,使得接触力并行计算中涉及的全局通信时间无需增加,从而进一步提高了并行效率。数值模拟实验表明,这种并行方式能在上百处理器上实现千万自由度接触问题的并行计算。 相似文献
18.
19.
为了寻找一种映射系统流形计算的快速算法,提出了一种计算映射动力系统双曲不动点一维流形的并行快速算法。该算法首先以区域迭代的方法为基础,对局部流形进行分割,然后运用了曲率约束和距离控制条件进行插值运算,在单个区间上独立计算映射值,独立检查精度,真正实现计算的并行化控制流形的增长;其次从理论上证明了流形并行计算的可能性,并给出了并行计算的实现方法;最后的实验数据和仿真结果表明:该方法既保证了计算的速度又提高了计算的精度。 相似文献
20.
对Jacobi-Davidson(J-D)算法进行了改进和并行计算研究。通过添加谱变换、收缩和重启动等策略将J-D算法改造成了适应大规模模态分析的算法。利用改进后的算法和各种数值求解软件包,建立了一套基于PANDA框架的模态分析并行求解体系。基于该求解体系和并行机群,开展了某工程结构大规模模态分析并行可扩展性研究,测试规模从数十万自由度一直达到千万自由度,并行CPU核数达到128个;研究了改进后的J-D算法内层迭代步数、重启动向量个数等控制参数对外层迭代收敛速度的影响;获取了不同规模并行计算的加速比。研究结果表明,改进后的J-D算法完全适应千万自由度规模以上的模态分析,内存占用与规模之间呈线性增长趋势,在1 025万自由度规模模态分析仅占用39.4 GB内存;同时该算法具有优异的并行可扩展性,在128个CPU测试核内接近线性加速,并且测试规模越大,曲线越接近理想加速曲线,1 025万自由度规模在128核的并行效率达到88.1 %。 相似文献