排序方式: 共有62条查询结果,搜索用时 15 毫秒
1.
球谐函数展开是一种广泛应用的数学方法.在研究Rokhlin-Tygert球谐函数展开快速算法(RT算法)的基础上,扩充并完善了RT算法,建立了所有阶连带Legendre多项式展开系数的计算过程,进而研究了该算法的MPI并行策略并给出了RT并行算法.数值实验表明,RT算法的计算量随三角截断波数的增大而急剧增长;MPI并行技术能够有效提高其运算速度,较好地提升算法的整体性能,但并行效率会受多核处理器cache大小和访存带宽的限制. 相似文献
2.
区域分解是并行计算的基本手段之一,在稀疏线性方程组迭代求解时,对不完全分解等串行计算时很有效的预条件,经常采用区域分解的思想进行并行化。但区域分解的本质是利用局部解来近似全局解,从而必然存在较大误差,为此,提出一种粗网格校正算法,通过非重叠子区域浓缩,每个非重叠子区域浓缩为一个超结点,形成一个含全局信息且阶数等于子区域个数的小线性方程组,之后用其对原并行预条件进行校正。对块Jacobi型、经典加性Schwarz、以及因子组合型并行不完全分解预条件的实验表明,粗网格校正能有效改善收敛性并提高求解效率。 相似文献
3.
细观数值模拟是混凝土性能研究的一种重要手段,但稀疏线性方程组求解在总体模拟时间中所占比重很大。由于属于三维问题,且规模很大,所以采用预条件Krylov子空间迭代是必由之路。Aztec是国际上专门设计用于求解稀疏线性方程组的软件包之一,由于目前混凝土细观数值模拟中的稀疏线性方程组对称正定,所以利用Aztec中提供的CG迭代法进行求解,并对多种能保持对称性的预条件选项进行了实验比较。结果表明,在基于区域分解的并行不完全Cholesky分解、无重叠对称化GS迭代、最小二乘等预条件技术中,第一种的效率最高,且在重叠度为0,填充层次为0时,效果最好;实验结果还表明,在本应用问题中,用RCM排序一般导致求解时间更长,从而没有必要采用。 相似文献
4.
5.
耦合器用以将不同气候模式连接成为复杂的耦合系统,是气候预测应用中的关键部件.本文以构件化的方式设计并实现了一个具有较强通用性和可扩展性的耦合器,并利用它将IAP4.0大气模式和LASG海洋模式集成为一个海气耦合系统.实验结果表明,该耦合器有效地实现了耦合功能,整个耦合系统具有较高的并行性能. 相似文献
6.
使用多核处理器已成为构建高性能计算机系统的主流方式。结合多核高性能计算机系统集共享内存结构和分布式内存结构于一体的体系结构特点,对AREM模式开展MPI/OpenMP混合并行计算研究与实现。性能测试结果表明,使用MPI/OpenMP混合并行计算可以将并行应用扩展至更大处理机规模,缩短计算时间,不对原程序结构做大的改动、以增量方式和较小的并行化代价,取得比较好的并行计算效果。 相似文献
7.
GRAPES是中国气象科学研究院研制的一个非静力格点模式,该模式以大气运动的全可压运动方程为基础,采用半隐半Lagrange方案。在模式积分中,每个时间步需要求解关于气压梯度力的三维离散Helmholtz方程,该方程组的求解在整个数值模拟时间中占70%左右,为加速求解过程,采用高效预条件技术是必然选择。将提出的多行双门槛不完全分解预条件与国内外常用的多种其他预条件技术进行了比较,同时,考查了针对不完全分解预条件的加性Schwarz与基于因子组合的两种并行化预条件技术,结果发现,多行双门槛不完全分解预条件优于包括ILUT在内的其他不完全分解预条件,且加性Schwarz略优于基于因子组合的并行预条件技术。 相似文献
8.
This paper presents an overview of TianHe-1A (TH-1A) supercomputer, which is built by National University of Defense Technology of China (NUDT). TH-1A adopts a hybrid architecture by integrating CPUs and GPUs, and its interconnect network is a proprietary high-speed communication network. The theoretical peak performance of TH-1A is 4700 TFlops, and its LINPACK test result is 2566 TFlops. It was ranked the No. 1 on the TOP500 List released in November, 2010. TH-1A is now deployed in National Supercomputer Center in Tianjin and provides high performance computing services. TH-1A has played an important role in many applications, such as oil exploration, weather forecast, bio-medical research. 相似文献
9.
为了提高非平衡进程到达(unbalanced process arrival,简称UPA)模式下MPI广播的性能,对UPA模式下的广播问题进行了理论分析,证明了在多核集群环境中通过节点内多个MPI进程的竞争可以有效减少UPA对MPI广播性能的影响,并在此基础上提出了一种新的优化方法,即竞争式流水化方法(competitive and pipelined method,简称CP).CP方法通过一种节点内进程竞争机制在广播过程中尽早启动节点间通信,经该方法优化的广播算法利用共享内存在节点内通信,利用由竞争机制产生的引导进程执行原算法在节点间通信.并且,该方法使节点间通信和节点内通信以流水方式重叠执行,能够有效利用集群系统各节点的多核优势,减少了MPI广播受UPA的影响,提高了性能.为了验证CP方法的有效性,基于此方法优化了3种典型的MPI广播算法,分别适用于不同消息长度的广播.在真实系统中,通过微基准测试和两个实际的应用程序对CP广播进行了性能评价,结果表明,该方法能够有效地提高传统广播算法在UPA模式下的性能.在应用程序的负载测试实验结果中,CP广播的性能较流水化广播的性能提高约16%,较MVAPICH21.2中广播的性能提高18%~24%. 相似文献
10.