排序方式: 共有33条查询结果,搜索用时 46 毫秒
1.
并行计算环境与数值并行算法研究 总被引:3,自引:0,他引:3
孙家昶 《小型微型计算机系统》1995,16(2):35-39
本文介绍并行计算环境的一些最新进展,探讨我国当前数值并行算法研究的技术路线,特别强调高水平的基础研究与解决科学工程计算中重大挑战问题的结合。 相似文献
2.
网络并行虚拟平台PVM 3 总被引:2,自引:0,他引:2
网络机群系统是并行系统与应用的一个重要发展方向。它具有高性能价格比、灵活性强以及可扩展性等优点,适合我国国情。异构网络并行虚拟平台PVM(ParallelVirturalMachine)是国际上近年推出的软件系统,已被众多计算机公司所接受为公共标准化的并行软件平台。一批高水平的串行软件正在逐步移植到PVM平台上。本文主要取材于PVM3.0的使用说明,同时也参考了有关的材料,较详细介绍PVM3的功能以及使用。 相似文献
3.
当今世界的主流超级计算机越来越多地使用带有加速器的异构系统.随着加速器的浮点性能不断提高,超级计算机内计算节点的CPU、内存、总线、网络以及系统架构都要与之相适应.HPL(High Performance Linpack)是高性能计算机评测的传统基准测试程序,复杂异构系统给HPL评测带来很多机遇与挑战.针对带有GPU的异构超级计算机系统,提出一套新的CPU与加速器计算任务分配方式,提出平衡点理论指导HPL性能优化.为了优化HPL程序,提出了使用CPU与加速器协同工作的look-ahead算法和行交换连续流水算法,实现了加速器、CPU、网络等部件的高度并行.此外,为带有加速器的系统设计了新的panel分解和行交换的实现方法,提高加速器的利用率.在每个节点带有4个GPU的系统上,单节点HPL效率达到79.51%,14884节点效率达到62.22%. 相似文献
4.
HPCG基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行HPCG软件具有非常重要的意义,其不仅可以提升国产超级计算机HPCG的排名,还对很多应用提供了并行算法、优化技术等方面的参考.本文面向某国产复杂异构超级计算机开展研究,首先采用了分块图着色算法对HPCG进行并行,并提出一种适用于结构化网格的图着色算法,该算法并行性能高于传统的JPL、CC等算法,且着色质量高,运用于HPCG后,迭代次数减少了3次,整体性能提升了6%.本文还分析了复杂异构系统各个部件传输的开销,提出一套更适用于HPCG的任务划分方法,并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.另外在多进程计算时,还采用了内外区划分算法将核心函数SpMV、SymGS中的邻居通信操作进行了隐藏.最终整机测试时,性能达到国产超级计算机峰值性能的1.67%,相比单节点,整机弱可扩展性并行效率达到了92%. 相似文献
5.
6.
HPCG基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大规模稀疏线性系统的能力,更贴近实际应用,近年来广受关注.基于国产超级计算机研究异构众核并行HPCG软件具有非常重要的意义,其不仅可以提升国产超级计算机HPCG的排名,还对很多应用提供了并行算法、优化技术等方面的参考.面向某国产复杂异构超级计算机开展研究,首先采用了分块图着色算法对HPCG进行并行,并提出一种适用于结构化网格的图着色算法.该算法并行性能高于传统的JPL、CC等算法,且着色质量高,运用于HPCG后,迭代次数减少了3次,整体性能提升了6%.分析了复杂异构系统各个部件传输的开销,提出一套更适用于HPCG的任务划分方法,并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.在多进程计算时,还采用内外区划分算法将核心函数SpMV、SymGS中的邻居通信操作进行了隐藏.最终整机测试时,性能达到了国产超级计算机峰值性能的1.67%,与单节点相比,整机弱可扩展性并行效率达到了92%. 相似文献
7.
本文应用B网分裂加密的思想,讨论在计算机上快速实现二元三方向网格上三角域样条曲面的显示。该算法具有快速、稳定和高效率等优点,可用于相应的曲面设计与曲面求交。 相似文献
8.
孙家昶 《数值计算与计算机应用》1987,(4)
设在单连通区域口中给定一个贯穿剖分,通过内点A有m条不同斜率的贯穿线,如果穿过这些贯穿线二元样条具有相同的光滑度,我们就称为二元样条在这些方向是“各向同性”的。反之,称为“各向异性”的,或者称为分割是各向具有不同“重网线”的。后者是一元样条“重节点”概念在多元的推广。 相似文献
9.
本文作者在对“大规模科学计算研究”二号机群-深腾1800(国家重点基础研究发展 规划项目(973))进行并行数值实验时发现了一个奇特的现象: NPB2.4(NAS Parallel Benchmarks)中的LU程序在深腾1800的Myrinet 2000上的实际性能比同样计算节点 上的百兆以太网还要低.针对这一特殊现象,本文做了深入的研究,并进行了详细的分析.由 此得到了在机群网络Myrinet 2000上进行并行数值研究所需要注意的一些问题并提出了相 应的解决方案. 相似文献
10.
本文研究平行六边形区域上的非均匀节点离散傅立叶变换的快速算法及其实现.首先在晶格(Lattice)的框架下建立了平行六边形区域上的非均匀节点离散傅立叶变换(NDFTH).在此基础上设计了平行六边形区域上的非均匀节点快速傅立叶变换(NFFTH)算法.其核心思想是以局部性态良好的窗口函数为基底,以平行六边形区域上均匀节点快速傅立叶变换(FFTH)为时空域和频域转换工具,通过在时空域和频域上截取其展开级数的少量几项来陕速近似计算,最终降低其计算复杂度.数值计算结果表明,本文算法是合理、稳定、高效的. 相似文献