共查询到20条相似文献,搜索用时 15 毫秒
1.
格子玻尔兹曼方法(lattice Boltzmann method, LBM)是一种基于分子运动理论计算流体力学(computational fluid dynamics, CFD)的方法, 提高LBM的并行计算能力是高性能计算领域的一项重要的研究内容. 本文基于SW26010Pro处理器, 通过区域分解、数据重构、双缓冲、向量化等优化方法, 实现了LBM的多级并行. 基于以上优化方案, 测试了5 600万网格规模, 实现结果显示, 相比于MPI进行级并行, 碰撞过程的平均加速倍数达到61.737、迁移过程的平均加速倍数达到17.3, 同时对方腔流案例做了强扩展测试, 网格规模为1200×1200×1200, 以6.2万计算核心为基准, 百万核心的并行效率超过60.5%. 相似文献
2.
3.
4.
上海超级计算中心(以下简称中心)是2000年上海市“一号工程”——上海信息港主体工程项目之一,由上海市政府投资建设,坐落于浦东张江高科技园区内。中心投入运行两年多来,在上海市政府和上海市信息办的领导与支持下,已在气象预报、生物医药、基因研究、汽车设计、新材料研究等高性能计算领域取得可喜的应用成果。展望未来,中心的工作任重道远,及时明确功能定位,提出奋斗目标,具有重要意义。 相似文献
5.
神威太湖之光是最新一期Top500榜单上排名第一的超级计算机,峰值性能为125.4 PFlops,其计算能力主要归功于国产SW26010众核处理器。OpenFOAM(Open Source Field Operation and Manipulation)是计算流体力学领域使用最广泛的开源软件包,但是由于其基于C++实现,与神威太湖之光上的异构众核处理器SW26010的编译器不兼容,因此无法直接在该架构上有效运行。基于SW26010的主核/从核的体系架构移植了OpenFOAM的核心计算代码,并采用混合语言编程实现的方式来解决编译不兼容的问题。此外,通过寄存器通信、向量化和双缓冲等优化手段,单核组的性能较优化后的主核代码提高了8.03倍,较Intel(R) Xeon(R) CPU E5-2695 v3的串行执行性能提高了1.18倍。同时,将单核组的实现扩展到了神威太湖之光的大规模集群上,并进行了强可扩展性测试,256个核组上实现了184.9倍的加速。采用的移植方式和优化手段也可以为其他复杂C++程序在神威太湖之光上的应用提供借鉴。 相似文献
6.
7.
8.
9.
SSD固态硬盘,由于其低功耗、无噪音、高性能等优势一直被业界看好,如何在高性能计算中更好地利用这种高效低耗的设备,是一个值得探讨的话题。本文介绍了SSD的概念,分析了SSD的优缺点,结合神威高性能计算机,研究了它的存储特性,并通过实验,对怎样将SSD引入到神威机中这一问题,提出了解决方案。 相似文献
10.
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低。为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术。并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序。实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率。 相似文献
11.
随着深度学习的快速发展,其规模越来越大,需要的计算越来越复杂。分布式扩展技术可以有效提高大规模数据的处理能力。基于神威太湖之光超算平台对深度学习框架Caffe进行分布式扩展研究,对比同步方式下参数服务器分布式扩展方法和去中心化的分布式扩展方法。实验表明,同步方式下,去中心化的分布式扩展方法相比参数服务器分布式扩展方法在通信效率方面具有明显的优势,对特定的模型通信性能提高可达98倍。 相似文献
12.
并行油藏模拟软件的实现及在国产高性能计算机上的应用 总被引:5,自引:0,他引:5
主要介绍了百万网格点规模的精细油藏数值模拟在国产高性能并行计算机与微机机群系统上的应用情况 .针对若干组来自于国内油田的百万网格点实际数据 ,给出了在多种国产并行机环境下的运行结果 ,并作了分析与评价 .在此基础上 ,讨论并行油藏数值模拟软件高效实现过程中遇到的关键技术 ,探讨大型软件并行化过程中经常遇到的瓶颈问题及改进方案 相似文献
13.
14.
基于曙光并行机的超大规模非线性方程组并行算法研究 总被引:8,自引:0,他引:8
该文讨论了一类求解大规模非线性方程组算法的并行性能及其在曙光并行机上的实现过程,与传统的算法不同之处是用一个块对角矩阵作为迭代矩阵,且该矩阵可由一个仅包含向量内积和矩阵与向量乘积的递推关系简便计算得到,在对算法进行描述之后,分析了算法的并行加速比和存储需求,讨论了算法在基于消息传递的MPI并行环境下的实现流程,数值计算表明理论分析与数值结果相比,算法在分布式并行环境下具有有较好的并行主攻较低的存储要求,可适用于大规模科学与工程的高性能计算。 相似文献
15.
为什么要搞高性能计算机?意义何在?归根结底,高性能计算机是真正的先进生产力。老讲科技是第一生产力,其实高性能计算机就是最典型的第一生产力。高性能计算机的发展动力和发展趋势,以及我国在此领域与国外的差距,面临的挑战,主要在于应用。中国科学院计算所最近跟东方石油公司有过一些接触,该公司目前勘探的石油占全世界石油市场的25%,他们依靠的就是 相似文献
16.
17.
海洋模式作为地球数值模拟中重要的组成模块,在很多领域都起到了至关重要的作用,不仅是研究海洋、河口和海岸不可或缺的科研手段,基于海洋模式搭建的预报系统还能够实时预测台风、海啸等现象.为了模拟更细粒度的海洋变化,海洋模式朝着更高的分辨率和更多的物理参数化方案发展,一般的计算机已无法满足其需求.随着散热和功耗成为通用处理器的主要瓶颈,多核、众核以及由此导致的异构已成为下一代超级计算机的发展趋势,这也为发展高分辨率海洋模式提供了坚实的基础平台.基于国产超级计算机“神威·太湖之光”,利用其异构众核体系结构的优势对普林斯顿海洋模式(Princeton ocean model, POM)进行移植和优化,从而充分发挥了国产异构众核平台的特点和优势.基于神威的高分辨率海洋模式swPOM(Sunway Princeton ocean model)在主从核协作下运行效率达到纯主核的13倍,是通用Intel平台的2.8倍左右,可扩展到25万核上运行,为实时预报系统提供了保障. 相似文献
18.
在10月28日公布的2010年“中国高性能计算机性能TOP100”中,2010年当年投产的高性能计算系统数量为近5年最少;直接引用全球高性能计算TDP500参数的数量则为近5年最多。这样的数据,将会给这份报告的参考意义大打折扣。 相似文献
19.
20.
本文提出了一种气象可视化软件原型系统(MVS)的设计与实现方案,主要介绍了MVS系统结构、模块功能、主要数据结构以及系统实现,着重阐述了提高人机交互性能而采取 的重要措施,即改进的八叉树编码方法和多进程并行处理的思想。 相似文献