首页 | 本学科首页   官方微博 | 高级检索  
     

基于FMM-PM方法的宇宙N体模拟在GPU上的实现和优化
引用本文:扶月月,王武,王乔. 基于FMM-PM方法的宇宙N体模拟在GPU上的实现和优化[J]. 数据与计算发展前沿, 2020, 2(2): 155-164
作者姓名:扶月月  王武  王乔
作者单位:中国科学院计算机网络信息中心,北京 100190;中国科学院大学,北京 100049;中国科学院计算机网络信息中心,北京 100190;中国科学院大学,北京 100049;中国科学院国家天文台,北京 100101
基金项目:国家重点研发计划;中国科学院信息化专项;中国科学院战略性先导科技专项
摘    要:【目的】本文在多GPU平台上,对基于快速多极子方法(FMM)和粒子网格方法(PM)的天文N体模拟软件PHoToNs的核心函数进行CUDA加速实现和性能优化。【方法】主要优化方法包括算法的参数优化、页锁定内存和CUDA流优化、混合精度和快速数学库优化等。【结果】优化后的短程力相互作用核心函数在Titan V的GPU平台上采用4张GPU卡的计算速度相对采用4个Intel Xeon CPU核提高了约410倍。【结论】本文的优化技术可为其它高性能GPU异构平台上的进一步算法研究和超大规模天文N体模拟提供支撑。

关 键 词:N体模拟  快速多极子方法  GPU  优化

The Implementation and Optimization of Cosmological N-Body Simulation by FMM-PM Method on GPUs
Fu Yueyue,Wang Wu,Wang Qiao. The Implementation and Optimization of Cosmological N-Body Simulation by FMM-PM Method on GPUs[J]. Frontiers of Data&Computing, 2020, 2(2): 155-164
Authors:Fu Yueyue  Wang Wu  Wang Qiao
Affiliation:(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100190,China;University of Chinese Academy of Sciences,Beijing 100049,China;National Astronomical Observatories,Chinese Academy of Sciences,Beijing 100012,China)
Abstract:[Objective]In this paper,the kernel functions of PhoToNs,which is an astronomical N-body simulation software based on the fast multipole method(FMM)and particle grid method(PM),are accelerated and optimized for CUDA on a multi-GPU platform.[Methods]The main optimization methods adopted in CUDA kernels include:algorithm parameter optimization,use of page-locked memory and CUDA streams,and use of mixed precision and fast math library.[Results]The kernel function of short range force interaction is deeply optimized,which achieves a speedup of about 410 times faster on four Titan V GPUs than the pure MPI code running on four Intel Xeon CPU cores.[Conclusions]Optimization methods in this paper can support further algorithm research and hyperscale N-body simulation on other high performance GPU-based heterogeneous platforms.
Keywords:N-Body simulation  fast multipole method  GPU  optimization
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号