首页 | 本学科首页   官方微博 | 高级检索  
     

FMM算法中PP问题在GPU上的研究与实现
引用本文:李正杰,徐炜民,柴亚辉,郑衍衡. FMM算法中PP问题在GPU上的研究与实现[J]. 计算机工程与设计, 2011, 32(9): 3050-3053,3169
作者姓名:李正杰  徐炜民  柴亚辉  郑衍衡
作者单位:上海大学计算机工程与科学学院,上海,200072
基金项目:上海市重点学科建设基金项目
摘    要:针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计算设备架构平台的实现方法。采取以Box为并行单位、在内存中开辟缓冲区与多线程流水计算等方式,使其适合于CPU和GPU组成的异构体系结构,充分利用CUDA编程模型的高并行性加速PP问题。实验结果表明,采用CUDA加速后,PP问题的计算时间明显降低,提高了整个FMM模拟效率,适合于各种多体问题的实时模拟。

关 键 词:图形处理器  异构体系结构  统一计算架构  快速多极子算法  PP问题

Research and implementation of PP problem of FMM algorithm on GPU
LI Zheng-jie,XU Wei-min,CHAI Ya-hui,ZHENG Yan-heng. Research and implementation of PP problem of FMM algorithm on GPU[J]. Computer Engineering and Design, 2011, 32(9): 3050-3053,3169
Authors:LI Zheng-jie  XU Wei-min  CHAI Ya-hui  ZHENG Yan-heng
Affiliation:(School of Computer Engineering and Science,Shanghai University,Shanghai 200072,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号