首页 | 本学科首页   官方微博 | 高级检索  
     

基于CUDA的高速FFT计算*
引用本文:赵丽丽,张盛兵,张萌,姚涛. 基于CUDA的高速FFT计算*[J]. 计算机应用研究, 2011, 28(4): 1556-1559. DOI: 10.3969/j.issn.1001-3695.2011.04.100
作者姓名:赵丽丽  张盛兵  张萌  姚涛
作者单位:西北工业大学,计算机学院,西安,710072
基金项目:国家高科技发展规划项目(“863”计划)
摘    要:针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明该算法的高效性,优化后的FFT加速比能达到CUFFT库加速比的2-6倍。

关 键 词:图形处理器;通用并行计算架构;映射策略;存储层次
收稿时间:2010-09-17
修稿时间:2010-11-08

High performance FFT computation based on CUDA
ZHAO Li-li,ZHANG Sheng-bing,ZHANG Meng,YAO Tao. High performance FFT computation based on CUDA[J]. Application Research of Computers, 2011, 28(4): 1556-1559. DOI: 10.3969/j.issn.1001-3695.2011.04.100
Authors:ZHAO Li-li  ZHANG Sheng-bing  ZHANG Meng  YAO Tao
Abstract:The Fourier transform is essential for many image processing and scientific computing techniques. An implementation to accelerate FFT computation based on CUDA is presented in this paper. Based on the analysis of the GPU architecture and algorithm parallelism feature, a mapping strategy used multithread is brought, and the optimization in memory hierarchy is explored. The results on CUDA shows an improvement, the average speedup reaches 2-6X compared with CUFFT supplied by NVIDIA library.
Keywords:GPU   CUDA   Mapping strategy   Memory Hierarchy
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号