首页 | 本学科首页   官方微博 | 高级检索  
     

基于GPU平台的联合迭代重构算法加速
引用本文:张广勇,卢晓伟,沈铂,张凯,储琪,赵开勇. 基于GPU平台的联合迭代重构算法加速[J]. 计算机科学, 2012, 39(5): 310-313
作者姓名:张广勇  卢晓伟  沈铂  张凯  储琪  赵开勇
作者单位:1. 浪潮集团高效能服务器和存储技术国家重点实验室 济南250101
2. 中国科学院生物物理研究所生物大分子国家重点实验室 北京100101
3. 中国科学院计算技术研究所前瞻研究实验室 北京100190
4. 浪潮集团高效能服务器和存储技术国家重点实验室 济南250101;香港浸会大学计算机科学系 香港
摘    要:电子断层三维重构技术(Electron Tomography,ET)是在纳米尺度下研究不具有全同性的细胞或大分子三维结构的重要方法。迭代重构法是ET中重构效果最好的方法,但是其性能较差,重构大尺寸图像时需要数天的时间甚至更长,使其应用受到限制。迭代重构法中经典的方法是代数重构法(Algebraic Reconstruction Technique,ART)和联合迭代重构法(Simultaneous Iterative Reconstruction Technique,SIRT),SIRT算法总是收敛的并且比ART重构的效果更好。利用CUDA语言设计和实现了基于Tesla C1060GPU平台上的并行SIRT重构算法,并利用存储器合并访问、常量存储器、共享存储器等优化技术对并行算法进行优化,优化后的SIRT并行算法在Tesla C1060GPU平台上的最大加速比是Intel i7 920CPU上的串行算法的47倍,并且重构的质量没有任何下降。

关 键 词:电子断层三维重构  联合迭代重构法  并行计算  GPU  CUDA  ATOM

Design and Optimization of Simultaneous Iterative Reconstruction Technique Based on GPU Platform
ZHANG Guang-yong , LU Xiao-wei , SHEN Bo , ZHANG Kai , CHU Qi , ZHAO Kai-yong. Design and Optimization of Simultaneous Iterative Reconstruction Technique Based on GPU Platform[J]. Computer Science, 2012, 39(5): 310-313
Authors:ZHANG Guang-yong    LU Xiao-wei    SHEN Bo    ZHANG Kai    CHU Qi    ZHAO Kai-yong
Affiliation:1,4(National Key Laboratory for High-efficient Server and Storage Technology,Inspur,Jinan 250101,China)1(National Laboratory of Biomacromolecules,Institute of Biophysics,Chinese Academy of Sciences,Beijing 100101,China)2(Advanced Computer Research Center,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190,China)3(Department of Computer Science,Hong Kong Baptist University,Hong Kong,China)4
Abstract:Electron tomography (ET) is widely used in reconstructing non-uniform cells or macromolecules in nanoscale. One of the best methods of ET is iterative reconstruction due to its outstanding quality of reconstruction, but it islimited by its huge computational requirements. A parallel simultaneous iterative reconstruction technique(SIRT) wasdesigned and implemented based on UPU platform with Tesla 01060 using CUDA programming languages. Experimen-tal results demonstrate the performance of optimized parallel SIRI} algorithm. I}he maximum speedup of the parall c1SIRT is 47 times of secauential SIRT approach, and it is not any loss of accuracy.
Keywords:Electron tomography   SIRT   Parallel computing   UPU   CUlDA  ATOM
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号