首页 | 本学科首页   官方微博 | 高级检索  
     

基于HYB格式稀疏矩阵与向量乘在CPU+GPU异构系统中的实现与优化
引用本文:阳王东,李肯立.基于HYB格式稀疏矩阵与向量乘在CPU+GPU异构系统中的实现与优化[J].计算机工程与科学,2016,38(2):202-209.
作者姓名:阳王东  李肯立
作者单位:;1.湖南城市学院信息科学与工程学院;2.湖南大学信息科学与工程学院
基金项目:国家自然科学基金重点项目(61432005);国家自然科学基金(61472124,61572175);湖南省科技计划项目(2015SK200062)
摘    要:稀疏矩阵与向量相乘SpMV是求解稀疏线性系统中的一个重要问题,但是由于非零元素的稀疏性,计算密度较低,造成计算效率不高。针对稀疏矩阵存在的一些不规则性,利用混合存储格式来进行SpMV计算,能够提高对稀疏矩阵的压缩效率,并扩大其适应范围。HYB是一种广泛使用的混合压缩格式,其性能较为稳定。而随着GPU并行计算得到普遍应用以及CPU日趋多核化,因此利用GPU和多核CPU构建异构并行计算系统得到了普遍的认可。针对稀疏矩阵的HYB存储格式中的ELL和COO存储特征,把两部分数据分别分割到CPU和GPU进行协同并行计算,既能充分利用CPU和GPU的计算资源,又能够发挥CPU和GPU的计算特性,从而提高了计算资源的利用效能。在分析CPU+GPU异构计算模式的特征的基础上,对混合格式的数据分割和共享方面进行优化,能够较好地发挥在异构计算环境的优势,提高计算性能。

关 键 词:GPU  稀疏矩阵  SpMV  CUDA  异构计算
收稿时间:2015-04-10
修稿时间:2016-02-25

Implementation and optimization of HYB based SpMV on CPU+GPU heterogeneous computing systems
YANG Wang dong,LI Ken li.Implementation and optimization of HYB based SpMV on CPU+GPU heterogeneous computing systems[J].Computer Engineering & Science,2016,38(2):202-209.
Authors:YANG Wang dong  LI Ken li
Affiliation:(1.School of Information Science and Engineering,Hunan City University,Yiyang 413000; 2.College of Information Science and Engineering,Hunan University,Changsha 410008,China)
Abstract:Sparse matrix vector multiplication (SpMV) is an important issue in solving sparse linear systems. The sparse features and the low computing density lead to low computation efficiency. Regarding the irregularities of the sparse matrixes, some hybrid storage formats are used to compute SpMV to improve the compression efficiency and expand the range of adaptation. HYB is a hybrid compression format of ELL and COO formats, and is widely used on SpMV because of its stable performance. With the common application of parallel computing on GPUs and multi core CPUs, the heterogeneous computing system based on CPU+GPU is accepted. The ELL of HYB is assigned to the GPU for processing and the COO of HYB is assigned to the CPU, which can take full advantages of both CPU and GPU computing resources to improve the utilization efficiency of computing resources. In this paper, based on the analysis of the characteristics of the CPU + GPU heterogeneous computing model, we propose some optimization strategies to improve the performance of SpMV in the heterogeneous computing environment.
Keywords:GPU  sparse matrix  SpMV  CUDA  heterogeneous computing  
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号