首页 | 本学科首页   官方微博 | 高级检索  
     

基于GPU的稀疏矩阵向量乘优化
引用本文:白洪涛,欧阳丹彤,李熙铭,李亭,何丽莉.基于GPU的稀疏矩阵向量乘优化[J].计算机科学,2010,37(8):168-171.
作者姓名:白洪涛  欧阳丹彤  李熙铭  李亭  何丽莉
作者单位:1. 吉林大学计算机科学与技术学院,长春,130012
2. 吉林大学符号计算与知识工程教育部重点实验室,长春,130012
基金项目:国家自然科学基金重大项目基金,国家自然科学基金,吉林省科技发展计划项目基金,欧盟合作项目 
摘    要:针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法.这些优化方法包括:(1)利用Warp内线程天然同步特性,Half-warp完成结果向量一个元素的计算;(2)取整读取数据,实现合并访问;(3)输入向量放入纹理存储器,数据复用;(4)申请分页锁定内存,加速数据传输;(5)使用共享存储器,加速数据存取.实验分析表明,提出的各种手段起到了优化的作用.与已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法获得了更高的存储器带宽和浮点运算吞吐量;整体性能比CPU串行执行版本快了3倍以上.

关 键 词:稀疏矩阵  行压缩存储  图形处理器  统一计算架构  优化策略
收稿时间:2009/9/29 0:00:00
修稿时间:2010/1/29 0:00:00

Optimizing Sparse Matrix-vector Multiplication Based on GPU
BAI Hong-tao,OUYANG Dan-tong,LI Xi-ming,LI Ting,HE Li-li.Optimizing Sparse Matrix-vector Multiplication Based on GPU[J].Computer Science,2010,37(8):168-171.
Authors:BAI Hong-tao  OUYANG Dan-tong  LI Xi-ming  LI Ting  HE Li-li
Affiliation:(College of Computer Science and Technology, Jilin University, Changchun 130012, China);(Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun 130012,China)
Abstract:
Keywords:Sparse matrix  Compressed sparse row  Graphics processing unit  Compute unified device architecture  Optimizations
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号