基于GPU的稀疏矩阵向量乘优化 Optimizing Sparse Matrix-vector Multiplication Based on GPU期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于GPU的稀疏矩阵向量乘优化

引用本文：	白洪涛,欧阳丹彤,李熙铭,李亭,何丽莉.基于GPU的稀疏矩阵向量乘优化[J].计算机科学,2010,37(8):168-171.

作者姓名：	白洪涛欧阳丹彤李熙铭李亭何丽莉

作者单位：	1. 吉林大学计算机科学与技术学院,长春,130012 2. 吉林大学符号计算与知识工程教育部重点实验室,长春,130012

基金项目：	国家自然科学基金重大项目基金，国家自然科学基金，吉林省科技发展计划项目基金，欧盟合作项目

摘要：	针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法.这些优化方法包括:(1)利用Warp内线程天然同步特性,Half-warp完成结果向量一个元素的计算;(2)取整读取数据,实现合并访问;(3)输入向量放入纹理存储器,数据复用;(4)申请分页锁定内存,加速数据传输;(5)使用共享存储器,加速数据存取.实验分析表明,提出的各种手段起到了优化的作用.与已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法获得了更高的存储器带宽和浮点运算吞吐量;整体性能比CPU串行执行版本快了3倍以上.
关键词：	稀疏矩阵行压缩存储图形处理器统一计算架构优化策略
收稿时间：	2009/9/29 0:00:00
修稿时间：	2010/1/29 0:00:00
Optimizing Sparse Matrix-vector Multiplication Based on GPU

BAI Hong-tao,OUYANG Dan-tong,LI Xi-ming,LI Ting,HE Li-li.Optimizing Sparse Matrix-vector Multiplication Based on GPU[J].Computer Science,2010,37(8):168-171.

Authors:	BAI Hong-tao OUYANG Dan-tong LI Xi-ming LI Ting HE Li-li

Affiliation:	(College of Computer Science and Technology, Jilin University, Changchun 130012, China);(Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun 130012,China)

Abstract:

Keywords:	Sparse matrix Compressed sparse row Graphics processing unit Compute unified device architecture Optimizations
本文献已被万方数据等数据库收录！
	点击此处可从《计算机科学》浏览原始摘要信息
	点击此处可从《计算机科学》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏