首页 | 本学科首页   官方微博 | 高级检索  
     

对角线稀疏矩阵的SpMV自适应性能优化
引用本文:孙相征,张云泉,王婷,李焱,袁良.对角线稀疏矩阵的SpMV自适应性能优化[J].计算机研究与发展,2013,50(3).
作者姓名:孙相征  张云泉  王婷  李焱  袁良
作者单位:1. 中国科学院软件所并行软件与计算科学实验室 北京 100190;计算机科学国家重点实验室(中国科学院软件研究所) 北京100190;中国科学院大学 北京100190
2. 中国科学院软件所并行软件与计算科学实验室 北京 100190;计算机科学国家重点实验室(中国科学院软件研究所) 北京100190
基金项目:国家"八六三"高技术研究发展计划基金项目,国家"核高基"重大科技专项基金项目,中国科学院知识创新工程重大项目课题,国家重大科研装备研制项目,国家自然科学基金项目,中国科学院研究生科技创新与社会实践资助专项
摘    要:稀疏矩阵向量乘(SpMV)是科学计算中常用的内核之一,其运行速率跟非零元分布相关.针对对角线稀疏矩阵,提出了压缩行片段对角(compressed row segment diagonal,CRSD)存储格式.它利用“对角线格式”有效描述矩阵的对角线分布,区别于以往通用的计算方法,CRSD通过对给定应用的对角线稀疏矩阵采样再进行特定的优化.并且在软件安装阶段,通过自适应的方法选取适合具体运行平台的最优SpMV实现.在CPU端进行多线程并行化实现时,自适应调优过程中收集的信息还被用于线程间任务划分,以实现负载平衡.同时完成CRSD存储格式在GPU端的实现,并根据GPU端计算与访存的特点进行优化.实验结果表明:在Intel和AMD的多核平台使用相同线程数的情况下,与DIA相比,使用CRSD的加速比可以达到2.37X(平均1.7X);与CSR相比,可以达到4.6X(平均2.1X).

关 键 词:CRSD  自适应性能优化SpMV  对角线格式  对角线稀疏矩阵  GPU  科学应用

Auto-Tuning of SpMV for Diagonal Sparse Matrices
Sun Xiangzheng , Zhang Yunquan , Wang Ting , Li Yan , Yuan Liang.Auto-Tuning of SpMV for Diagonal Sparse Matrices[J].Journal of Computer Research and Development,2013,50(3).
Authors:Sun Xiangzheng  Zhang Yunquan  Wang Ting  Li Yan  Yuan Liang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号