首页 | 本学科首页   官方微博 | 高级检索  
     

SpMV的自动性能优化实现技术及其应用研究
引用本文:袁娥,张云泉,刘芳芳,孙相征.SpMV的自动性能优化实现技术及其应用研究[J].计算机研究与发展,2009,46(7).
作者姓名:袁娥  张云泉  刘芳芳  孙相征
作者单位:1. 中国科学院软件研究所并行计算实验室,北京,100190;中国科学院研究生院,北京,100049;中国科学院计算机科学国家重点实验室,北京,100190
2. 中国科学院软件研究所并行计算实验室,北京,100190;中国科学院计算机科学国家重点实验室,北京,100190
3. 中国科学院软件研究所并行计算实验室,北京,100190
基金项目:国家自然科学基金项目,国家自然科学基金重点项目,国家"八六三"高技术研究发展计划基金项目 
摘    要:在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用这些性能优化技术所带来的额外时间开销,取得性能加速效果.在Pentium 4和AMD Athlon平台上,测试了10个矩阵,其平均加速比分别达到了1.69和1.48.

关 键 词:稀疏矩阵向量乘  启发式算法  自适应性能优化  存储访问模式  寄存器分块

Automatic Performance Tuning of Sparse Matrix-Vector Multiplication:Implementation Techniques and Its Application Research
Yuan E,Zhang Yunquan,Liu Fangfang,Sun Xiangzheng.Automatic Performance Tuning of Sparse Matrix-Vector Multiplication:Implementation Techniques and Its Application Research[J].Journal of Computer Research and Development,2009,46(7).
Authors:Yuan E  Zhang Yunquan  Liu Fangfang  Sun Xiangzheng
Affiliation:Laboratory of Parallel Computing;Institute of Software;Chinese Academy of Sciences;Beijing 100190;Graduate University of Chinese Academy of Sciences;Beijing 100049;State Key Laboratory of Computer Science;Beijing 100190
Abstract:Sparse matrix-vector multiplication(SpMV) is an important computational kernel in scientific computing applications that tends to perform poorly on modern processors with deep memory hierarchy due to its low ratio of the number of floating point operations to the number of memory accesses,and its irregular memory access patterns.Register-level blocking algorithm and heuristic block-size selection algorithm store a sparse matrix as a sequence of small dense blocks and re-organize the computation sequence to ...
Keywords:sparse matrix-vector multiplication  heuristic algorithm  self-adapting algorithm  memory access pattern  register-level blocking  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号