使用GPU加速计算矩阵的Cholesky分解 |
| |
作者单位: | ;1.武汉大学电子信息学院 |
| |
摘 要: | 针对大型实对称正定矩阵的Cholesky分解问题,给出其在图形处理器(GPU)上的具体实现。详细分析了Volkov计算Cholesky分解的混合并行算法,并在此基础上依据自身计算机的CPU以及GPU的计算性能,给出一种更为合理的三阶段混合调度方案,进一步减少CPU的空闲时间以及避免GPU空闲情况的出现。数值实验表明,当矩阵阶数超过7000时,新的混合调度算法相比标准的MKL算法获得了超过5倍的加速比,同时对比原Volkov混合算法获得了显著的性能提升。
|
关 键 词: | 图形处理器 乔里斯基分解 加速比 混合算法 |
ACCELERATING CALCULATION OF CHOLESKY FACTORISATION OF MATRIX WITH GPU |
| |
Abstract: | |
| |
Keywords: | |
|
|