基于瓦片算法的并行 QR 分解及其实现 |
| |
作者姓名: | 曹冬冬 赵永华 赵莲 |
| |
作者单位: | 1. 中国科学院计算机网络信息中心,北京 100190; 2. 中国科学院大学,北京 100049 |
| |
摘 要: | 本文介绍了一种基于瓦片算法的稠密矩阵并行 QR 分解及其实现方法。瓦片算法的思想是将完整的矩阵分块,并使每个块内的数据连续存储。各个瓦片块先独立进行分解,其他块接收当前块分解产生的数据,来更新自身块内的矩阵。我们分别实现了串行瓦片算法和并行瓦片算法,采用基于 MPI 和 OpenMP 混合并行编程模型,在“元”超级计算机上验证了该并行算法,并与 PLASMA 软件包进行对比,程序效率和可扩展性优于 PLASMA。 在多个节点上运行时,展现了良好的扩展性。
|
关 键 词: | 瓦片算法 QR 分解 并行实现 |
收稿时间: | 2016-01-10 |
|
| 点击此处可从《数据与计算发展前沿》浏览原始摘要信息 |
|
点击此处可从《数据与计算发展前沿》下载全文 |
|