首页 | 本学科首页   官方微博 | 高级检索  
     

基于瓦片算法的并行 QR 分解及其实现
作者姓名:曹冬冬  赵永华  赵莲
作者单位:1. 中国科学院计算机网络信息中心,北京 100190; 2. 中国科学院大学,北京 100049
摘    要:本文介绍了一种基于瓦片算法的稠密矩阵并行 QR 分解及其实现方法。瓦片算法的思想是将完整的矩阵分块,并使每个块内的数据连续存储。各个瓦片块先独立进行分解,其他块接收当前块分解产生的数据,来更新自身块内的矩阵。我们分别实现了串行瓦片算法和并行瓦片算法,采用基于 MPI 和 OpenMP 混合并行编程模型,在“元”超级计算机上验证了该并行算法,并与 PLASMA 软件包进行对比,程序效率和可扩展性优于 PLASMA。 在多个节点上运行时,展现了良好的扩展性。

关 键 词:瓦片算法  QR 分解  并行实现  
收稿时间:2016-01-10
点击此处可从《数据与计算发展前沿》浏览原始摘要信息
点击此处可从《数据与计算发展前沿》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号