首页 | 本学科首页   官方微博 | 高级检索  
     

二元域大型稀疏矩阵向量乘的FPGA设计与实现
引用本文:苏锦柱,邬贵明,贾迅.二元域大型稀疏矩阵向量乘的FPGA设计与实现[J].计算机工程与科学,2016,38(8):1530-1535.
作者姓名:苏锦柱  邬贵明  贾迅
作者单位:;1.数学工程与先进计算国家重点实验室
摘    要:作为Wiedemannn算法的核心部分,稀疏矩阵向量乘是求解二元域上大型稀疏线性方程组的主要步骤。提出了一种基于FPGA的二元域大型稀疏矩阵向量乘的环网硬件系统架构,为解决Wiedemannn算法重复计算稀疏矩阵向量乘,提出了新的并行计算结构。实验分析表明,提出的架构提高了Wiedemannn算法中稀疏矩阵向量乘的并行性,同时充分利用了FPGA的片内存储器和吉比特收发器,与目前性能最好的部分可重构计算PR模型相比,实现了2.65倍的加速性能。

关 键 词:稀疏矩阵向量乘  二元域  FPGA  吉比特收发器
收稿时间:2016-04-16
修稿时间:2016-08-25

Design and implementation of large sparse matrix vector multiplication on FPGA over GF(2)
SU Jin-zhu,WU Gu-ming,JIA Xun.Design and implementation of large sparse matrix vector multiplication on FPGA over GF(2)[J].Computer Engineering & Science,2016,38(8):1530-1535.
Authors:SU Jin-zhu  WU Gu-ming  JIA Xun
Affiliation:(State Key Laboratory of Mathematical Engineering and Advanced Computing,Wuxi 214125,China)
Abstract:As the kernel part of Wiedemannn algorithm, the sparse matrix vector multiplication (SpMV) is the main step for solving large sparse system of linear equations. In order to solve the problem of repeated SpMV computation, we propose a torus network architecture for large spare matrix vector multiplication based on FPGA over GF(2). The implementation simplifies the design of the algorithm, improves the algorithm parallelism and the utilization of Block RAM on chip and GTX, and obtains a speedup of 2.65 times in comparison with the partial reconfiguration design.
Keywords:spare matrix vector multiplication (SpMV)  GF(2)  FPGA  GTX  
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号