期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

邬恩杰张静《电脑编程技巧与维护》2016,(24)

应用稀疏矩阵压缩存储技术之带行指针向量的链式存储结构,设计基于此链式存储结构的稀疏矩阵的转置算法及相乘算法,以及这些矩阵运算基于C++类模板的具体实现,并对算法的性能进行了分析. 相似文献

2.

阳光亮李鸿健豆育升唐红《计算机应用研究》2012,29(7):2435-2437

为了提高半经典分子动力学模拟中矩阵乘法效率,通过一种稀疏矩阵分解方法化简矩阵乘法,基于OpenMP实现矩阵相乘的Winograd并行算法。该算法将Winograd算法中各部分依次采用OpenMP并行计算,降低了数据通信。在16核服务器上测试表明,该方法能够显著提高半经典分子动力学模拟中矩阵乘法效率,并行加速比能够达到9.47,并具有良好的可扩展性,为大分子体系的模拟提供了可能。相似文献

3.

矩阵相乘的并行计算及其DSP实现

雷晶金心宇王锐《传感技术学报》2006,19(3):737-740

矩阵相乘的速度在阵列信号处理中具有重要意义,并行处理是提高系统运算能力最有效的方法.本文根据矩阵相乘的特点,提出了矩阵相乘的并行算法.同时经分析推导出了矩阵相乘的脉动矩阵方法,得出其在超立方及其平面阵列上的映射,提高了矩阵的运算速度.最后,给出了用DSP实现脉动矩阵的系统方案. 相似文献

4.

基于GPU的稀疏线性系统的预条件共轭梯度法

张健飞沈德飞《计算机应用》2013,33(3):825-829

研究了基于GPU的稀疏线性方程组的预条件共轭梯度法加速求解问题,并基于统一计算设备架构(CUDA)平台编制了程序,在NVIDIAGT430 GPU平台上进行了程序性能测试和分析。稀疏矩阵采用压缩稀疏行(CSR)格式压缩存储,针对预条件共轭梯度法的算法特性,研究了基于GPU的稀疏矩阵与向量相乘的性能优化、数据从CPU端传到GPU端的加速传输措施。将编制的稀疏矩阵与向量相乘的kernel函数和CUSPARSE函数库中的cusparseDcsrmv函数性能进行了对比,最优得到了2.1倍的加速效果。对于整个预条件共轭梯度法,通过自编kernel函数来实现的算法较之采用CUBLAS库和CUSPARSE库实现的算法稍具优势,与CPU端的预条件共轭梯度法相比,最优可以得到7.4倍的加速效果。相似文献

5.

基于GPU的稀疏矩阵Cholesky分解

《计算机学报》2014,(7)

稀疏矩阵Cholesky分解是求解大规模稀疏线性方程组的核心算法,也是求解过程中最耗时的部分.近年来,一系列并行算法通过图形处理器(GPU)获得了显著的加速比,然而,由于访存的不规则性以及任务间的大量数据依赖关系,稀疏矩阵Cholesky分解算法在GPU上的计算效率很低.文中实现了一种新的基于GPU的稀疏矩阵Cholesky分解算法.在数据组织方面,改进了稀疏矩阵超节点数据结构,通过超节点合并和分块控制计算粒度;在计算调度方面,将稀疏矩阵Cholesky分解过程映射为一系列的数据块任务,并设计了相应的任务生成与调度算法,在满足数据依赖性的前提下提高任务的并行性.实验结果表明,该算法能够显著提高稀疏矩阵Cholesky分解算法在GPU上的实现效率,在单个GPU上获得了相对4核CPU平台2.69~3.88倍的加速比. 相似文献

6.

高度可伸缩的稀疏矩阵乘法

吴志川毛琛韩蕾陈立军《计算机科学与探索》2013,(11)

矩阵乘法是线性代数和图算法中非常重要的一个基本操作,而大规模数据处理中的矩阵往往是稀疏矩阵。MapReduce编程框架能够有效地支持海量数据的分布式计算。因此,对如何运用MapReduce编程框架实现超大规模稀疏矩阵的乘法进行了研究。传统矩阵乘法并行算法没有针对稀疏矩阵进行专门优化,导致计算过程中出现大量不必要的通信开销。提出了一种新的算法--CRM（column row multiplication）算法,并与传统的矩阵分块算法进行了比较。实验证明,CRM算法运行效率有很大的提高,并且具有高度的可伸缩性,适合在MapReduce平台上运行。相似文献

7.

基于CPU与GPU协作的马尔可夫聚类的并行优化实现

陆璐何芦微《计算机应用研究》2018,35(8)

马尔可夫聚类算法(MCL)为网络聚类问题提供了一个有效的方法,尤其是在社区问题和生物信息学方面。然而,矩阵的Expansion是最耗时的操作,因为两个大规模矩阵相乘的时间复杂度是n₃。由于每个元素值的计算是独立的,因此Expansion和Inflation可以并行执行于多核GPU上。一个基本的马尔可夫聚类的并行实现需要使用全邻接矩阵来提高性能,该邻接矩阵通常是稀疏的,有时甚至是极大稀疏的。因此,本文的马尔可夫聚类的并行优化实现采用CSR * CSC格式去存储矩阵,大大减少了空间的浪费,并在一定程度上提升了Expansion的性能。实验结果表明,在处理大规模网络问题上,Sparse-MCL比CPU-MCL和P-MCL更有效。相似文献

8.

基于Hadoop平台的高阶矩阵相乘MapReduce算法研究

向林泓陈芋文张昱琳《计算机科学》2013,40(Z6):96-98

目前,针对基于单一节点的中高阶矩阵相乘存在着计算瓶颈,甚至因内存溢出导致计算机崩溃等问题,结合利用云计算分布式处理和虚拟化技术的优势,提出一种基于Hadoop平台的高阶矩阵相乘的MapReduce算法。实验结果表明:该算法能够有效地解决高阶矩阵相乘中存在的计算瓶颈问题,同时提高了计算效率。相似文献

9.

二元域大型稀疏矩阵向量乘的FPGA设计与实现

苏锦柱邬贵明贾迅《计算机工程与科学》2016,38(8):1530-1535

作为Wiedemannn算法的核心部分,稀疏矩阵向量乘是求解二元域上大型稀疏线性方程组的主要步骤。提出了一种基于FPGA的二元域大型稀疏矩阵向量乘的环网硬件系统架构,为解决Wiedemannn算法重复计算稀疏矩阵向量乘,提出了新的并行计算结构。实验分析表明,提出的架构提高了Wiedemannn算法中稀疏矩阵向量乘的并行性,同时充分利用了FPGA的片内存储器和吉比特收发器,与目前性能最好的部分可重构计算PR模型相比,实现了2.65倍的加速性能。相似文献

10.

基于稀疏带状矩阵的二维图像重建

下载免费PDF全文

杨海蓉方红张成潘根安《计算机工程与应用》2013,49(10):184-187

压缩传感（Compressed Sensing,CS）是数据采样同时实现压缩的新理论、新技术。针对大图像重构时采用的测量矩阵维数高,所需存储空间过大的问题,引入稀疏带状概念,提出了稀疏带状测量矩阵,可减少测量矩阵独立随机元,根据图像按列逐步处理的方式,测量矩阵维数大大降低。实验结果表明基于稀疏带状测量矩阵的逐列图像重构算法在保证重建质量的情况下,计算速度也大大提升。相似文献

11.

面向定制结构的稀疏矩阵分块方法

邬贵明王淼谢向辉窦勇郭松《计算机科学》2015,42(11):63-64, 79

稀疏矩阵向量乘是科学计算的核心问题,采用定制结构来加速稀疏矩阵向量乘的执行对提升科学计算性能具有重要意义。针对目前面向定制结构的稀疏矩阵分块方法和表示方法的缺点,提出了稀疏矩阵二维均匀分块方法和相应的表示方法嵌套分块CSR。实验结果表明,提出的稀疏矩阵分块方法和表示方法能够有效减少填零个数。相似文献

12.

基于RISC-V向量指令的稀疏矩阵向量乘法实现与优化

顾越赵银亮《计算机工程与科学》2022,44(1):1-8

开源指令集架构RISC-V具有高性能、模块化、简易性和易拓展等优势,在物联网、云计算等领域的应用日渐广泛,其向量拓展部分V模块更是很好地支持了矩阵数值计算.稀疏矩阵向量乘法SpM V作为矩阵数值计算的一个重要组成部分,具有深刻的研究意义与价值.利用RISC-V指令集的向量可配置性和寻址特性,分别对基于CSR、ELLPA... 相似文献

13.

Two-dimensional cache-oblivious sparse matrix-vector multiplication

A.N. Yzelman Rob H. Bisseling 《Parallel Computing》2011,37(12):806-819

In earlier work, we presented a one-dimensional cache-oblivious sparse matrix-vector (SpMV) multiplication scheme which has its roots in one-dimensional sparse matrix partitioning. Partitioning is often used in distributed-memory parallel computing for the SpMV multiplication, an important kernel in many applications. A logical extension is to move towards using a two-dimensional partitioning. In this paper, we present our research in this direction, extending the one-dimensional method for cache-oblivious SpMV multiplication to two dimensions, while still allowing only row and column permutations on the sparse input matrix. This extension requires a generalisation of the compressed row storage data structure to a block-based data structure, for which several variants are investigated. Experiments performed on three different architectures show further improvements of the two-dimensional method compared to the one-dimensional method, especially in those cases where the one-dimensional method already provided significant gains. The largest gain obtained by our new reordering is over a factor of 3 in SpMV speed, compared to the natural matrix ordering. 相似文献

14.

面向稀疏矩阵访存特性的Cache划分

邓林窦勇郑义《计算机工程与科学》2012,34(9):64-70

稀疏矩阵向量乘是许多科学计算的核心,计算中大量的间接和随机访存成为计算的主要瓶颈。本文通过分析稀疏矩阵向量乘运算的数据结构和计算过程,得到计算中不同数据的访存特征,并提出了一种面向数据访存特性的Cache划分方法。对12个稀疏矩阵向量乘的测试表明,本文的Cache划分方法能有效地提高可重用向量的Cache命中率,同时减少计算对Cache空间的需求。相似文献

15.

基于压缩稀疏矩阵矢量相乘的文本相似度计算 总被引：4，自引：0，他引：4

霍华冯博琴《小型微型计算机系统》2005,26(6):988-990

在信息检索矢量模型的基础上．提出了一种基于压缩稀疏矩阵矢量相乘的文本相似度计算方法，具有矢量模型计算简单和速度快的特点．该方法采用压缩稀疏矩阵矢量空间存储数据，在相似度计算和数据存储时不需要考虑文本矢量矩阵中的零元素，大大减少了计算量和存储空间，从而使信息检索系统运行效率显著提高．仿真实验表明，上述方法比基于矢量模型的传统反向索引机制节省了38％的存储空间．相似文献

16.

Sparse matrix multiplication: The distributed block-compressed sparse row library

《Parallel Computing》2014,40(5-6):47-58

相似文献

17.

基于C 的稀疏矩阵乘法运算器的实现

ZHOU Min 《电脑编程技巧与维护》2008,(14)

稀疏矩阵是指那些多数元素为零的矩阵。本文利用稀疏矩阵"稀疏"特点进行存储和计算可以大大节省存储空间,提高计算效率。通过采用标准C 语言设计实现了稀疏矩阵乘法运算器。相似文献

18.

基于C＋＋的稀疏矩阵乘法运算器的实现

周敏《电脑编程技巧与维护》2008,(11):19-19,42

稀疏矩阵是指那些多数元素为零的矩阵。本文利用稀疏矩阵“稀疏”特点进行存储和计算可以大大节省存储空间,提高计算效率。通过采用标准C＋＋语言设计实现了稀疏矩阵乘法运算器。相似文献