首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
一种基于MapReduce并行框架的大规模矩阵乘法运算的实现   总被引:1,自引:0,他引:1  
在机器学习算法中,矩阵乘法运算是一种基本运算.而扩大矩阵乘法的运算规模并降低其运算时间,将有利于满足机器学习算法处理大规模数据的要求.将MapReduee并行框架用于分块矩阵乘法,实现一种用于大规模矩阵乘法运算的方法.理论分析和实验结果表明该方法在处理大规模矩阵乘法上具有极大的潜能,并且随着计算节点的增加从而获得较好的加速比.  相似文献   

2.
矩阵乘法运算作为计算机科学和数学的一个基本运算,在科学研究和工程计算中有着广泛的应用。确定2个矩阵乘积所需要的最小乘法数是当今计算机代数中一直未能求解的重要问题之一。通过将矩阵乘法问题建模为一个组合优化问题,采用人工蜂群启发式搜索算法进行矩阵乘法问题求解。对人工蜂群算法进行了改进,给出一种绕圈遍历方法,避免了对同一个解的相同邻域的重复搜索。通过在2×2矩阵乘法问题上的数值实验验证了算法的有效性,所提算法能够快速地找到2×2矩阵分解的乘积方法。  相似文献   

3.
为了优化矩阵乘法的并行运算效率,提高流水线的性能,采用了基于Strassen算法的矩阵来运算,并通过缟码在DLX模拟的并行流水线环境中仿真运行.实验结果表明,优化后的矩阵秉算法降低了时间复杂度,减少了指令条数和运算周期,显著地提高了流水线上矩阵秉法的并行运算效率.  相似文献   

4.
目前的矩阵乘法算法无法处理大规模和超大规模的矩阵,而随着MapReduce编程框架的提出,并行处理矩阵乘法成为解决大矩阵运算的主要手段。总结了矩阵乘法在MapReduce编程模型上的并行实现方法,并提出了实现高性能大矩阵乘法的策略——折中单个工作节点的计算量和需要网络传输的数据量。实验证明,并行实现算法在大矩阵上明显优于传统的单机算法,而且随着集群中节点数目的增多,并行算法会表现出更好的性能。  相似文献   

5.
给出了二维元素矩阵的概念,对于赋权图对应的赋权矩阵,定义了二维元素初始赋权路径矩阵和二维元素一般赋权路径矩阵,在通常赋权矩阵“乘法”运算基础上定义了路径“乘法”运算,从而得到了二维元素一般赋权路径矩阵的“乘法”运算,通过其“乘法”运算来求出所有点对的最短距离与对应路径,在得到最短距离的同时也得到对应的路径,结果显示在最终的一般赋权路径矩阵上。该算法易于通过计算机编程实现,对于大规模有向图或无向图,更有优势。  相似文献   

6.
杜放  原玲  刘立程 《计算机应用》2012,32(6):1503-1505
通过分析基于现场可编辑门阵列(FPGA)的长期演进(LTE)物理层中空间复用预编码实现的问题,提出了一种基于码本的预编码实现算法。根据上层告知的属性参数在预先建立的系数表和加减关系表中查表,对层映射后的数据先进行系数乘法运算,再进行加减运算,从而代替了复数矩阵乘法运算。因此可以大大减少预编码环节中的复数矩阵乘法次数,并降低了编码处理的复杂度,提高了编码运算的速度。仿真实验结果表明,所提算法能够很好地实现系统功能。  相似文献   

7.
一种基于De Bruijn网络结构的并行矩阵乘算法   总被引:1,自引:1,他引:0  
在De Bruijn网络中进行并行矩阵乘法运算,算法简单,容易实现。首先介绍了De Bruijn网络结构,然后提出了一种基于De Bruijn网络结构的矩阵乘法的并行算法,分析了它的加速比、效率等性能及可扩展性,通过与Cannon算法的比较,证明它的时间复杂度等效于Cannon算法,最后通过实验验证了这个结论的正确性。  相似文献   

8.
快速小波变换是数字信号处理面临的一个重要问题,针对并行小波算法展开研究,缩减小波变换中卷积运算的规模,提高小波变换过程中的并行效能,以实现小波变换的快速并行计算。通过FFT矩阵代入计算,消去了并行计算过程中的同步通信,降低了乘法运算次数。对算法思想进行了理论分析,说明新算法在短小数据分段情况下能够减少50%~75%的乘法操作;通过搭建两种不同平台进行了对比测试,证明了算法的先进性与有效性。基于FFT矩阵的并行小波变换算法是一种稳定有效的经典小波并行算法。  相似文献   

9.
近十年来,应用数学科学工作者研究出很多快速矩阵乘算法,其中包括有名的维诺格拉得算法。这些算法的乘法运算总数少于矩阵乘经典算法,因此它们是快速的。  相似文献   

10.
并行矩阵乘法是线性代数中最重要的基本运算之一,同时也是许多科学应用的基石.随着高性能计算(HPC)向E级计算发展,并行矩阵乘法的通信开销所占比重越来越大.如何降低并行矩阵乘法的通信开销,提高并行矩阵乘的可扩展性是当前研究的热点之一.本文提出一种新型的分布式并行稠密矩阵乘算法,即2.5D版本的PUMMA(Parallel...  相似文献   

11.
大量的乘法运算和三角函数求值是MUSIC算法实时处理能力不足的主要原因.对MUSIC算法复数乘法进行分解并构造两个实值向量,利用Hermite矩阵的性质去掉冗余乘法运算.在此基础上,提出两种查表法代替三角函数求值:直接查表法,完全避免三角函数求值运算;间接查表法,即对方位角信息和俯仰角信息分别查表,具有较好的信号频率适...  相似文献   

12.
稀疏矩阵相乘的一个改进算法   总被引:1,自引:0,他引:1       下载免费PDF全文
稀疏矩阵的乘法运算可用于解决许多实际的应用问题。提出一种新颖的稀疏矩阵相乘算法,算法实现中将计算单元由单个元素扩展至行向量,避免了矩阵的转置,减少了扫描次数。利用三元组和少量的额外辅助空间实现稀疏矩阵的相乘。实验结果表明了该算法的有效性。  相似文献   

13.
RSA密码系统有效实现算法   总被引:7,自引:0,他引:7  
本文提出了实现RSA算法的一种快速、适合于硬件实现的方案,在该方案中,我们作用加法链将求幂运算转化为求平方和乘法运算并大大降低了运算的次数,使用Montgomery算法将模N乘法转化为模R(基数)的算法,模R乘积的转化,以及使用一种新的数母加法器作为运算部件的基础。  相似文献   

14.
基于半点运算与多基表示的椭圆曲线标量乘法   总被引:2,自引:2,他引:0       下载免费PDF全文
陈辉  鲍皖苏 《计算机工程》2008,34(15):153-155
椭圆曲线密码体制的实现速度依赖于曲线上标量乘法的运算速度。在具有极小2-挠的椭圆曲线上基于半点运算的标量乘法算法优于传统的标量乘法算法。该文将半点运算运用于基于多基表示的标量乘法算法中,得到一种新的多基表示形式和基于该表示形式的标量乘法算法,有效提高了标量乘法的运算效率。  相似文献   

15.
在椭圆曲线密码体制中,有限域的乘法运算是最关键的运算。基于Ⅱ型正规基域的加法运算速度快、乘方运算简单,但乘法运算比较复杂,成为该域上运算的瓶颈。为了解决这个问题,该文在分析串行乘法算法的基础上对算法进行改进,该算法与串行乘法算法相比,减少了运算周期,有效地提高了运行速度,根据改进算法设计并行乘法器结构,并在FPGA上进行实现,为进一步提高椭圆曲线加密速度提供硬件基础。  相似文献   

16.
现有RAID系统的编码算法不能同时具备较高的执行效率和较强的容错能力。为此,提出一种基于二进制矩阵的RS编码优化算法。使用RS编码中有限域内乘法运算得到转换后的二进制矩阵,采用多分法对其进行优化,从而减少编码时的异或运算次数,以此设计优化算法。实验结果表明,该算法的执行效率较高,容错能力较大。  相似文献   

17.
针对里德所罗门码(Reed-Solomon, RS)译码在硬件实现时存在数据量大、消耗资源多等问题,基于CCSDS标准中的RS(255,223)码,根据欧几里得核心译码算法,在FPGA上实现对RS译码器的优化设计。本文提出采用乘法器因子矩阵方法将有限域中的乘法计算转换为加法运算,用异或操作在硬件中实现,简化硬件运算数据量;在欧几里得算法核心模块实现中,采用多项式除法电路和多项式乘法电路进行硬件电路设计,降低运算复杂度,可以有效节约硬件资源。通过FPGA测试验证,优化设计的译码器可以有效译码并具有较好的译码性能,完成最多16个码元数据的纠错。  相似文献   

18.
矩阵张量积的计算是矩阵计算中的一类重要问题,与乘法相比,张量积的计算量更为庞大.分析了分块矩阵张量积的相关数学特性,证明了在置换相抵意义下两个矩阵的张量积运算可以交换,特别刻画了这类置换矩阵,并由此证明了在置换相抵条件下分块矩阵可以分块地进行张量积运算.在此基础上,讨论了矩阵张量积的并行计算问题,提出了几种并行计算模型,进行了必要的算法分析,并通过实例阐述了这些算法的思想和过程.  相似文献   

19.
在光互连网络上实现并行算法的通信模式是当前一个颇受关注的研究领域。矩阵乘法是数值分析领域中一种常用的基本运算,许多数值代数中的计算问题最终会归结到矩阵乘法的计算。提出一种嵌入算法MRDR,在此基础上分析了在一组规则WDM光网络线性阵列、环、mesh、双环网上实现并行矩阵乘通信模式的波长分配问题,并给出了所需的最小波长数。  相似文献   

20.
基于查表的无乘法DCT快速算法   总被引:2,自引:0,他引:2  
杜相文  陈贺新  赵岩 《计算机工程》2004,30(20):159-160
为提高离散余弦变换(DCT)的运算速度,提出了一种高效、快速的无乘法DCT算法。该算法在不引入移位运算的前提下,利用查表法去除了在DCT变换中所需的乘法运算,只需要有限步加法即可完成DCT,运算速度比JPEG中的传统算法提高了1.5倍多。所得到的数据精度与原始的DCT算法完全相同。该算法特别适用于图像信号的处理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号