共查询到17条相似文献,搜索用时 390 毫秒
1.
2.
3.
旨在对光学向量矩阵乘法进行实验研究。针对Goodman向量矩阵乘法器原理光路模型中存在的结构庞大、可实现的运算规模有限、制作成本较高等问题,提出了一种用液晶阵列实现向量矩阵乘法的方法。该方法具有易于微型化、可完成大规模的二进制向量矩阵乘法运算、制作成本较低的优点。对该方法的原理进行详细地说明;并利用本课题组开发完成的三值逻辑光处理器作为实现该方法的核心器件,完成了实验。实验结果表明该方法具有正确性和巨大的并行处理优势。 相似文献
4.
一套二进制向量-矩阵乘法运算的光计算系统 总被引:1,自引:0,他引:1
对计算机前沿领域的光计算进行了讨论研究,介绍了光计算的核心运算器——光学向量-矩阵乘法器的工作原理,从实验角度出发,设计出了一套性能稳定的可实现二进制向量-矩阵乘法运算的光计算系统,并分析了此套系统的光学原理和性能特点。此系统具有矩阵乘法运算、数码显示、电压输出等功能,是一套实用性很强的教学科研演示产品,对光学乘法器以及光计算的研究具有一定的指导意义。 相似文献
5.
对计算机前沿领域的光计算进行了讨论研究,介绍了光计算的核心运算器——光学向量-矩阵乘法器的工作原理,从实验角度出发,设计出了一套性能稳定的可实现二进制向量-矩阵乘法运算的光计算系统,并分析了此套系统的光学原理和性能特点。此系统具有矩阵乘法运算、数码显示、电压输出等功能,是一套实用性很强的教学科研演示产品,对光学乘法器以及光计算的研究具有一定的指导意义。 相似文献
6.
一种基于MapReduce并行框架的大规模矩阵乘法运算的实现 总被引:1,自引:0,他引:1
张骏 《计算机应用与软件》2012,29(6):267-270
在机器学习算法中,矩阵乘法运算是一种基本运算.而扩大矩阵乘法的运算规模并降低其运算时间,将有利于满足机器学习算法处理大规模数据的要求.将MapReduee并行框架用于分块矩阵乘法,实现一种用于大规模矩阵乘法运算的方法.理论分析和实验结果表明该方法在处理大规模矩阵乘法上具有极大的潜能,并且随着计算节点的增加从而获得较好的加速比. 相似文献
7.
本文研究大型稀疏矩阵向量乘法的并行化措施。主要包括高效的存储方法,核心代码用汇编语言编写,循环展开,宏任务和微任务方式,重排序和分块技术。根据实际问题的需要,分别给出了一般稀疏矩阵和对称正定带状矩阵向量乘法内核子程序,ELLPACK,ITPAKC及LINPACK等库和许多应用程序可直接调用它们。 相似文献
8.
在三值光计算机上实现光学向量-矩阵乘法。为了利用光的并行性,研究使用MSD数字系统。在该数字系统上应用全并行无进位加法和M变换实现光学向量-矩阵乘法。为了提高效率,利用M变换以全并行的方式生成部分积,而后采用了二叉迭代法来求向量内积。实验证明了其可行性和正确性。由于该系统在信息表达上将光强与光的偏振性结合起来,所以在解码时不需要测量光强,只需判断光的有无即可,提高了运算精度和速度。 相似文献
9.
图形渲染中涉及的几何变换、投影变换、视口变换等需要大量稀疏矩阵向量乘法(Sparse Matrix-Vector Multiplication,SpM V)运算,如何实现SpMV高性能计算成为了图形处理器设计中的关键性问题之一,然而,当前的SpMV运算存在并行度较差,资源占用较多等问题.为提升硬件运算的性能,本文基于矩阵列向量的线性组合,充分利用数据的并行性,设计了一种专用加速器结构.实验表明,在XC6VLX550T开发板上与其他两种结构相比,速度分别能够提高28%、37%,资源占用率分别减少约48%、18%,应用于图形渲染中的变换操作后,速度分别能够提高28%、30%,资源占用率分别最高减少约48%、60%. 相似文献
10.
目前的矩阵乘法算法无法处理大规模和超大规模的矩阵,而随着MapReduce编程框架的提出,并行处理矩阵乘法成为解决大矩阵运算的主要手段。总结了矩阵乘法在MapReduce编程模型上的并行实现方法,并提出了实现高性能大矩阵乘法的策略——折中单个工作节点的计算量和需要网络传输的数据量。实验证明,并行实现算法在大矩阵上明显优于传统的单机算法,而且随着集群中节点数目的增多,并行算法会表现出更好的性能。 相似文献
11.
主要研究二进制域运算在DSP上的实现。通过设置多个中间变量,实现了对数组的并行计算,将最佳正规基模乘算法提高到6级流水。重构almost inversion多项式基模逆算法结构,消除跳转语句,实现程序设计模块化。在TMS320C6204上执行113位和191位算法证实确实提高了模乘和模逆两种运算的速度。以循环移位取代乘法的模乘算法,限制了C6201的流水深度。 相似文献
12.
矩阵乘法是数值分析以及图形图像处理算法的基础,通用的矩阵乘法加速器设计一直是嵌入式系统设计的研究热点。但矩阵乘法由于计算复杂度高,处理效率低,常常成为嵌入式系统运算速度的瓶颈。为了在嵌入式领域更好地使用矩阵乘法,提出了基于MPSoC(MultiProcessor System-on-Chip)的软硬件协同加速的架构。在MPSoC的架构下,一方面,设计了面向硬件约束的矩阵分块方法,从而实现了通用的矩阵乘法加速器系统;另一方面,通过利用MPSoC下的多核架构,提出了相应的任务划分和负载平衡调度算法,提高了并行效率和整体系统加速比。实验结果表明,所提架构及算法实现了通用的矩阵乘法计算,并且通过软硬件协同设计实现的多核并行调度算法与传统单核设计相比在计算效率方面得到了显著的提高。 相似文献
13.
很多基于椭圆曲线的密码协议都需要计算多标量乘法kP lQ。目前常见的多标量乘算法的效率主要取决于标量的(联合)海明权值。JSF表示的平均联合海明权密度为1/2,是所有带符号二进制表示中最优的,但JSF编码只能从右到左实现。提出一个新的从左到右的基于MOF的编码方法,该方法的平均联合海明权密度与基于JSF表示的相同,并提出一个新的多标量乘算法,该算法对标量从左到右进行编码,并将编码合并到多标量乘的主计算中,从而节省了存储标量的新编码的内存空间,提高了实现效率。 相似文献
14.
矩阵乘法是许多应用中的核心计算,在这些应用中只是少量矩阵元素发生改变,如果全量重新计算则工作量很大,因此增量计算是解决该问题的有效手段. 本文提出了一种基于MapReudce模型的增量矩阵乘法计算方法,以及计算矩阵中变化元素的高效识别方法,通过利用矩阵元素的摘要信息快速计算出变化元素,然后将矩阵乘法计算过程转换为一系列等价的连接问题,实现了一种有效的矩阵乘法增量计算. 对于矩阵元素变化率较小的情形,计算实验表明提出的方法计算时间上明显优于全量重新计算方法. 相似文献
15.
复合域乘法运算是对称密码算法中的基本运算和重要模块,因操作复杂且计算时间长,其实现性能在很大程度上制约着对称密码算法的运算速度。文章研究了对称密码算法中的复合域乘法运算特点及实现原理,设计了以GF(28)为基域,扩展到GF((28 )h(k=1,2,3,4)域上的复合域乘法可重构架构,通过配置能够灵活高效地实现GF(2 8)、GF((2H)2)、GF(2 8)3、CF((28)4)域上的有限域乘法操作。同时结合处理器的指令设计方法,设计了通用的复合域乘法操作及配置指令,能够极大的提高对称密码算法中复合域乘法运算的处理效率。最后文章对复合域乘法可重构架构进行了模拟与验证,在0.18μmCMOS工艺标准单元库下进行逻辑综合以及布局布线,并对综合结果进行了性能评估。结果表明,文章提出的复合域乘法可重构架构及相应的专用指令,在灵活性的前提下提供了较高的执行效率,具有较高的实用价值。 相似文献
16.
17.
在光互连网络上实现并行算法的通信模式是当前一个颇受关注的研究领域。矩阵乘法是数值分析领域中一种常用的基本运算,许多数值代数中的计算问题最终会归结到矩阵乘法的计算。提出一种嵌入算法MRDR,在此基础上分析了在一组规则WDM光网络线性阵列、环、mesh、双环网上实现并行矩阵乘通信模式的波长分配问题,并给出了所需的最小波长数。 相似文献