首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
郭志军 《网友世界》2014,(13):22-23
软件Excel的功能非常强大,在日常工作中经常用到,在线性代数的教学中也可以应用它的函数功能,进行计算、演示,通过函数的功能MDETERM可以计算行列式的值、TRANSPOSE计算转置矩阵、MMULT计算矩阵的乘法、MINVERSE求逆矩阵,以及综合起来可以求矩阵方程和线性方程组。通过Excel在线性代数中的应用,使学生学习起来更加的轻松自如,进而提高学生学习的主动性。  相似文献   

2.
稀疏矩阵相乘的一个改进算法   总被引:1,自引:0,他引:1       下载免费PDF全文
稀疏矩阵的乘法运算可用于解决许多实际的应用问题。提出一种新颖的稀疏矩阵相乘算法,算法实现中将计算单元由单个元素扩展至行向量,避免了矩阵的转置,减少了扫描次数。利用三元组和少量的额外辅助空间实现稀疏矩阵的相乘。实验结果表明了该算法的有效性。  相似文献   

3.
根据矩阵的不同存储方式,对不同的转置方式作了对比分析;对一般矩阵的经典转置算法提出了一种改进方案;给出了用C语言编写的矩阵转置的几种算法。通过对各算法所作的时间、空间的复杂度分析,总结出了这几种算法的优缺点。  相似文献   

4.
多计算机上分布式矩阵转置   总被引:1,自引:0,他引:1  
转角存储是信号处理中一个很重要的操作。本文研究了分布式矩阵的转置问题,介绍了分布式矩阵转置的实现步骤,分析矩阵转置的时间,并给出了处理时间的表达式,矩阵转置的硬件实现有重要的参考价值。  相似文献   

5.
实时SAR成像系统矩阵转置方法研究与实现   总被引:1,自引:0,他引:1       下载免费PDF全文
合成孔径雷达(SAR)是一种高分辨率成像雷达,而矩阵转置是实时SAR成像信号处理中一个很重要的操作,矩阵转置的效率高低将直接决定整个SAR成像信号处理系统的性能。对于矩阵转置,可采用行进列出或列进行出、两页式或三页式转置等方法进行处理,但这些方法处理时间较长,转置效率较低。在现有矩阵转置方法的基础上,提出了一种新的矩阵转置方法。在实际硬件平台上利用提出的矩阵转置方法进行了实时SAR成像处理,所得结果的矩阵转置效率为78%,整个SAR成像处理时间为10秒。测试结果表明,该方法对解决矩阵转置问题是行之有效的。  相似文献   

6.
文中首先总结按行划分和按列划分的并行矩阵向量乘法在原理上的异同。然后实现基于MPI模型的按行划分以及按列划分的矩阵向量乘法的程序,并分析了程序在基本框架方面的异同。最后给出测试这两种程序的实验条件和任务,并对这两种程序在不同情况下的执行时间进行分析。  相似文献   

7.
对计算机前沿领域的光计算进行了讨论研究,介绍了光计算的核心运算器——光学向量-矩阵乘法器的工作原理,从实验角度出发,设计出了一套性能稳定的可实现二进制向量-矩阵乘法运算的光计算系统,并分析了此套系统的光学原理和性能特点。此系统具有矩阵乘法运算、数码显示、电压输出等功能,是一套实用性很强的教学科研演示产品,对光学乘法器以及光计算的研究具有一定的指导意义。  相似文献   

8.
一套二进制向量-矩阵乘法运算的光计算系统   总被引:1,自引:0,他引:1  
对计算机前沿领域的光计算进行了讨论研究,介绍了光计算的核心运算器——光学向量-矩阵乘法器的工作原理,从实验角度出发,设计出了一套性能稳定的可实现二进制向量-矩阵乘法运算的光计算系统,并分析了此套系统的光学原理和性能特点。此系统具有矩阵乘法运算、数码显示、电压输出等功能,是一套实用性很强的教学科研演示产品,对光学乘法器以及光计算的研究具有一定的指导意义。  相似文献   

9.
在《数据结构》课程中,三元组稀疏矩阵的转置算法通常会作为难点来讲解。通过介绍一般数组的矩阵转置的算法以及稀疏矩阵、稀疏矩阵的三元组表示,引出稀疏矩阵的一般算法。本文介绍的稀疏矩阵的算法是一种用C语言编写的转置算法,并通过对两种算法的涉及到的时间以及空间的复杂度进行分析,突出C语言编写的转置算法的优势。  相似文献   

10.
阐述MPI与OpenMP进行并行计算的特点,并在Visual Studio 2010上构建一个基于两者的混合编程平台。程序在该平台上执行时能够同时实现多进程与进程内多线程编程,设计并实现一种基于数据划分的矩阵乘法的并行算法,将数据分解为两部分交给两个计算节点分别完成,并在每个计算节点内将数据进一步划分,交给多个线程同时执行。通过与非并行矩阵乘法、MPI矩阵乘法、OpenMP矩阵乘法运算性能进行比较,验证该算法可以有效地挖掘计算机的处理能力。  相似文献   

11.
按行及按列划分的并行矩阵向量乘法的分析   总被引:1,自引:0,他引:1  
文中首先总结按衍划分和按列划分的并行矩阵向世乘法在原理上的异同。然后实现基于MPT模型的按行划分以及按列划分的矩阵向量乘法的程序,并分析了程序在基本框架方面的异同。最后给出测试这两种崔序的实验条件和任务,并对这两种程序在不同情况下的执行时问进行分析。  相似文献   

12.
首先介绍了CUDA架构特点,在GPU上基于CUDA使用两种方法实现了矩阵乘法,并根据CUDA特有的软硬件架构对矩阵乘法进行了优化。然后计算GPU峰值比并进行了分析。实验结果表明,基于CUDA的矩阵乘法相对于CPU矩阵乘法获得了很高的加速比,最高加速比达到1079.64。GPU浮点运算能力得到有效利用,峰值比最高达到30.85%。  相似文献   

13.
李梅 《微机发展》2012,(2):198-201,205
向量矩阵乘法运算是数值计算中基本的运算,广泛应用于线性方程组求解、图像处理、数字信号处理、人工智能等多个领域。目前向量矩阵乘法的实现方法有很多种,其中用光学方式实现向量矩阵乘法的方法因其所特有的并行性和乘法性质,在解决这类二维信息处理问题时独具优势而受到研究者们的青睐。对光学向量矩阵乘法的研究进行了深入的分析和总结,综述国内外各种光学矩阵乘法实现的理论和方法,并阐述作者研究的基于三值光学逻辑处理器的实现方法,该方法具有结构简单、易于微型化、计算精度高等优点。  相似文献   

14.
为进一步提高大规模平台上可扩展矩阵乘法的并行计算效率,提出一种并行分层可扩展矩阵乘法的递阶优化方法。首先,在可扩展矩阵乘法算法(SMM)算法枢轴行和枢轴列通信研究基础上,利用分层方式在更高等级上对网格进行矩形群划分,实现矩阵乘法的二维计算向三维计算转变,并设计对应的集群内通信和集群间通信过程,实现SMM乘法的递阶并行优化(HSMM);其次,对所提HSMM算法进行理论分析,分情况对其通信成本进行分析和预测,推导出最佳计算成本的集群数选取方式;最后,通过在Grid5000和BlueGene/P测试平台实验,验证了所提算法有效性和理论分析的正确性。  相似文献   

15.
矩阵乘法是许多应用中的核心计算,在这些应用中只是少量矩阵元素发生改变,如果全量重新计算则工作量很大,因此增量计算是解决该问题的有效手段. 本文提出了一种基于MapReudce模型的增量矩阵乘法计算方法,以及计算矩阵中变化元素的高效识别方法,通过利用矩阵元素的摘要信息快速计算出变化元素,然后将矩阵乘法计算过程转换为一系列等价的连接问题,实现了一种有效的矩阵乘法增量计算. 对于矩阵元素变化率较小的情形,计算实验表明提出的方法计算时间上明显优于全量重新计算方法.  相似文献   

16.
二元有限域正规基乘法矩阵快速算法研究与实现   总被引:1,自引:0,他引:1  
通过对二元有限域上一般正规基乘法矩阵的计算:亨法进行深入分析,利用二元域的特性设计了一种便于计算机实现的快速计算二元有限域上一般正规基乘法矩阵的算法,并且针对该算法的时间及空间复杂度进行了分析。  相似文献   

17.
针对聚类算法需要处理数据集的规模越来越大、时效性要求越来越高,对算法的大数据适应能力和性能要求更高的问题,提出一种在Spark分布式内存计算平台下的模糊C均值(FCM)算法Spark-FCM。首先对矩阵通过水平分割实现分布式存储,不同向量存储在不同节点;然后基于FCM算法的计算特点,设计了分布式和缓存敏感的常用矩阵操作,包括乘法、转置和加法等;最后基于矩阵操作和Spark平台特点,设计了Spark-FCM算法,主要数据结构采用分布式矩阵存储,具有节点间数据移动少和每个步骤分布式计算特点。通过在单机和集群环境下测试,算法具有良好的可扩展性,并可以适应大规模数据集,算法性能与数据量成线性关系,集群环境下性能比单机提高2~3倍。  相似文献   

18.
EHMM人眼状态识别算法具有较高的识别率但算法复杂,因此利用SOPC开发平台设计了一种基于行列变换快速算法的2D-DCT IP核以提高处理速度;根据眼状态识别只需取2D-DCT后左上角部分子矩阵数据的特点,对其计算过程进一步优化;并引入了转置存储技术,浮点数乘法通过移位后转化为定点乘法器实现,优化了硬件资源,提高了处理速度;实验结果表明该IP核很好地实现了人眼图像灰度值的DCT变换。  相似文献   

19.
矩阵乘法是数值分析以及图形图像处理算法的基础,通用的矩阵乘法加速器设计一直是嵌入式系统设计的研究热点。但矩阵乘法由于计算复杂度高,处理效率低,常常成为嵌入式系统运算速度的瓶颈。为了在嵌入式领域更好地使用矩阵乘法,提出了基于MPSoC(MultiProcessor System-on-Chip)的软硬件协同加速的架构。在MPSoC的架构下,一方面,设计了面向硬件约束的矩阵分块方法,从而实现了通用的矩阵乘法加速器系统;另一方面,通过利用MPSoC下的多核架构,提出了相应的任务划分和负载平衡调度算法,提高了并行效率和整体系统加速比。实验结果表明,所提架构及算法实现了通用的矩阵乘法计算,并且通过软硬件协同设计实现的多核并行调度算法与传统单核设计相比在计算效率方面得到了显著的提高。  相似文献   

20.
GOTOBLAS一般矩阵乘法高效实现机制的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库。证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号