首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 984 毫秒
1.
矩阵运算广泛应用于各类电路计算中,矩阵运算的硬件实现能够充分发挥硬件的速度和并行性.其中矩阵求逆是矩阵运算中重要的运算.为加速矩阵求逆,研究构造出一种非常易于实现的基于心动阵列的矩阵求逆的电路结构.通过硬件描述语言Verilog建模,VCS仿真及用Design Compile进行综合,结果表明这种并行结构能快速实现矩阵求逆,且运算精度较高.  相似文献   

2.
AES中S盒是一个非线性的字节代替变换,在AES算法中占有较大的比重,也是整个AES加解密硬件实现的关键模块.分析基于费马定理的正逆S盒算法原理及特点,使用Verilog HDL设计可逆S盒电路,通过FPGA实现正逆S盒运算.电路引入可装配的流水线结构,设计一种小规模、快速的可逆S盒运算电路,既可实现正S盒运算,又可实现逆S盒运算,加速S盒运算的过程,减小AES加解密电路的规模,对AES算法的硬件实现具有实际价值.  相似文献   

3.
《电子技术应用》2017,(5):38-40
为降低新一代高效视频编码(HEVC)标准中解码端多尺寸逆离散余弦变换(Inverse Discrete Cosine Transform,IDCT)中的资源消耗,设计了一种IDCT硬件电路结构。通过使用现场可编程门阵列(Field-Programmable Gate Array,FPGA)内部嵌入式RAM单元进行矩阵转置运算,从而减少了对内部寄存器的使用。对IDCT系数矩阵进行分解得到不同尺寸下的统一运算电路结构,利用流水线技术实现对运算单元的加速,同时采用并行数据调度减少数据处理等待时间。设计结果表明,设计吞吐量为3.6点/时钟周期,满足了4k×2k@30 f/s视频信号的实时处理需求。  相似文献   

4.
本文通过多项式矩阵系数矩阵的简单运算,给出了有理分式矩阵求逆的一种新方法.这种方法可在计算机上实现.  相似文献   

5.
在讨论了逆QR分解(逆正交三角分解)SM(I采样矩阵求逆)自适应波束形成算法的基础上,研究了逆QR分解SMI算法的Systolic阵列(脉动阵列)并行实现结构,分析了组成Systolic阵列的各PE(处理单元)单元的基本运算模块的实现,并给出了逆QR分解SMI算法基于Systolic阵列结构的FPGA(现场可编程门阵列)并行实现方法,提出了系统整体的设计与构架。  相似文献   

6.
研究机载雷达平台问题,空时自适应处理(STAP)是新一代机载相控阵雷达杂波抑制与目标检测的关键技术.在工程化过程中.运算量巨大是其面临的首要问题.为了改善STAP在采样矩阵维数较高情况下求逆运算的实时性能和有效提高雷达抑制杂波和抗干扰能力,提出了一种改进的Strassen矩阵求逆算法,算法结合了Strassen矩阵求逆的高效性以及采样协方差矩阵是Hermite正定阵的特点,具有运算最小,算法结构简单,便于工程实现的优点.DSP处理器的实测数据证明了方法的有效性和可行性.结果表明与目前工程中改进方法性能改善效果明显.  相似文献   

7.
在阵列信号抗干扰算法中,常常需要求解协方差矩阵的逆矩阵。Cholesky分解利用了协方差矩阵的厄米特(Hermitian)正定的特性,大大简化了矩阵求逆运算的计算量。论文介绍了Cholesky分解数学原理,并提出了一种适合FPGA实现的结构。基于浮点数的算法实现相比传统的定点数,大大提高了结果的精度。由于Cholesky分解需要涉及浮点数的开方运算,论文引入了平方根倒数法来提高开方运算的速度。通过仿真与实测,选取了最优的资源与速度的实现方案。  相似文献   

8.
一种辨识多变量系统结构和参数地递推算法*   总被引:1,自引:0,他引:1  
本文基于Guidorzi方法,提出一种辨识多变量系统结构和参数的递推算法。本算法通过对矩阵进行分解,根据分解过程中某参数的变化情况,判断矩阵的奇异性,从而辨识出系统的结构和参数,使得原来对矩阵求逆及求行列式的运算变为简单的代数运算,大大减少了辨识过程中的计算量,数值实例表明了这种算法的有效性。  相似文献   

9.
矩阵理论不但是经典数学的基础,同时又是很有实用价值的数学理论,它是工程技术以及经济管理等领域的不可缺少的数学工具,其中逆矩阵又是矩阵理论中一个非常重要的概念,矩阵求逆运算在线性预测,误差控制码,图像处理及3D运算中很常见。计算机的广泛应用为矩阵理论的应用开辟了广阔的应用前景。为了提高运算速度,增强其性能,选择一种好的算法显得尤为重要。本文简单介绍了几种矩阵求逆方法,其中详细介绍了全选主元Gauss-Jordan快速求逆算法,进行了算法分析,并编程实现了用此种方法对矩阵进行求逆运算。在此基础之上介绍了矩阵求逆在北斗双星定位系统上的应用。基于双星导航定位系统存在的缺点介绍了利用3颗卫星的导航定位系统,它可以消除双星导航定位系统存在的两大缺点—用户位置易暴露和系统用户数量容易饱和。因此,为我国发展卫星导航定位系统提供了一种新思路。  相似文献   

10.
多变量线性系统的递推辨识算法   总被引:1,自引:1,他引:0  
变量系统的结构辨识是很麻烦的,Guidorzi[1]提出了一个辨识不变性指标的方法,但 必须用矩阵求逆.本文给出一个递推确定结构指标的算法,不需要求行列式的运算,并且一旦 确定了子系统结构,随即得到参数估计值,没有重复的运算.所需计算量比Guidorzi[1]方法 大大减少.  相似文献   

11.
根据某大型双层柱面网壳风致静力响应计算的有限元模型,建立基于GPU的MATLAB快速并行计算平台,实现CUDA框架下多自由度结构风致静力位移响应的快速求解.数值计算表明,与传统的CPU串行计算相比,通过GPU实现的大型矩阵的求逆、乘法、除法等运算速度得到大幅提高,位移计算获得23倍的最大加速比;结果误差对比分析也表明基于GPU的计算结果能够满足工程精度要求.  相似文献   

12.
针对含有非线性连接的大型局部非线性结构,采用描述函数表示其所连接的非线性内力,将非线性结构频响表示为拟线性动柔度矩阵(Quasilinear Receptance Matrix),提出一种逆阵更新(Inverse Matrix Updating Method,IMU)方法,将求解系统动柔度(频响特性)的高阶矩阵求逆转化为低阶矩阵的求逆,从而获得大型局部非线性结构主频响应的快速计算方法.仿真结果表明,本文的分析方法具有较好的稳定性,并能大幅提高大型局部非线性结构主频响应的计算效率.  相似文献   

13.
GPU 上的矩阵乘法的设计与实现   总被引:1,自引:0,他引:1  
矩阵乘法是科学计算中最基本的操作,高效实现矩阵乘法可以加速许多应用。本文使用NVIDIA的CUDA在GPU上实现了一个高效的矩阵乘法。测试结果表明,在Geforce GTX260上,本文提出的矩阵乘法的速度是理论峰值的97%,跟CUBLAS库中的矩阵乘法相当。  相似文献   

14.
基于二进制区分矩阵的约简算法研究   总被引:1,自引:1,他引:1  
杨帆  朱新坚  曹广益 《计算机仿真》2007,24(2):79-83,140
给出了一种基于二进制区分矩阵的约简方法.首先基于粗糙集理论定义了二进制区分矩阵及运算规则、基于二进制区分矩阵的最小约简的判别及属性重要性的计算方法.在定义的基础上,给出了基于二进制区分矩阵的求核算法、相对属性约简算法及值约简算法.该约简方法以位操作为主与传统的约简方法比较不包括复杂的逻辑化简和集合运算,在一定程度上简化了计算,提高了约简效率.将该算法应用于数字电路设计的开关电路综合中,得到最简数字电路的逻辑表达,从而说明了算法的有效性.  相似文献   

15.
针对MEC(memory efficient convolution)卷积算法在传统设备下因访问数据地址不连续导致的缓存命中率低、内存访问延时长等问题,提出一种适用于MEC算法访存行为的优化方法。该方法分为中间矩阵转换和矩阵运算两部分。对于中间矩阵转换部分,采用修改数据读取顺序的方式对其进行优化,使读取方式符合算法的访存行为。对于矩阵运算部分,采用更加适合矩阵运算的内存数据布局对卷积核矩阵修改,并利用TVM(tensor virtual machine)平台封装的计算函数,重新设计中间矩阵同卷积核矩阵的计算方式。使用平台自带并行库对运算过程进行加速。实验结果表明,相比传统MEC算法,提出的优化方法可以有效解决缓存命中率低、内存访问延时长等问题,同MEC算法的运算时间对比,在单个卷积层上平均获得了50%的速度提升,在多层神经网络中最低获得了57%以上的速度提升,同空间组合算法的运算时间对比,最高获得了80%的速度提升。  相似文献   

16.
麻莹莹  马振威  陈钢 《软件学报》2021,32(6):1882-1909
矩阵是工程领域中常用的一种数据结构,在深度学习领域,矩阵乘法是神经网络训练中的核心技术之一,面对大型矩阵的运算问题,分块矩阵技术可将大矩阵运算转换为小矩阵运算以实现并行运算,并且能够大幅度减少矩阵运算步骤并且提高矩阵运算速度.本文首先对目前学术界的矩阵形式化工作进行了系统总结并且分析了矩阵形式化的主要几种方法;其次介绍并完善了基于Coq记录类型的矩阵形式化方法,其中包括提出新的矩阵等价定义、对之前的形式化工作进行了整理和完善,并证明了一组新的引理;在此基础上进一步实现了分块矩阵运算的形式化,讨论了该类型的归纳证明的难点和解决方法;最终实现了矩阵与分块矩阵形式化的不同类型的基础库.  相似文献   

17.
梁海华  盘丽娜 《计算机应用》2013,33(7):1833-1835
循环冗余校验(CRC)是计算机网络中常用的冗余校验方法。针对现有的正序(FIFO)校验方法只能对编码寄存器为零初始状态时生成的校验值正确校验的问题,提出一种逆序(LIFO)校验方法。首先,使用状态矩阵对两类串行编码电路进行分析,理论上证明状态矩阵可逆,由逆矩阵变换得出串行逆序校验方法及其电路;通过电路分析,可将串行逆序方法扩展为快速并行逆序方法,无须预补零操作,简化了计算流程。通过实例计算,验证了并行逆序方法能够对任意初始状态生成的校验值正确校验;仿真结果表明该方法具有与并行正序校验方法近似的运算速度。  相似文献   

18.
采用列压缩稀疏(Compressed Sparse Column,CSC)矩阵存储策略对矩阵LDL分解前进行填充元优化排序;基于消去树进行LDL符号分解,使之独立于数值分解,避免多余的内存消耗,减少不必要的数值运算.利用矩阵非零元的分布特性分析并实现超节点LDL分解算法,将稀疏矩阵的分解运算变为一系列稠密矩阵运算,并使用优化的BLAS函数库加速分解.测试表明:算法在成倍地提高计算速度的同时进一步降低内存消耗,适用于大规模的结构计算.  相似文献   

19.
绝大多数通讯信号都具有周期平稳信号特性。利用信号的周期平稳特性可以进行真正的盲自适应波束形成,因而受到了广泛关注。鲁棒CAB(R-CAB)算法就是其中的一种,但其中涉及矩阵求逆,运算量很大。波束形成属于多维信号处理问题,阵列中阵元数的增加导致运算量成几何级数增加。文中提出了一种盲神经网络波束形成算法。由于神经网络具有网状计算结构的特点,故该方法不仅避免了矩阵求逆运算,同时更便于实时实现。该方法还利用对角加载技术,从而加快了收敛速度,保证了算法的鲁棒性。仿真实验表明其性能优越,易于电路实现  相似文献   

20.
鉴于Larsen等人利用图形处理器(GPU)的多纹理技术做矩阵运算操作,以实现GPU在矩阵相乘方面的通用计算,提出一种利用GPU和CPU的协同处理模式,应用在基于层次聚类的动态近邻选择模型的聚类算法(DNNS)中,将算法中比较耗时的邻接度矩阵计算步骤交由GPU完成,而算法其余步骤由CPU执行,从而使算法的聚类效率得到显著提高。在配有Pentium IV 3.4 G CPU和NVIDIA GeForce 7800GT显卡的硬件环境下经过实验测试,证明这种协同处理模式下的运算速度比完全采用CPU计算速度要快25%左右。这种改进的层次聚类算法适合在数据流环境下对大量数据进行实时高效聚类操作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号