首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
矩阵运算广泛应用于各类电路计算中,矩阵运算的硬件实现能够充分发挥硬件的速度和并行性。其中矩阵求逆是矩阵运算中重要的运算。为加速矩阵求逆,研究构造出一种非常易于实现的基于心动阵列的矩阵求逆的电路结构。通过硬件描述语言Verilog建模,VCS仿真及用Design Compile进行综合,结果表明这种并行结构能快速实现矩阵求逆,且运算精度较高。  相似文献   

2.
研究机载雷达平台问题,空时自适应处理(STAP)是新一代机载相控阵雷达杂波抑制与目标检测的关键技术.在工程化过程中.运算量巨大是其面临的首要问题.为了改善STAP在采样矩阵维数较高情况下求逆运算的实时性能和有效提高雷达抑制杂波和抗干扰能力,提出了一种改进的Strassen矩阵求逆算法,算法结合了Strassen矩阵求逆的高效性以及采样协方差矩阵是Hermite正定阵的特点,具有运算最小,算法结构简单,便于工程实现的优点.DSP处理器的实测数据证明了方法的有效性和可行性.结果表明与目前工程中改进方法性能改善效果明显.  相似文献   

3.
林军 《电脑学习》2000,(1):42-44
对矩阵求逆的选全土元变量置换法、LU分解法、Householder变找法及共轭斜量法这四种算法并给实用程序,并从运算速度、运算精度和占用存储空间大小诸方面作了简单比较。  相似文献   

4.
给出了用于研究客户关系管理(Customer Relationship Management,CRM)模型中的一类马氏链数学模型(Pfeifer模型)的收益期望值的解析解(无限次交易条件下),以方便该类模型的研究和分析。借助于求逆公式,将V=(I-P-1R方程中矩阵求逆部分进行分解和简化,解出矩阵逆的解析解,从而求解出该类模型收益期望值向量的解析解,并推广到n阶。基于该解析解,对该类模型收益总期望值的特性进行了简单分析和讨论,该收益期望值的解析解将给该类方程的解析分析提供帮助。  相似文献   

5.
矩阵运算广泛应用于各类电路计算中,矩阵运算的硬件实现能够充分发挥硬件的速度和并行性.其中矩阵求逆是矩阵运算中重要的运算.为加速矩阵求逆,研究构造出一种非常易于实现的基于心动阵列的矩阵求逆的电路结构.通过硬件描述语言Verilog建模,VCS仿真及用Design Compile进行综合,结果表明这种并行结构能快速实现矩阵求逆,且运算精度较高.  相似文献   

6.
本文通过对矩阵的逆以及逆矩阵的探讨,归纳出几种求逆矩阵的方法。  相似文献   

7.
本文给出了(n1,n2,…,nk)型k重(r1,r2,…,rk)-循环矩阵求逆的快速算法,其计算复杂性为O[(Ⅱ↑ki=1ni)logsⅡ↑ki=1ni]。  相似文献   

8.
在海洋数据同化领域,集合最优插值方法中,矩阵求逆过程所使用的奇异值分解(singular value decomposition,SVD)十分耗时。对集合最优插值中逆矩阵的求逆过程进行优化,分别使用LU分解、Choleskey分解、QR分解来替代SVD分解。首先,通过LU分解(Choleskey分解或QR分解)得到相应的三角矩阵(或正交矩阵);然后,利用分解后的矩阵来实现相关逆矩阵的计算。由于LU分解、Choleskey分解、QR分解的算法复杂度都远小于SVD分解,因此改进后的同化程序能得到大幅度的性能提升。数值结果表明,所采用的三种矩阵分解方法相比于SVD分解,都能将集合最优插值的计算效率提升至少两倍以上。值得一提的是,在四种矩阵分解中Choleskey分解使得整个同化程序的性能达到了最优。  相似文献   

9.
本论文提出了一种便于ASIC实现的矩阵求逆算法,可以完成对1到16维下三角复矩阵的求逆运算,并用Verilog硬件描述语言进行实现.利用SMIC 0.13um工艺库和Synopsys公司的Design Compiler工具对代码进行了综合,并进行了低功耗优化,最后使用Modelsim工具对代码进行了仿真验证,得到的结果同C代码模拟的结果完全一致,证明本模块完全可以达到预期目的.  相似文献   

10.
Toeplitz矩阵之逆矩阵的新分解式及快速算法   总被引:2,自引:0,他引:2  
本文利用线性方程组是否有解给出了Toeplitz矩阵可逆的条件,表明Toeplitz矩阵的逆矩阵可以表示为循环矩阵与下三角Toeplitz矩阵的乘积之和,给出了其逆矩阵列的递推公式,得到了求Toeplitz矩阵之逆矩阵的快速算法,计算复杂性为O(n2),一般n阶矩阵求逆的计算复杂性为O(n3).  相似文献   

11.
给出批量矩阵的LU分解和批量求逆算法在GPU上实现及优化方法.针对批量LU分解问题,分析Leftlooking和Right-looking等常用LU分解块算法在GPU上实现时对全局内存的数据读写次数,针对GPU架构特点,选择具有较少访存数据量的Left-looking块算法.在LU分解的选主元过程,采用适合GPU架构的并行二叉树搜索算法.此外,为了降低选主元引起的行交换过程对算法性能的影响,提出Warp分组行交换和行交换延迟2个优化技术.针对LU分解后的批量求逆问题,分析矩阵求逆过程中修正方法,为了减少修正过程对全局内存的访问,在批量求逆的GPU实现中采用延迟修正的矩阵求逆块算法.同时,为了加快数据读写速度,采用更多利用寄存器和共享内存的优化方法和减少访存数据量的列交换优化方法.另外,为了避免线程的闲置和共享内存等GPU资源浪费,提出运行时动态GPU资源分配方法,相较于一次性分配的静资源分配方法性能得到明显提升.最终,在TITAN V GPU上,对10 000个规模在33–190之间的随机矩阵进行测试,测试的数据类型为单精度复数、双精度复数、单精度实数和双精度实数.所实现的批量LU分解...  相似文献   

12.
计算空气动力学的高阶面元法中,将原来位流升力面理论中求解积分方程的问题近似改成求解一组线性代数方程组。针对系数矩阵的特点,采用与所分网络块对应的数据分配方式,并用部分选主元的Gauss-Jordan算法求逆。分别在4台和8台Pentium166微机组成的并行虚拟机上运行。当矩阵阶达到2100时,并行效率分别为95.4%和91%。  相似文献   

13.
稀疏近似逆预条件子及其并行计算   总被引:1,自引:0,他引:1  
文中使用范数极小技术,提出一种构造稀疏矩阵并行近似逆预条件子的方法,所构造的稀疏矩阵近似逆的稀疏结构和数据矩阵的转置矩阵相同,计算量和存储量上,其求解过程易于并行。且并行计算不影响其收敛效果。通过试算表明,该方法对很多问题的求解具有明显的加速效果。文中给出了该方法的并行算法,并提出了一种自适应分配算法来解决负载平衡问题。  相似文献   

14.
在讨论了逆QR分解(逆正交三角分解)SM(I采样矩阵求逆)自适应波束形成算法的基础上,研究了逆QR分解SMI算法的Systolic阵列(脉动阵列)并行实现结构,分析了组成Systolic阵列的各PE(处理单元)单元的基本运算模块的实现,并给出了逆QR分解SMI算法基于Systolic阵列结构的FPGA(现场可编程门阵列)并行实现方法,提出了系统整体的设计与构架。  相似文献   

15.
公钥密码体制建立在有限域上本文针对二元域上操作复杂的基本运算求逆,将软件应用中效率较高的殆逆算法移植到FPGA中,利用其分步特点达到较低延迟,并利用度数和乘法的规律性缩减执行周期,以较小硬件开销增量换取了较大的性能提高.且模块又可能对多个二元域通用.此外,方案同样适用于软件求逆.  相似文献   

16.
矩阵理论不但是经典数学的基础,同时又是很有实用价值的数学理论,它是工程技术以及经济管理等领域的不可缺少的数学工具,其中逆矩阵又是矩阵理论中一个非常重要的概念,矩阵求逆运算在线性预测,误差控制码,图像处理及3D运算中很常见。计算机的广泛应用为矩阵理论的应用开辟了广阔的应用前景。为了提高运算速度,增强其性能,选择一种好的算法显得尤为重要。本文简单介绍了几种矩阵求逆方法,其中详细介绍了全选主元Gauss-Jordan快速求逆算法,进行了算法分析,并编程实现了用此种方法对矩阵进行求逆运算。在此基础之上介绍了矩阵求逆在北斗双星定位系统上的应用。基于双星导航定位系统存在的缺点介绍了利用3颗卫星的导航定位系统,它可以消除双星导航定位系统存在的两大缺点—用户位置易暴露和系统用户数量容易饱和。因此,为我国发展卫星导航定位系统提供了一种新思路。  相似文献   

17.
根据分块三对角矩阵逆矩阵的特殊结构,利用其LU和UL分解,并使用Sheman-Morrison-Woodbury公式,得到一个求分块周期三对角矩阵逆矩阵的新算法,并由该算法得到求周期三对角矩阵和对称周期三对角矩阵逆矩阵的新算法。新算法比传统算法的计算复杂度和计算时间要低。  相似文献   

18.
将计算实矩阵的Moore-Penrose逆和Drazin逆转化为线性矩阵方程组的求解问题,然后采用修正共轭梯度法求线性矩阵方程组的一般解,并通过简单的矩阵乘法运算或者直接得到实矩阵的Moore-Penrose逆和Drazin逆.修正共轭梯度法不同于通常的共轭梯度法,它不要求涉及的线性代数方程组的系数矩阵正定、可逆或者列满秩,因此总是可行的.数值算例表明,这种算法是有效的.  相似文献   

19.
对行对称矩阵的QR分解进行了研究,在此基础上给出了求行对称矩阵广义逆的快速求解公式,并给出了证明。将QR分解方法应用于该类行对称矩阵的广义逆的求解过程,既利用了QR分解保证足够的精度,又可大大降低求解一类具有该结构矩阵的广义逆的计算量和存储量。  相似文献   

20.
针对二元域上基本运算求逆操作的复杂性问题,将软件应用中效率较高的求逆算法移植到现场可编程门阵列中,利用其分步特点获取较低延迟,并采用度数和乘法的规律性对执行周期进行缩减,以较小的硬件开销增量换取较大的性能提高。仿真实验结果表明,该模块能够适用于多个二元域及软件求逆。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号