共查询到20条相似文献,搜索用时 296 毫秒
1.
对广义行(列)对称矩阵的QR分解和性质进行了研究,给出了广义行(列)对称矩阵的QR分解的公式和快速算法,它们可有效减少广义行(列)对称矩阵的QR分解的计算量与存储量,并且不会丧失数值精度。同时讨论了系统参数估计,推广和丰富了两文(邹红星,王殿军,戴琼海,等.行(或列)对称矩阵的QR分解.中国科学:A辑,2002,32(9):842-849;蔺小林,蒋耀林.酉对称矩阵的QR分解及其算法.计算机学报,2005,28(5):817-822)的研究内容,拓宽了实际应用领域的范围, 并修正了后者的错误。 相似文献
2.
酉对称矩阵的QR分解及其算法 总被引:11,自引:1,他引:10
该文讨论了酉对称矩阵QR分解中Q矩阵和R矩阵与母矩阵的Q矩阵和R矩阵之间的定量关系.从矩阵正交相抵的概念出发,给出了矩阵酉相抵的概念,证明了酉对称矩阵与母矩阵之间的酉相抵性,得到了酉相抵矩阵的Moore—Penrose逆等一些新的结论.同时,给出了酉对称矩阵的QR分解及其Moore—Penrose逆矩阵的算法. 相似文献
3.
研究了行(列)酉对称矩阵的性质,修正了行(列)酉对称矩阵的QR分解的公式和快速算法.结果可减少行(列)酉对称矩阵的QR分解的计算量与存储量,并且不会丧失数值精度. 相似文献
4.
刘千里 《计算机工程与应用》2012,48(26):71-75,161
在讨论了逆QR分解(逆正交三角分解)SM(I采样矩阵求逆)自适应波束形成算法的基础上,研究了逆QR分解SMI算法的Systolic阵列(脉动阵列)并行实现结构,分析了组成Systolic阵列的各PE(处理单元)单元的基本运算模块的实现,并给出了逆QR分解SMI算法基于Systolic阵列结构的FPGA(现场可编程门阵列)并行实现方法,提出了系统整体的设计与构架。 相似文献
5.
6.
在海洋数据同化领域,集合最优插值方法中,矩阵求逆过程所使用的奇异值分解(singular value decomposition,SVD)十分耗时。对集合最优插值中逆矩阵的求逆过程进行优化,分别使用LU分解、Choleskey分解、QR分解来替代SVD分解。首先,通过LU分解(Choleskey分解或QR分解)得到相应的三角矩阵(或正交矩阵);然后,利用分解后的矩阵来实现相关逆矩阵的计算。由于LU分解、Choleskey分解、QR分解的算法复杂度都远小于SVD分解,因此改进后的同化程序能得到大幅度的性能提升。数值结果表明,所采用的三种矩阵分解方法相比于SVD分解,都能将集合最优插值的计算效率提升至少两倍以上。值得一提的是,在四种矩阵分解中Choleskey分解使得整个同化程序的性能达到了最优。 相似文献
7.
8.
9.
10.
11.
12.
13.
广义稠密对称特征问题的求解是许多应用科学和工程的主要任务,并且是计算电磁学、电子结构、有限元模型和量子化学等计算中的重要部分。将广义对称特征问题转化为标准对称特征问题是求解广义稠密对称特征问题的关键计算步骤。针对GPU集群,文中给出了广义稠密对称特征问题标准化块算法在GPU集群上基于MPI+CUDA的实现。为了适应GPU集群的架构,广义对称特征问题标准化算法将正定矩阵的Cholesky分解与传统的广义特征问题标准化块算法相结合,降低了标准化算法中不必要的通信开销,并且增强了算法的并行性。在基于MPI+CUDA的标准化算法中,GPU与CPU之间的数据传输操作被用来掩盖GPU内的数据拷贝操作,这消除了拷贝所花费的时间,进而提高了程序的性能。同时,文中还给出了矩阵在二维通信网格中行通信域和列通信域之间完全并行的点对点的转置算法和基于MPI+CUDA的具有多个右端项的三角矩阵方程BX=A求解的并行块算法。在中科院计算机网络信息中心的超级计算机系统“元”上,每个计算节点配置2块Nvidia Tesla K20 GPGPU卡及2颗Intel E5-2680 V2处理器,使用多达32个GPU对不同规模矩阵的基于MPI+CUDA的广义对称特征问题标准化算法进行测试,取得了较好的加速效果与性能,并且具有良好的可扩展性。当使用32个GPU对50000×50000阶的矩阵进行测试时,峰值性能达到了约9.21 Tflops。 相似文献
14.
本文利用矩阵的初等变换技巧,对广义系统在EX=AX+Bu的解给出了一种新的计算方法,本方法只需对E,A进行初等行变换与列变换,即可求出原系统的解。同时指出该方法优于矩阵束方法和Drazin逆方法,并给出求解实例,在此基础上透视了广义系统的“树型”分层特征,这是广义系统的快子系统所具有的特点,这一特点恰恰反映了管理特征。 相似文献
15.
相对于扩频系统抑制窄带干扰的时域经典自适应滤波算法,基于QR分解的窄带干扰抑制方法是一种性能优良的新算法.研究了基于QR分解的RLS自适应滤波算法,考虑两种指数加权递归最小二乘(RLS)估计的算法--QR-RLS算法和逆QR-RLS算法,对扩频通信系统进行窄带干扰抑制.通过定义新的数据矩阵,该算法求解出数据域正规方程中的系数矩阵和右侧向量,从而提高了计算效率.最后用Matlab仿真了自适应滤波过程,仿真结果表明,该算法具有良好的计算性能以及收敛性能. 相似文献
16.
通过用能量协调条件限制应力空间构造六面体杂交元CHH(0-1)时,需要求解消耗大量机时的广义逆矩阵.本文给出了能量协调条件下应力的显式格式,避免了求解广义逆,这种新的方法在保留CHH(0-1)的高性能同时,大大提高了计算效率并更加容易编程实现. 相似文献
17.
对称矩阵三对角化的有效并行块算法设计 总被引:1,自引:0,他引:1
在矩阵数值计算中,块算法通常比非块算法更有效,但这也增加了并行算法设计和实现的难度.在广义稠密对称矩阵特征问题并行求解器中,并行块算法的构造可应用到正定对称矩阵的Choleski分解、对称矩阵的三对角化和回代转化(back-transiation)操作中.本文将并行块算法的讨论集中在具有代表性的对称矩阵三对角化上,给出在非块存储方式下对称矩阵三对角化的并行块算法设计方法.分析块算法大小同矩阵规模和处理器数量的关系.在深腾6800上的试验表明,我们的算法具有很好的性能,并得到了比ScaLAPACK更高的性能. 相似文献
18.
本文从符号计算(计算机代数)的观点,对数值矩阵计算理论中传统的奇异值分解算法及其相关的广义逆矩阵计算方法加以改进,使之适于处理符号矩阵且在计算机上实现.并指出其在矩阵理论及线性问题求解中的某些应用,还给出了一个有趣的物理实例. 相似文献
19.
针对彩色图像的版权保护问题,基于QR 矩阵分解提出了一种自嵌入全盲水印算
法。先将原始图像的G 通道分量进行非下采样剪切波变换,再对得到的低频分量分块QR 分解,
通过判断各子块R 矩阵中第一行元素向量的l1 范数与所有子块R 矩阵第一行元素l1 范数均值之
间的大小关系生成特征水印。然后对B 通道分量DWT 变换后的低频分量进行分块QR 分解,
并通过修改该子块QR 分解后R 矩阵中第一行最后一列元素来嵌入特征水印。特征水印的生成
和嵌入在两个通道内独立完成,水印检测无需原始载体图像,算法无需借助外加水印信息即可
完成对图像版权的鉴别。实验结果表明,该算法在经历添加噪声、JPEG 压缩、缩放、剪切和行
偏移等常见攻击时,具有很强的鲁棒性。 相似文献
20.
对于MIMO系统而言,其复杂度主要集中在检测上。在分析现有MIMO检测算法的基础上,给出了一种新的基于Givens旋转的排序QR分解检测器的实现方法。该方法通过将复数域的矩阵进行对称变换,转化到实数域进行QR分解,大大降低了运算量。依据上述方法,给出了硬件实现流程和模块结构图。软件仿真和硬件实现结果表明该检测方法在保证检测性能的基础上,大大降低了其硬件实现的复杂度,节省了FPGA中宝贵的乘法器资源和逻辑资源,保证了后续MIMO原理样机的研制。 相似文献