首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
一种LU分解与迭代法的结合策略及算法实现   总被引:3,自引:1,他引:3  
在矩阵求解算法中,直接法或迭代法都不能有效地求解大规模稀疏或病态矩阵,因此提出一种LU分解与迭代法结合的策略。采用LU分解对矩阵进行预处理,以提高迭代法的收敛性,并采用一种判断策略使矩阵的LU分解结果可最大限度地重复利用。此结合策略应用于两种共轭梯度(CG)法,得到CLUCG和CLUTCG两种算法。它们已应用于模拟和混合信号电路模拟器ZeniVDE中。大量实验结果表明此结合策略是很有效的,得到的两种算法具有较快的速度和较好的收敛性。  相似文献   

2.
一种基于矩阵LU分解的分段B样条插值法   总被引:6,自引:0,他引:6  
采用分段三次b样条曲线来光滑地连接采样点,满足了连续性要求;由于分段b样条插值控制点形成三对角线性方程组,通过矩阵的LU分解来求解该控制点方程组,实验结果表明,该方法快速地生成了通过所有采样点的光滑连续自由曲线,完全可以达到实时任务的要求。  相似文献   

3.
陈颖  林锦贤  吕暾 《计算机应用》2011,31(3):851-855
随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上.LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法.使用Nvidia公司的统一计算设备架构(CUDA)编程模型实现这两个算法,通过对CPU与GPU进行任务划分,同时利用GP...  相似文献   

4.
对稠密型线性方程组的系数矩阵进行分块LU分解,更充分地利用高速缓存,提高运算效率.对LU分解分块算法进行了研究,用VC+ +6.0对分块算法进行实现,并与标准的LU分解算法进行比较.在大矩阵情况下,分块算法比标准算法运算速度提高50%以上.  相似文献   

5.
针对现有的非负矩阵分解算法在应用于问题规模逐渐增大的情形时,运算规模随之增大、空间和时间效率不高的情况,提出一种增量式非负矩阵分解算法,使用分块矩阵的思想降低运算规模,利用上一步的分解结果参与运算从而避免重复运算。实验结果表明,该算法对节约计算资源是有效的。  相似文献   

6.
LU分解递归算法的研究   总被引:1,自引:0,他引:1  
陈建平 《计算机科学》2004,31(6):141-142
将递归方法引入稠密线性代数的计算,能产生自动的矩阵分块,使算法适合于当今分级存储高性能计算机的结构,提高运算速度。文中对解线性代数方程组的LU分解递归算法进行了研究,给出了算法的详细推导过程。  相似文献   

7.
并行LU分解的通信模式在WDM环网上的波长分配算法   总被引:2,自引:0,他引:2  
波长分配是光网络设计的基本问题,设计波长分配算法是洞察光网络通信能力的基本方法.不同的并行算法具有不同的通信模式,如何在光互连网上实现这些通信模式,是当前一个颇受关注的研究领域.本文基于WDM环网络,针对矩阵的并行LU分解,构造了一种并行LU分解的通信模式,讨论了将该通信模式嵌入在环形光网络中的波长分配问题.在解决该问题的过程中,得到了将一种特殊的二分图结构的通信模式嵌入在环网中的波长分配算法.通过分析和证明得到了在WDM环网上实现该并行LU分解通信模式所需的最小波长数.  相似文献   

8.
将矩阵An×n的Doolittle分解推广到Am×n上,并在常规的迭代算法上加以创新,给出了递归的分解算法.在实现算法的过程中,对数据进行了巧妙处理,使中间数据及最终计算结果都具有分数形式,提高了结果的精确度,而且更符合人们阅读的习惯.经过运行测试,算法设计合理,程序运行高效准确.程序是对MathSoft公司的交互式的数学文字软件Mathcad的矩阵分解的数值计算扩充到符号运算.  相似文献   

9.
给出批量矩阵的LU分解和批量求逆算法在GPU上实现及优化方法.针对批量LU分解问题,分析Left-looking和Right-looking等常用LU分解块算法在GPU上实现时对全局内存的数据读写次数,针对GPU架构特点,选择具有较少访存数据量的Left-looking块算法.在LU分解的选主元过程,采用适合GPU架构的并行二叉树搜索算法.此外,为了降低选主元引起的行交换过程对算法性能的影响,提出Warp分组行交换和行交换延迟2个优化技术.针对LU分解后的批量求逆问题,分析矩阵求逆过程中修正方法,为了减少修正过程对全局内存的访问,在批量求逆的GPU实现中采用延迟修正的矩阵求逆块算法.同时,为了加快数据读写速度,采用更多利用寄存器和共享内存的优化方法和减少访存数据量的列交换优化方法.另外,为了避免线程的闲置和共享内存等GPU资源浪费,提出运行时动态GPU资源分配方法,相较于一次性分配的静资源分配方法性能得到明显提升.最终,在TITAN V GPU上,对10000个规模在33–190之间的随机矩阵进行测试,测试的数据类型为单精度复数、双精度复数、单精度实数和双精度实数.所实现的批量LU分解算法的浮点计算性能分别可达到约2 TFLOPS、1.2 TFLOPS、1 TFLOPS、0.67 TFLOPS,与CUBLAS中的实现相比加速比最高分别达到了约9×、8×、12×、13×,与MAGMA中的实现相比加速比分别达到了约1.2×–2.5×、1.2×–3.2×、1.1×–3×、1.1×–2.7×.批量求逆算法的浮点计算性能分别可达到约4 TFLOPS、2 TFLOPS、2.2 TFLOPS、1.2 TFLOPS,与CUBLAS中的实现相比加速比最高分别达到了约5×、4×、7×、7×,与MAGMA中的实现相比加速比分别达到了约2×–3×、2×–3×、2.8×–3.4×、1.6×–2×.  相似文献   

10.
素数分解两种实现算法   总被引:1,自引:0,他引:1  
简小庆 《电脑学习》2001,(4):28-29,41
用计算机做大素数分解,基于计算复杂性理论原理,当分解的素数是NP-完全问题的时候,采用了二种查找验算程序即:试除法、素数因子法、并给出了算法流程图和程序清单。  相似文献   

11.
矩阵分解已经成为预测用户对物品评分的一种常用方法。传统的矩阵分解技术没有考虑到用户评分之间的差异性,针对上述问题在矩阵分解的基础上,提出差值矩阵分解模型。算法将每个用户对物品的评分减去与其社会属性相似用户对该物品评分的平均分,得到一个差值矩阵,然后对差值矩阵进行分解。在Movielens 1M数据集的实验结果表明,该算法的预测精度较贝叶斯概率矩阵分解、矩阵分解、融合用户属性的隐语义模型都有较为明显的提升。  相似文献   

12.
求解线性代数方程组是工程上经常遇到的问题,而它们的系数矩阵又往往是大型稀疏矩阵。文章介绍了一种简单易行,并且已经用C语言实现了的求解这类方程组的压缩算法。最后,还对压缩和非压缩算法进行了比较。  相似文献   

13.
王新亮  黄仁 《计算机应用》2002,22(10):15-17
提出了一种关联规则挖掘新算法:逆向“跳跃式”地分解高淮频繁项集产生低维频繁项集,直接分解高维关联规则得到低维关联规则。该算法显著减少了已有算法中产生频繁项集及扫描大规模数据库的操作,性能改善明显。  相似文献   

14.
为了改善古典迭代法的收敛速度,本文提出一种带参数的新预条件方法,并对参数的选择给出必要条件,证明了对于非奇异不可约M一矩阵,新预条件方法收敛且可以加速Gauss—Seidel迭代法的收敛速度,数值例子表明新预条件方法是有效的.  相似文献   

15.
对称正定矩阵的并行LDLT分解算法实现   总被引:1,自引:0,他引:1  
基于网络机群这一新的并行环境和消息传递界面MPI给出了两种不带平方根的Cholesky并行分解算法,算法采用行卷帘存储方案和提前发送策略,从而减少了负载的不平衡,增加了计算通信的重叠,减少了通信时间。理论分析和数值试验均表明,算法具有较高的并行加速比和效率。  相似文献   

16.
针对标准的QSIM算法对于复杂系统推理求解时会产生不可控分枝问题,提出一个分解仿真方法--SRSIM算法。应用聚类分析方法将定性模型分解成单元,对单元分开单独应用QSIM推理,对单元间的关系通过约束传播使得子模型推理一致。这种分解仿真算法可大大降低QSIM算法的不可控分枝,提高系统的仿真效率。  相似文献   

17.
针对标准的QSIM算法对于复杂系统推理求解时会产生不可控分技问题,提出一个分解仿真方法-SRSIM算法.应用聚类分析方法将定性模型分解成单元,对单元分开单独应用QSIM推理,对单元间的关系通过约束传播使得子模型推理一致.这种分解仿真算法可大大降低QSIM算法的不可控分枝,提高系统的仿真效率.  相似文献   

18.
Cholesky分解递归算法与改进   总被引:10,自引:0,他引:10  
递归算法是计算稠密线性代数的一种新的有效方法。递归产生自动、变化的矩阵分块,能充分发挥当今分级存储高性能计算机的效率。对Cholesky分解递归算法进行了研究,给出了算法的详细推导过程,用具有递归功能的Fortran90实现了算法,并通过矩阵元素顺序重排的方法,进一步提高了递归算法的运算速度。研究产生的算法比目前常用的分块算法快15%-25%。  相似文献   

19.
现有的基于矩阵LU分解的传感网密钥预分配方案容易遭受LU攻击.针对该问题,采用扰动技术干扰LU分解的结果矩阵,并结合随机共享比特串截取方法,使得共享密钥难以计算,进而提出了一种抗LU攻击的传感器网络密钥预分配方案.通过有效调节噪声因子大小、密钥组件长度、密钥组件计算轮数等参数,节点仅需预分配一定数量的密钥材料,就能以较高的安全概率建立配对密钥.经过与典型方案的对比分析与讨论,结合可行性分析,证明了所提方案不仅适用于传感器网络,更能够有效抵抗窃听攻击、LU攻击和节点捕获攻击.  相似文献   

20.
为了解决数据稀疏性对推荐算法预测准确度的影响,本文提出了一种融合社交信任的矩阵分解推荐算法.在相关数据集上实验结果表明,预测的平均绝对误差和均方根误差都得到了明显的改善.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号