首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于投影算法所得压力Poisson方程进行数值离散,对离散系统形成的稀疏线性方程组,由于线性方程组的系数矩阵存在大量的零元素,为降低内存存储,本文以一维稀疏存储结构对大规模的系数矩阵进行压缩处理,只存储非零元素。同时,以具有优化性质的BiCGSTAB算法求解压力Poisson方程,显著的提高了计算效率。在相同初始条件下,利用Fortran90完成超松弛迭代法的程序求解压力Poisson方程数值离散所得到的线性方程组进行求解对比。结果表明基于压缩存储的BiCGSTAB算法在求解稀疏线性方程组具有明显的优势,该算法求解速度快、高效、可靠。  相似文献   

2.
大型稀疏线性方程组新的ICCG方法   总被引:2,自引:0,他引:2  
有限元线性方程组的系数矩阵一般具有稀疏性和对称性的特点,全稀疏存贮方法就是利用这些特点,只存贮对称部分的非零元素,采用链表式管理,即节省存贮空间,又便于动态更改.在完全Cholesky分解的基础上,构造出了新的预处理方法,应用适当的对角元修正策略,得到了一种新的ICCG方法,能够确保方程组高效准确的分解和求解.数值算例证明该算法在时间和存贮上都较为占优,可靠高效,能够应用于有限元线性方程组的求解.  相似文献   

3.
偏微分方程数值解法(包括有限差分法、有限元法)以及大量的数学物理方程数值解法最终都会演变成求解大型线性方程组。因此,探讨快速、稳定、精确的大型线性方程组解法一直是数值计算领域不断深入研究的课题且具有特别重要的意义。在迭代法中,共轭斜量法(又称共轭梯度法)被公认为最好的方法之一。但是,该方法最大缺点是仅适用于线性方程组系数矩阵为对称正定矩阵的情况,而且常规的CPU算法实现非常耗时。为此,通过将线性方程组系数矩阵作转换成对称矩阵后实施基于GPU-CUDA的快速共轭斜量法来解决一般性大型线性方程组的求解问题。试验结果表明:在求解效率方面,基于GPU-CUDA的共轭斜量法运行效率高,当线性方程组阶数超过3000时,其加速比将超过14;在解的精确性与求解过程的稳定性方面,与高斯列主元消去法相当。基于GPU-CUDA的快速共轭斜量法是求解一般性大型线性方程组快速而非常有效的方法。  相似文献   

4.
块对角占优性与对称矩阵的块对角预条件   总被引:4,自引:0,他引:4  
§1.引言 稀疏线性方程组的求解在科学计算与工程应用中非常重要。在材料模拟与设计、电磁场计算、计算流体力学和核爆数值模拟等领域中经常要求解微分方程,并通过有限元或有限差分与有限体积等方法进行离散,化为非线性方程组或稀疏线性方程组。非线性方程组的求解  相似文献   

5.
杨鹏  赵辉  鲍忠贵 《计算机应用》2016,36(3):653-656
针对共享资源矩阵法在系统隐蔽通道检测过程中存在的算法时间复杂度高的问题,提出了一种基于双十字链表存储的改进算法。首先,针对共享资源矩阵方法中的核心操作——传递闭包操作,将传统的数组存储改进为双十字链表存储;其次,针对共享资源矩阵方法建立了概率模型;最后,在该概率模型下,分析了改进算法的时间复杂度和共享资源矩阵方法的特性。理论分析和实验仿真表明:当共享资源矩阵为稀疏矩阵时,采用基于双十字链表存储的改进算法能够使共享资源矩阵法的时间效率相比传统的数组存储提高67%;当共享资源矩阵的规模较大时,传递闭包操作会使得共享资源矩阵中的元素快速填充,从而导致基于双十字链表存储改进算法相比传统数组存储的时间效率优势下降,并在概率模型下通过理论推导验证了传递闭包操作的这一特性。  相似文献   

6.
工程领域中的许多问题都可以转化为微分方程的求解问题.由于存在多个附加条件,求解偏微分方程数值解比较困难.为解决上述问题,根据传统的有限差分法求解过程,提出了粒子群智能优化算法解决问题的求解步骤和具体策略.利用有限差分法将偏微分方程转化为较简单的线性方程组,指出新的适合具体方程组的适应值函数后,用改进的基于变尺度的粒子群优化算法将其转变为变分优化问题进而来求解线性方程组.通过仿真比较,改进的算法求解过程简单,控制参数少,数值实验表明算法有较好的效果和适用性.  相似文献   

7.
研究基于GPU的有限元求解中的总刚矩阵生成和线性方程组求解问题.通过对单元着色和分组完成总刚矩阵的生成,并以行压缩存储(Compressed Sparse Row,CSR)格式存储,用预处理共轭梯度法求解所生成的大规模线性稀疏方程组.在CUDA(Compute Unified Device Architecture)平台上完成程序设计,并用GT430 GPU对弹性力学的平面问题和空间问题进行试验.结果表明,总刚矩阵生成和方程组求解分别得到最高11.7和8的计算加速比.  相似文献   

8.
基于有限元总刚矩阵的大规模稀疏性、对称性等特性,采用全稀疏存储结构以及最小填入元算法,使得计算机的存储容量达到最少。为了节省计算机的运算时间,对总刚矩阵进行符号LU分解方法,大大减少了数值求解过程中的数据查询。这种全稀疏存储结构和符号LU分解相结合的求解方法,使大规模稀疏线性化方程组的求解效率大大提高。数值算例证明该算法在时间和存贮上都较为占优,可靠高效,能够应用于有限元线性方程组的求解。  相似文献   

9.
二阶椭圆型微分方程边值问题的数值求解在实践中具有重要的意义。当用差分法解这类问题时,结果就要求解一类线性代数方程组,这类方程组的系数矩阵具有一些特殊的结构和性质。以矩形区域上的二维问题为例,若用矩形网格,节点按自然次序编号,用通常的五点格式所得方程组的系数矩阵是块三对角的。用“矩阵追赶法”解这类问题效果很差,即计算量和存储量相当大而精度差。问题在于,这种解法中有许多矩阵求逆运算,而这些矩阵中有些可能是病态的。矩阵追赶法的一些变形(见[2]、[3]等),结果也常归结到一个病态方程组的求解,因而大大影响精度。同时,仍有要求存储量大和计算过程不稳定等缺点。用Gauss主元消去法或Crout方法等,由于非零元素的大量充入,破坏原来矩阵的稀疏性,使存储量增大。  相似文献   

10.
节点导纳矩阵是一个稀疏矩阵,短路电流计算需要对导纳矩阵数据进行查询。为了既能保持快速按行列查询元素数值,又进一步提高按数值查询其所在行列的效率,以便于存储调用及后续矩阵的处理,提出构建高度平衡二叉树的改进十字链表方法,即在十字链表存储的基础上,拓展存储数据结点指针域,形成平衡二叉树,将高度维持在(O(log2n)),平均查找长度也可维持在(O(log2n)),大大降低操作时间复杂度,提高数值查询效率。同时,为保证测试结果的公平性,把构建高度平衡二叉树的时间计入总时间,以进行对比。通过相应算例,验证了该改进方法的高效性。  相似文献   

11.
非线性偏微分方程数值求解的自适应方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
对小波理论在偏微分方程数值求解中的应用进行深入研究的基础上,提出了一种自适应求解非线性偏微分方程的算法——小波最优有限差分法。并以非线性Burgers方程为例,分别用小波最优有限差分法和直线法对它进行数值求解,显示了小波最优有限差分法在数值求解非线性问题时的自适应性、高效性和可行性。  相似文献   

12.
应用有限元方法解椭圆型边值问题的一类数值解法,最后都归结为解一个n阶线性方程组.这个方程组的系数按矩阵的形式排列,称为总刚度矩阵(例如位移法).尽管总刚度矩阵是稀疏和对称的,但用半带宽或变带宽来存贮它仍需占用计算机大量的存贮单元,使得中小型计算机难以求解这类大型结构的问题.本文将介绍不存贮总刚度矩阵的迭代  相似文献   

13.
为了解决三维芯片设计中的发热问题,针对三维芯片物理模型提出一种快速、准确的热仿真方法.该方法基于三维有限差分法,利用嵌套的两重快速傅里叶变换对有限差分方程进行求解,从而得到芯片温度分布;通过矩阵的特征值分解与快速傅里叶变换,使得只需求解一系列小规模的三对角线性方程组,即可在不损失精度的前提下有效地提升计算速度.数值实验结果表明,文中方法比稀疏矩阵直接求解算法快几十倍,并且由于占用内存少,能有效地求解变量数多达6×107的三维芯片热仿真问题;该方法具有O(nlogn)的时间复杂度与O(n)的空间复杂度,其中n为离散变量数.  相似文献   

14.
基于压缩稀疏矩阵矢量相乘的文本相似度计算   总被引:4,自引:0,他引:4  
在信息检索矢量模型的基础上.提出了一种基于压缩稀疏矩阵矢量相乘的文本相似度计算方法,具有矢量模型计算简单和速度快的特点.该方法采用压缩稀疏矩阵矢量空间存储数据,在相似度计算和数据存储时不需要考虑文本矢量矩阵中的零元素,大大减少了计算量和存储空间,从而使信息检索系统运行效率显著提高.仿真实验表明,上述方法比基于矢量模型的传统反向索引机制节省了38%的存储空间.  相似文献   

15.
新预处理ILUCG法求解稀疏病态线性方程组   总被引:3,自引:0,他引:3  
大型稀疏病态线性方程组的高效求解在科学计算和工程应用中起着十分重要的作用.对于一般非对称正定的非奇异线性代数方程组,首先介绍常用的不完全LU分解预处理矩阵构造技术;然后给出SSOR预处理分解及其改进分解,并基于ILUCG思想提出新预处理ILUCG法同时给出收敛性分析;最后进行数值模拟仿真试验,数值结果表明该算法是有效可行的,且较之一般的预处理ILUCG方法该法在求解稀疏病态方程组方面具有优越性.  相似文献   

16.
程汤培  王群 《计算机科学》2009,36(11):160-164
提出了一种大规模热传导方程并行求解的策略,采用了分布式内存和压缩矩阵技术解决超大规模稀疏矩阵的存储及其计算,整合了多种Krylov子空间方法和预条件子技术来并行求解大规模线性方程组,基于面向对象设计实现了具体应用与算法的低耦合.在Linux机群系统上进行了性能测试,程序具有良好的加速比和计算性能.  相似文献   

17.
稀疏矩阵与向量乘(SpMV)属于科学计算和工程应用中的一种基本运算,其高性能实现与优化是计算科学的研究热点之一。在微分方程的求解过程中会产生大规模的稀疏矩阵,而且很大一部分是一种准对角矩阵。针对准对角矩阵存在的一些不规则性,提出一种混合对角存储(DIA)和行压缩存储(CSR)格式来进行SpMV计算,对于分割出来的对角线区域之外的离散非零元素采用CSR存储,这样能够克服DIA在不规则情况下存储矩阵的列迅速增加的缺陷,同时对角线采用DIA存储又能充分利用矩阵的对角特征,以减少CSR的行非零元素数目的不均衡现象,并可以通过调整存储对角线的带宽来适应准对角矩阵的不同的离散形式,以获得比DIA和CSR更高的压缩比,减小计算的数据规模。利用CUDA平台在GPU上进行了实验测试,结果表明该方法比DIA和CSR具有更高的加速比。  相似文献   

18.
陈道琨  杨超  刘芳芳  马文静 《软件学报》2023,34(11):4941-4951
稀疏三角线性方程组求解(SpTRSV)是预条件子部分的重要操作, 其中结构化SpTRSV问题, 在以迭代方法求解偏微分方程组的科学计算程序中, 是一种较为常见的问题类型, 而且通常是科学计算程序的需要解决的一个性能瓶颈. 针对GPU平台, 目前以CUSPARSE为代表的商用GPU数学库, 采用分层调度(level-scheduling)方法并行化SpTRSV操作. 该方法不仅预处理耗时较长, 而且在处理结构化SpTRSV问题时会出现较为严重GPU线程闲置问题. 针对结构化SpTRSV问题, 提出一种面向结构化SpTRSV问题的并行算法. 该算法利用结构化SpTRSV问题的特殊非零元分布规律进行任务划分, 避免对输入问题的非零元结构进行预处理分析. 并对现有分层调度方法的逐元素处理策略进行改进, 在有效缓解GPU线程闲置问题的基础上, 还隐藏了部分矩阵非零元素的访存延迟. 还根据算法的任务划分特点, 采用状态变量压缩技术, 显著提高算法状态变量操作的缓存命中率. 在此基础上, 还结合谓词执行等GPU硬件特性, 对算法实现进行全面的优化. 所提算法在NVIDIA V100 GPU上的实测性能, 相比CUSPARSE平均有2.71倍的加速效果, 有效访存带宽最高可达225.2 GB/s. 改进后的逐元素处理策略, 配合针对GPU硬件的一系列调优手段, 优化效果显著, 将算法的有效访存带宽提高了约1.15倍.  相似文献   

19.
针对孔隙介质中地下水流动问题提出了一种并行数值计算方法,并基于此设计了一套专用于求解大规模三维地下水流动方程的并行计算模块。计算模块基于区域分解的方法实现对模型区域的并行求解,采用了分布式内存和压缩矩阵技术解决大规模稀疏矩阵的存储及其计算,整合多种并行Krylov子空间方法和预条件子技术迭代求解大规模线性方程组。在Linux集群系统上进行了数值模拟实验,性能测试结果表明,程序具有良好的加速比和可扩展性。  相似文献   

20.
处理阶数较高的稀疏矩阵,既需要大量的访问,又需要一定量的插入和删除等动态操作。为了提高整体效率,本文提出了一种整行映射的压缩存储方法,把矩阵中非零元素有规律地映射到一维数组中,占据了比原来矩阵少得多的存储空间,而访问和删除的算法复杂度为常数O(1),插入操作也较快。该方法兼顾了顺序压缩法和链接压缩法的优点,是一种高效实用的压缩存储方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号