首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
不完全Cholesky分解预条件共轭梯度(incomplete Cholesky factorization preconditioned conjugate gradient, ICCG)法是求解大规模稀疏对称正定线性方程组的有效方法.然而ICCG法要求在每次迭代中求解2个稀疏三角方程组,稀疏三角方程组求解固有的串行性成为了ICCG法在GPU上并行求解的瓶颈.针对稀疏三角方程组求解,给出了一种利用GPU加速的有效方法.为了增加稀疏三角方程组求解在GPU上的多线程并行性,提出了对不完全Cholesky分解产生的稀疏三角矩阵进行分层调度(level scheduling)的方法.为了进一步提高稀疏三角方程组求解的并行性能,提出了在分层调度前通过近似最小度(approximate minimum degree, AMD)算法对系数矩阵进行重排序、在分层调度后对稀疏三角矩阵进行层排序的方法,降低了分层调度过程中产生的层数,优化了稀疏三角方程组求解的GPU内存访问模式.数值实验表明,与利用NVIDIA CUSPARSE实现的ICCG法相比,采用上述方法性能可以获得平均1倍以上的提升.  相似文献   

2.
稀疏线性方程组不完全分解预条件方法   总被引:3,自引:1,他引:2       下载免费PDF全文
稀疏线性方程组的高效求解在科学计算与工程应用中起着十分重要的作用。本文系统介绍一般稀疏线性方程组和块三对角线性方程组的不完全预条件构造技术,同时介绍我们提出的多行双门槛不完全分解预条件子MRILUT和局部块不完全分解预条件子LBF2(l)构造方法,并将它们应用于二维三温能量方程组的离散求解与二维Laplace微分方程的离
离散求解中,取得了满意的结果。  相似文献   

3.
基于预条件共轭梯度法的混凝土层析成像   总被引:1,自引:0,他引:1       下载免费PDF全文
樊瑶  赵祥模  褚燕利  党乐 《计算机工程》2008,34(23):258-260
根据常规图像重建的共轭梯度迭代算法,提出一种预条件共轭梯度法。用一种新的预条件子M来改善系数矩阵的条件数,结合一般的共轭梯度法,导出预条件共轭梯度法。实验结果表明,预条件共轭梯度算法比共轭梯度算法具有更好的CT重建效果和消噪能力,可提高计算的精度和图像的重建质量。  相似文献   

4.
吴强  刘琚  乔建苹  王行愚 《计算机工程》2007,33(24):189-190
提出一种基于序列子集共轭梯度最优化算法的超分辨率图像重建算法。通过图像配准算法估计得到不同低分辨率图像间的平移和旋转量,结合期望图像的统计先验对问题进行规整,建立优化的代价函数。利用序列子集共轭梯度最优化迭代算法求解,得到高分辨率图像。仿真结果表明,该算法可以使内存降低15%,运算速度提高20%。  相似文献   

5.
为了快速得到高质量的重建图像,提出了对称共轭梯度法成像算法,大大缩减了迭代次数,同时,将ERT物理模型进行规范化和Tikhonov正则化处理,进而将QR分解的思想引入ERT方程的求解中,提出基于QR分解的对称共轭梯度算法,实现了单步图像重建.理论分析表明,该算法具有良好的收敛性.通过典型流型的仿真实验,证明了该算法可以...  相似文献   

6.
大型复线性方程组预处理双共轭梯度法   总被引:2,自引:0,他引:2  
当复线性方程组的规模较大或系数矩阵的条件数很大时,系数矩阵易呈现病态特性,双共轭梯度法存在不收敛和收敛速度慢的潜在问题,采用适当的预处理技术,可以改善矩阵病态特性,加快收敛速度。从实型不完全Cholesky分解预处理方法出发,构造了一种针对复线性方程组的预处理方法,结合双共轭梯度法,给出了一种预处理双共轭梯度法。数值算例表明该算法求解速度快,可靠高效,能够应用于大型复线性方程组的求解。  相似文献   

7.
快速准确地对电网信号的谐波进行检测与估计,对提高现代电力系统的工作效率有重要意义。传统的快速傅立叶变换(FFT)方法速度较快,但精度不高。近年来,很多学者将谐波估计归结为一个线性极小二乘问题,并用奇异值分解(SVD)算法求解。这类方法虽然提高了精度,但奇异值分解的计算量较大,尤其大规模问题,不能达到"即时"的要求。文中基于共轭梯度分解(CGD)方法对电网中的信号进行谐波估计,不仅降低了SVD算法的计算量,同时提高了FFT的精度,并能应用到严重畸变的定期信号的估计上。初步实验结果验证了该方法的有效性。  相似文献   

8.
张沛洲  王熙照  顾迪  赵士欣 《计算机应用》2015,35(10):2757-2760
极速学习机(ELM)由于具有较快的训练速度和较好的泛化能力而被广泛的应用到很多的领域,然而在计算数据样例个数较大的情况下,它的训练速度就会下降,甚至会出现程序报错,因此提出在ELM模型中用改进的共轭梯度算法代替广义逆的计算方法。实验结果表明,与求逆矩阵的ELM算法相比,在同等泛化精度的条件下,共轭梯度ELM有着更快的训练速度。通过研究发现:基于共轭梯度的极速学习机算法不需要计算一个大型矩阵的广义逆,而大部分广义逆的计算依赖于矩阵的奇异值分解(SVD),但这种奇异值分解对于阶数很高的矩阵具有很低的效率;因为已经证明共轭梯度算法可通过有限步迭代找到其解,所以基于共轭剃度的极速学习机有着较高的训练速度,而且也比较适用于处理大数据。  相似文献   

9.
研究了基于GPU的稀疏线性方程组的预条件共轭梯度法加速求解问题,并基于统一计算设备架构(CUDA)平台编制了程序,在NVIDIAGT430 GPU平台上进行了程序性能测试和分析。稀疏矩阵采用压缩稀疏行(CSR)格式压缩存储,针对预条件共轭梯度法的算法特性,研究了基于GPU的稀疏矩阵与向量相乘的性能优化、数据从CPU端传到GPU端的加速传输措施。将编制的稀疏矩阵与向量相乘的kernel函数和CUSPARSE函数库中的cusparseDcsrmv函数性能进行了对比,最优得到了2.1倍的加速效果。对于整个预条件共轭梯度法,通过自编kernel函数来实现的算法较之采用CUBLAS库和CUSPARSE库实现的算法稍具优势,与CPU端的预条件共轭梯度法相比,最优可以得到7.4倍的加速效果。  相似文献   

10.
通过立体视觉方法能得到一些分散点处表面信息,根据这些分散点处三维表面信息,可对三维表面进行重建,文中主要讨论利用共轭梯度法重建三维物体表面的算法。  相似文献   

11.
This paper deals with nonoverlapping domain decomposition methods for two coupled Stokes flows, based on the duality theory. By introducing a fictitious variable in the transmission condition and using saddle-point equations, the problem is restated as a linearly constrained maximization problem. According to whether constraints are uncoupled Stokes problems or uncoupled Poisson problems, two Uzawa-type domain decomposition algorithms are proposed. The results of some numerical experiments on a model problem are given.  相似文献   

12.
In this paper fast parallel Preconditioned Conjugate Gradient (PCG) algorithms for robot manipulator forward dynamics, or dynamic simulation, problem are presented. By exploiting the inherent structure of the forward dynamics problem, suitable preconditioners are devised to accelerate the iterations. Also, based on the choice of preconditioners, a modified dynamic formulation is used to speedup both serial and parallel computation of each iteration. The implementation of the parallel algorithms on two interconnected processor arrays is discussed and their computation and communication complexities are analyzed. The simulation results for a Puma Arm are presented to illustrate the effectiveness of the proposed preconditioners. With a faster convergence due to preconditioning and a faster computation of iterations due to parallelization, the developed parallel PCG algorithms represent the fastest alternative for parallel computation of the problem withO(n) processors.  相似文献   

13.
核外计算中,由于磁盘I/O操作特点是启动开销大,所以对文件的访问时间占的比例较大。如果能减少读取文件操作的次数则可以大幅度地提高运行效率。数据重用是一种有效的减少I/O操作次数的技术。本文将数据分成几个文件,然后将本次Cholesky分解完毕的文件继续的留在内存缓冲区中。当对下一个文件进行分解时,可用上一个刚分解完的文件进行数据的更新。这样就减少了读取数据的I/O操作次数,从而提高了分解效率。  相似文献   

14.
张德好  刘青昆 《计算机工程》2012,38(18):262-264
在图形处理单元(GPU)平台的计算中,GPU设备存储器和内存容量相差较大,待处理数据通常无法一次性从内存拷贝至显存中进行运算。为此,提出一种Cholesky分解重叠算法。采用预存取技术,拷贝数据和计算重叠,降低设备的等待时间,将设备存储器划分为 2个缓冲区,轮流存放本次运算数据和下次待运算数据,在设备运算过程中完成设备存储器和内存之间的数据交换。实验结果表明,该算法可以有效提高运算效率。  相似文献   

15.
16.
共轭梯度法的GPU实现   总被引:1,自引:0,他引:1       下载免费PDF全文
夏健明  魏德敏 《计算机工程》2009,35(17):274-276
提出基于图形处理单元(GPU)实现矩阵与向量相乘的新算法,只需渲染四边形一次即可实现矩阵与向量乘法。并给出实现向量元素求和的新算法,与缩减算法不同,该算法不要求向量大小为2的幂。基于这2种算法使用OpenGL着色语言(GLSL)编程,用GPU实现求解线性方程组的共轭梯度法。与Krtiger算法相比,该方法所用计算时间更少。  相似文献   

17.
边缘提取是图像识别的基础,为了进一步提高搜索效率和克服主动轮廓模型对初始位置敏感的问题,提出了一种基于共轭梯度的B样条主动轮廓变形边缘提取方法。该方法首先通过人工交互的方式,在目标边缘附近给定一条形状和位置尽量和图像边缘一致的B样条曲线;然后对变形曲线B样条的控制节点进行进化,以取代传统方法中对变形曲线上每一个像素点进行的进化,由于控制节点的数目远远小于曲线上像素点的数目,因而可以大大减少计算次数;最后在梯度矢量场中,对进化曲线附加一共轭梯度力,以加快变形曲线向目标边缘的收敛速度。实验表明,该方法不仅能应对深度凹陷问题,而且边缘提取效率有了较大的提高。  相似文献   

18.
该论文研究了利用并行共轭梯度算法求解二维泊松方程的方法,在由24台微机组成的机群上进行了实验。实验数据表明并行共轭梯度算法适用于求解二维泊松方程,它具有收敛快,可扩展性强的特点。在实验的基础上提出并验证了适用于并行共轭梯度算法的合理计算节点数的选择函数。  相似文献   

19.
基于频域共轭梯度算法的盲目图像恢复   总被引:4,自引:0,他引:4  
高潮  郭永彩  刘国祥 《计算机学报》2003,26(9):1152-1156
在分析了目前各种算法存在的一些基本问题的基础上,提出了盲目图像恢复的频域共轭梯度算法,算法假设退化系统的点扩散函数具有圆对称性,并考虑图像的频域具有复共轭对称性,在频域里建立了新的优化判据;采用共轭梯度算法搜索判据,从而在有实际物理意义的区域中收敛于最优解;对光学成像系统常见的离焦、衍射模糊问题进行了仿真;用该算法实现了其退化图像的恢复,给出并分析了结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号