共查询到19条相似文献,搜索用时 46 毫秒
1.
不完全Cholesky分解预条件共轭梯度(incomplete Cholesky factorization preconditioned conjugate gradient, ICCG)法是求解大规模稀疏对称正定线性方程组的有效方法.然而ICCG法要求在每次迭代中求解2个稀疏三角方程组,稀疏三角方程组求解固有的串行性成为了ICCG法在GPU上并行求解的瓶颈.针对稀疏三角方程组求解,给出了一种利用GPU加速的有效方法.为了增加稀疏三角方程组求解在GPU上的多线程并行性,提出了对不完全Cholesky分解产生的稀疏三角矩阵进行分层调度(level scheduling)的方法.为了进一步提高稀疏三角方程组求解的并行性能,提出了在分层调度前通过近似最小度(approximate minimum degree, AMD)算法对系数矩阵进行重排序、在分层调度后对稀疏三角矩阵进行层排序的方法,降低了分层调度过程中产生的层数,优化了稀疏三角方程组求解的GPU内存访问模式.数值实验表明,与利用NVIDIA CUSPARSE实现的ICCG法相比,采用上述方法性能可以获得平均1倍以上的提升. 相似文献
2.
稀疏线性方程组的高效求解在科学计算与工程应用中起着十分重要的作用。本文系统介绍一般稀疏线性方程组和块三对角线性方程组的不完全预条件构造技术,同时介绍我们提出的多行双门槛不完全分解预条件子MRILUT和局部块不完全分解预条件子LBF2(l)构造方法,并将它们应用于二维三温能量方程组的离散求解与二维Laplace微分方程的离
离散求解中,取得了满意的结果。 相似文献
离散求解中,取得了满意的结果。 相似文献
3.
4.
5.
为了快速得到高质量的重建图像,提出了对称共轭梯度法成像算法,大大缩减了迭代次数,同时,将ERT物理模型进行规范化和Tikhonov正则化处理,进而将QR分解的思想引入ERT方程的求解中,提出基于QR分解的对称共轭梯度算法,实现了单步图像重建.理论分析表明,该算法具有良好的收敛性.通过典型流型的仿真实验,证明了该算法可以... 相似文献
6.
大型复线性方程组预处理双共轭梯度法 总被引:2,自引:0,他引:2
当复线性方程组的规模较大或系数矩阵的条件数很大时,系数矩阵易呈现病态特性,双共轭梯度法存在不收敛和收敛速度慢的潜在问题,采用适当的预处理技术,可以改善矩阵病态特性,加快收敛速度。从实型不完全Cholesky分解预处理方法出发,构造了一种针对复线性方程组的预处理方法,结合双共轭梯度法,给出了一种预处理双共轭梯度法。数值算例表明该算法求解速度快,可靠高效,能够应用于大型复线性方程组的求解。 相似文献
7.
快速准确地对电网信号的谐波进行检测与估计,对提高现代电力系统的工作效率有重要意义。传统的快速傅立叶变换(FFT)方法速度较快,但精度不高。近年来,很多学者将谐波估计归结为一个线性极小二乘问题,并用奇异值分解(SVD)算法求解。这类方法虽然提高了精度,但奇异值分解的计算量较大,尤其大规模问题,不能达到"即时"的要求。文中基于共轭梯度分解(CGD)方法对电网中的信号进行谐波估计,不仅降低了SVD算法的计算量,同时提高了FFT的精度,并能应用到严重畸变的定期信号的估计上。初步实验结果验证了该方法的有效性。 相似文献
8.
极速学习机(ELM)由于具有较快的训练速度和较好的泛化能力而被广泛的应用到很多的领域,然而在计算数据样例个数较大的情况下,它的训练速度就会下降,甚至会出现程序报错,因此提出在ELM模型中用改进的共轭梯度算法代替广义逆的计算方法。实验结果表明,与求逆矩阵的ELM算法相比,在同等泛化精度的条件下,共轭梯度ELM有着更快的训练速度。通过研究发现:基于共轭梯度的极速学习机算法不需要计算一个大型矩阵的广义逆,而大部分广义逆的计算依赖于矩阵的奇异值分解(SVD),但这种奇异值分解对于阶数很高的矩阵具有很低的效率;因为已经证明共轭梯度算法可通过有限步迭代找到其解,所以基于共轭剃度的极速学习机有着较高的训练速度,而且也比较适用于处理大数据。 相似文献
9.
研究了基于GPU的稀疏线性方程组的预条件共轭梯度法加速求解问题,并基于统一计算设备架构(CUDA)平台编制了程序,在NVIDIAGT430 GPU平台上进行了程序性能测试和分析。稀疏矩阵采用压缩稀疏行(CSR)格式压缩存储,针对预条件共轭梯度法的算法特性,研究了基于GPU的稀疏矩阵与向量相乘的性能优化、数据从CPU端传到GPU端的加速传输措施。将编制的稀疏矩阵与向量相乘的kernel函数和CUSPARSE函数库中的cusparseDcsrmv函数性能进行了对比,最优得到了2.1倍的加速效果。对于整个预条件共轭梯度法,通过自编kernel函数来实现的算法较之采用CUBLAS库和CUSPARSE库实现的算法稍具优势,与CPU端的预条件共轭梯度法相比,最优可以得到7.4倍的加速效果。 相似文献
10.
通过立体视觉方法能得到一些分散点处表面信息,根据这些分散点处三维表面信息,可对三维表面进行重建,文中主要讨论利用共轭梯度法重建三维物体表面的算法。 相似文献
11.
Jonas Koko 《Journal of scientific computing》2006,26(2):195-216
This paper deals with nonoverlapping domain decomposition methods for two coupled Stokes flows, based on the duality theory.
By introducing a fictitious variable in the transmission condition and using saddle-point equations, the problem is restated
as a linearly constrained maximization problem. According to whether constraints are uncoupled Stokes problems or uncoupled
Poisson problems, two Uzawa-type domain decomposition algorithms are proposed. The results of some numerical experiments on
a model problem are given. 相似文献
12.
Fast parallel Preconditioned Conjugate Gradient algorithms for robot manipulator dynamics simulation
In this paper fast parallel Preconditioned Conjugate Gradient (PCG) algorithms for robot manipulator forward dynamics, or dynamic simulation, problem are presented. By exploiting the inherent structure of the forward dynamics problem, suitable preconditioners are devised to accelerate the iterations. Also, based on the choice of preconditioners, a modified dynamic formulation is used to speedup both serial and parallel computation of each iteration. The implementation of the parallel algorithms on two interconnected processor arrays is discussed and their computation and communication complexities are analyzed. The simulation results for a Puma Arm are presented to illustrate the effectiveness of the proposed preconditioners. With a faster convergence due to preconditioning and a faster computation of iterations due to parallelization, the developed parallel PCG algorithms represent the fastest alternative for parallel computation of the problem withO(n) processors. 相似文献
13.
核外计算中,由于磁盘I/O操作特点是启动开销大,所以对文件的访问时间占的比例较大。如果能减少读取文件操作的次数则可以大幅度地提高运行效率。数据重用是一种有效的减少I/O操作次数的技术。本文将数据分成几个文件,然后将本次Cholesky分解完毕的文件继续的留在内存缓冲区中。当对下一个文件进行分解时,可用上一个刚分解完的文件进行数据的更新。这样就减少了读取数据的I/O操作次数,从而提高了分解效率。 相似文献
14.
15.
16.
17.
边缘提取是图像识别的基础,为了进一步提高搜索效率和克服主动轮廓模型对初始位置敏感的问题,提出了一种基于共轭梯度的B样条主动轮廓变形边缘提取方法。该方法首先通过人工交互的方式,在目标边缘附近给定一条形状和位置尽量和图像边缘一致的B样条曲线;然后对变形曲线B样条的控制节点进行进化,以取代传统方法中对变形曲线上每一个像素点进行的进化,由于控制节点的数目远远小于曲线上像素点的数目,因而可以大大减少计算次数;最后在梯度矢量场中,对进化曲线附加一共轭梯度力,以加快变形曲线向目标边缘的收敛速度。实验表明,该方法不仅能应对深度凹陷问题,而且边缘提取效率有了较大的提高。 相似文献
18.
ZHAO Hang-tao 《数字社区&智能家居》2008,(27)
该论文研究了利用并行共轭梯度算法求解二维泊松方程的方法,在由24台微机组成的机群上进行了实验。实验数据表明并行共轭梯度算法适用于求解二维泊松方程,它具有收敛快,可扩展性强的特点。在实验的基础上提出并验证了适用于并行共轭梯度算法的合理计算节点数的选择函数。 相似文献