首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文针对对角占优的对称矩阵(SDD)构成的稀疏线性系统,采用组合预处理技术从谱逼近角度分析并实现一种新型的预条件子.其与ILU类预条件子和AMG类预条件子相比,具有更高的并行可扩展性,满足通量守恒或者等效电阻原理.SDD矩阵通过数学上的规约手段,可以约化为标准的Laplace矩阵,其对应于图论中的无向图.基于此我们首先利用Ofer等提出的算法建立具有low stretch度量的一类生成树.然后采用树分解算法将生成树分解为子树,通过对子树选择合适的连接边进行加边修正得到相应的增广子图.最后将增广子图对应的Laplace矩阵转化为SDD矩阵,该矩阵即为原系数矩阵的预条件子.数值实验表明,与不完全Cholesky分解预条件子相比,该类预条件子更高效,其收敛速度对问题边界类型以及矩阵排序算法不敏感,并且其效率对矩阵规模增长不太敏感.  相似文献   

2.
本文为一类H(curl)型椭圆问题的线性棱有限元方程,构造了一种基于节点辅助空间预条件子(HX预条件子)和基于简单粗空间的非重叠区域分解相结合的预条件子,并为该预条件子设计了并行算法,编制了基于MPI+OpenMP二级并行架构的并行程序.数值实验结果表明基于该预条件子的并行PCG法具有良好的算法可扩展能力和并行可扩展能力.  相似文献   

3.
GRAPES是中国气象科学研究院研制的一个非静力格点模式,该模式以大气运动的全可压运动方程为基础,采用半隐半Lagrange方案。在模式积分中,每个时间步需要求解关于气压梯度力的三维离散Helmholtz方程,该方程组的求解在整个数值模拟时间中占70%左右,为加速求解过程,采用高效预条件技术是必然选择。将提出的多行双门槛不完全分解预条件与国内外常用的多种其他预条件技术进行了比较,同时,考查了针对不完全分解预条件的加性Schwarz与基于因子组合的两种并行化预条件技术,结果发现,多行双门槛不完全分解预条件优于包括ILUT在内的其他不完全分解预条件,且加性Schwarz略优于基于因子组合的并行预条件技术。  相似文献   

4.
区域分解是并行计算的基本手段之一,在稀疏线性方程组迭代求解时,对不完全分解等串行计算时很有效的预条件,经常采用区域分解的思想进行并行化。但区域分解的本质是利用局部解来近似全局解,从而必然存在较大误差,为此,提出一种粗网格校正算法,通过非重叠子区域浓缩,每个非重叠子区域浓缩为一个超结点,形成一个含全局信息且阶数等于子区域个数的小线性方程组,之后用其对原并行预条件进行校正。对块Jacobi型、经典加性Schwarz、以及因子组合型并行不完全分解预条件的实验表明,粗网格校正能有效改善收敛性并提高求解效率。  相似文献   

5.
一种快速边缘检测算法   总被引:1,自引:0,他引:1  
边缘检测是对图像中像素值的不连续性的度量、检测和定位,是图像分析领域中的一个基础问题.基于斜面分解的非对称逆布局图像表示方法(IDNAM)借鉴斜面拟合和逆布局的思想,使用矩形斜面子模式(RIP子模式)实例的集合来表示图像.基于IDNAM,提出一个RIP子模式内的理想边缘模型,将RIP子模式内的边缘分成五种,并给出了每一种边缘的强度和方向的计算公式.为了消除噪声对边缘检测结果的干扰,提出了RIP子模式内边缘存在性判定条件.根据理想边缘模型和判定条件,提出了一种基于IDNAM的边缘检测算法.理论分析和实验结果均表明,基于IDNAM表示的边缘检测算法的处理速度较传统的边缘检测算法更快.  相似文献   

6.
首先对含跳系数的H~1型和H(curl)型椭圆问题的线性有限元方程,分别设计了基于AMG预条件子和基于节点辅助空间预条件子(HX预条件子)的PCG法.数值实验表明,算法的迭代次数基本不依赖于系数跳幅和离散网格"尺寸".然后以此为基础,对Maxwell方程组鞍点问题的第一类N(e)d(e)lec线性棱元离散系统设计并分析了一种基于HX预条件子的Uzawa算法.当系数光滑时,理论上证明了算法的收敛率与网格规模无关.数值实验表明,新算法对跳系数情形也是高效和稳定的.  相似文献   

7.
周笑  蒋锐 《计算机应用研究》2021,38(12):3739-3743
在毫米波大规模MIMO系统中,一般采用混合模拟和数字预编码替代全数字预编码来减少射频链和能量消耗.然而,在计算最优无约束混合预编码时,奇异值分解(SVD)具有较高的复杂度.因此,提出了一种基于投影近似子空间跟踪(PAST)的低复杂度混合预编码算法.该算法在计算每个子速率的最优无约束混合预编码时,利用PAST算法估计需要的右奇异矩阵部分主要列向量,从而避免了高复杂度的SVD过程.仿真结果表明,不论是在全连接、混合连接还是在子连接系统结构中,该算法在频谱效率上都接近基于SVD的混合预编码,并且随着发送天线数的增加,提出的算法的复杂度和耗时远低于基于SVD的混合预编码.同时该算法的系统误码率较小,具有较好的可靠性.  相似文献   

8.
周笑  蒋锐  徐友云 《计算机应用研究》2021,38(12):3739-3743
在毫米波大规模MIMO系统中,一般采用混合模拟和数字预编码替代全数字预编码来减少射频链和能量消耗.然而,在计算最优无约束混合预编码时,奇异值分解(SVD)具有较高的复杂度.因此,提出了一种基于投影近似子空间跟踪(PAST)的低复杂度混合预编码算法.该算法在计算每个子速率的最优无约束混合预编码时,利用PAST算法估计需要的右奇异矩阵部分主要列向量,从而避免了高复杂度的SVD过程.仿真结果表明,不论是在全连接、混合连接还是在子连接系统结构中,该算法在频谱效率上都接近基于SVD的混合预编码,并且随着发送天线数的增加,提出的算法的复杂度和耗时远低于基于SVD的混合预编码.同时该算法的系统误码率较小,具有较好的可靠性.  相似文献   

9.
图像复原实际上是反卷积问题,其中的卷积核矩阵属于大尺寸的Toeplitz矩阵。为了降低迭代复原算法的计算复杂度,通过分析该Toeplitz系统的病态性及常见快速求解方法,提出一种基于卷积核矩阵重构的预条件共轭梯度迭代算法。首先根据Toeplitz矩阵可分解为Kronecker积的和的性质,对点扩散函数进行奇异值分解,将各奇异值对应的左右向量构造子Toeplitz矩阵,子矩阵作Kronecker积并加和,从而得到卷积核矩阵的分解式,然后根据Kronecker乘积的性质,将该分解式用于构造预条件算子,最后利用预条件共轭梯度法求解。计算复杂度分析及实验表明该方法有助于加速迭代的收敛并得到稳定结果。  相似文献   

10.
本文针对一类含变跳系数的扩散问题,在矩形网格下构造了一种节点型MACH类有限体积格式.将相应常跳系数辅助扩散问题离散格式的系数矩阵的逆作为其预条件子.利用该系数矩阵的特殊代数结构,通过降维处理技术和快速傅里叶变换等,为预条件子(该矩阵逆)的数学行为设计了一种低运算复杂度(O(Nln(N)))的直接法.数值实验验证了基于该预条件子的PCG算法的高效性和稳健性.  相似文献   

11.
鲍蓉 《计算机工程》2009,35(2):39-41
针对传统数据仓库系统中多维模式进化历史的挥发性问题,提出用版本元数据来记录数据仓库进化过程中的每一种多维模式状态,给出版本元数据结构,设计了跨版本透明查询系统及相应的查询算法。查询分解算法将用户基于一种模式结构提出的查询请求分解为在各个数据仓库版本上计算的子查询,集成算法将子查询结果进行必要的汇总和转换。  相似文献   

12.
对Krylov子空间迭代法,高效预条件的构造是核心问题之一,而重叠区域分解是一种很有效的并行化技术。通过模型偏微分方程离散求解以及混凝土细观数值模拟中的线性方程组求解,对商图,就自然排序、RCM排序、Sloan排序、GPS排序、谱排序和随机排序等多种重排算法进行了比较。对子区域内顶点的重排方案,进行了自然排序、RCM排序、谱排序、随机排序和一种新排序算法间的比较。结果表明,预条件效果对商图排序不敏感。局部排序对预条件质量具有明显影响,局部采用随机排序时效果一般较差,而带宽缩减算法对加性Schwarz影响很小,对块Jacobi并行化预条件影响较大,对因子组合型并行预条件采用自然排序和新排序时效果较好。  相似文献   

13.
极区计算对全球数值预报模式设计的重要性主要体现在2个方面:模式动力框架中的极区处理和极区并行数据划分带来的并行负载不平衡问题.其中后者是全球数值预报模式大规模并行计算的性能瓶颈,对此提出一种新的基于加权等积的球面数据划分算法.该算法以球带数目和权函数为参数,将南北两极分别划分到单独的子区域,形成极点通区,使从极点到赤道方向每个纬度对应的子区域数目逐渐增多,灵活地实现球面网格的高质量划分.从理论上分析该算法的划分质量后,以基于球谐谱的浅水波模式PSTSWM为实验平台,验证了提出的划分算法具有很好的并行划分性能以及可扩展性.结合我国自主设计的GRAPES全球模式,展望了该算法的应用前景.  相似文献   

14.
基于预条件共轭梯度法的混凝土层析成像   总被引:1,自引:0,他引:1       下载免费PDF全文
樊瑶  赵祥模  褚燕利  党乐 《计算机工程》2008,34(23):258-260
根据常规图像重建的共轭梯度迭代算法,提出一种预条件共轭梯度法。用一种新的预条件子M来改善系数矩阵的条件数,结合一般的共轭梯度法,导出预条件共轭梯度法。实验结果表明,预条件共轭梯度算法比共轭梯度算法具有更好的CT重建效果和消噪能力,可提高计算的精度和图像的重建质量。  相似文献   

15.
新一代数值预报模式GRAPES的并行计算方案设计与实现   总被引:3,自引:0,他引:3  
GRAPES(global and regional assimilation and prediction system)是由中国气象科学研究院灾害天气国家重点实验室自主研究开发的中国新一代数值天气预报系统,其目标是科研/业务通用.为了实现这一目标,结合高性能计算机的体系结构设计并实现模式的并行计算是必不可少的.作为核心开发技术之一,GRAPES系统设计并实现了模式的并行计算方案,包括中尺度有限区模式的并行计算和全球模式并行计算.GRAPES模式并行计算版本在IBM-Clusterl600上的测试表明,GRAPES模式的并行计算程序正确、稳定、有效,为其业务化之路奠定了基础,同时也为系统未来的可持续开发、优化创造了条件.  相似文献   

16.
提出一种新颖的基于子采样和非负矩阵分解(NMF)的稳健图像摘要算法.算法首先将原始输入图像进行子采样得到一系列子图像,其次利用子采样图像的列相似性进行非负矩阵分解,最后由分解系数得到摘要序列.实验结果表明本算法对常见图像处理操作稳健,对恶意篡改敏感,同时用户密钥的使用保证了算法的安全性.  相似文献   

17.
本文研究了鞍点问题的预条件子.在SSOR型预处理方法的基础上,通过引入新的松弛参数,提出了一种广义的SSOR型预条件子,该预条件子需要选择一个预处理矩阵和2个待定参数.文中分析了预处理后系数矩阵特征值的性质及收敛性,最后用数值例子验证了新预条件子的有效性.  相似文献   

18.
大气动力学问题的数值模拟在气象预报等领域具有广泛的应用.相关数值模拟依赖超级计算机平台实现高精度高分辨率的气象预报,隐式求解不受稳定性条件限制,相比显式求解更有优势.面向新的超级计算机架构特征研究隐式大气动力学问题中一系列算子操作的并行和优化方法是非常有必要的.本文在规则递推关系的理论框架下对大气动力学问题预条件阶段的稀疏三角回代求解以及ILU矩阵分解操作的特征进行了总结,并结合申威26010Pro处理器的架构特点,对现有结构化稀疏三角线性方程组问题的并行算法进行了推广,设计了一套面向单向规则递推关系的算法框架,解决了预条件阶段各类算子的并行加速问题.本文还面向申威26010Pro处理器对大气动力学问题的模板计算等算子进行了移植和优化.实验结果显示,本文的算法框架对预条件阶段的算子能够实现26-33倍不等的加速效果,对模板计算等算子的优化相比串行计算有10-152倍的加速比.在新的神威超级计算机上最大测试到1700多万核心,浮点性能达到20.5PFlop/s.在大规模测试条件下的强(弱)可扩展性维持在56.81%41.87%以上.  相似文献   

19.
提出了基于流形的表情分解算法。首先,运用保局投影将图像投影到低维的表情流形子空间,再在流形子空间里对它们进行高阶奇异值分解,最后在个人子空间和表情子空间里完成人脸和表情识别。该算法用流形学习解决了高阶奇异值分解中的图像特征值提取问题,用高阶奇异值分解解决了流形表情识别中个人模式影响表情识别的问题。是一种流形学习与高阶奇异值分解优势互补的算法。在CMU-AMP和JAFFE人脸库上的实验表明,该算法对人脸和表情识别都十分有效。  相似文献   

20.
针对垂直分层空时方案(VBLAST)传统检测存在误层传输效应及复杂度高的问题,提出了一种多用户MIMO-MC-CDMA下行链路系统中基于QR分解的VBLAST非线性模代数预编码算法,该算法首先采用QR分解获得预编码矩阵,然后在发射端MC-CDMA子载波信道间进行非线性模代数THP预编码,可以有效地消除分层空时码的误层传输效应。在接收端采用迫零与最小均方误差准则,降低了下行接收机的复杂度。仿真结果表明,提出的算法比传统检测算法有效改善了系统的误码性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号