期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘世芳赵永华于天禹黄荣锋《计算机科学》2020,47(4):6-12

广义稠密对称特征问题的求解是许多应用科学和工程的主要任务,并且是计算电磁学、电子结构、有限元模型和量子化学等计算中的重要部分.将广义对称特征问题转化为标准对称特征问题是求解广义稠密对称特征问题的关键计算步骤.针对GPU集群,文中给出了广义稠密对称特征问题标准化块算法在GPU集群上基于MPI+CUDA的实现.为了适应GP... 相似文献

2.

对称正定矩阵的并行LDLT分解算法实现 总被引：1，自引：0，他引：1

张健飞姜弘道《计算机工程与设计》2003,24(10):75-77

基于网络机群这一新的并行环境和消息传递界面MPI给出了两种不带平方根的Cholesky并行分解算法,算法采用行卷帘存储方案和提前发送策略,从而减少了负载的不平衡,增加了计算通信的重叠,减少了通信时间。理论分析和数值试验均表明,算法具有较高的并行加速比和效率。相似文献

3.

改进的并行广义共轭残差算法

赵利斌田有先《计算机工程》2009,35(4):80-82

针对大型非对称稀疏线性方程组的求解,通过利用广义共轭残差（GCR）算法的固有性质,消除GCR算法的内积计算数据相关性,给出一种改进的广义共轭残差（IGCR）算法。IGCR算法与GCR算法有相同的收敛性,在基于MPI的分布式存储并行机群上进行并行计算时,同步开销次数减少为GCR算法的一半。数值计算结果与理论分析表明,IGCR算法的性能优干GCR算法。相似文献

4.

对称正定矩阵的并行LDL^T分解算法实现

《计算机工程与设计》2003,24(10):75-77

基于网络机群这一新的并行环境和消息传递界面MPI给出了两种不带平方根的Cholesky并行分解算法,算法采用行卷帘存储方案和提前发送策略,从而减少了负载的不平衡,增加了计算通信的重叠,减少了通信时间.理论分析和数值试验均表明,算法具有较高的并行加速比和效率. 相似文献

5.

分布并行的分形图像压缩算法

王美清郑守淇《小型微型计算机系统》2003,24(3):487-490

分形图像压缩算法的时间复杂性很大，在单机上受到限制，针对这方面提出的分类方法，基于邻域搜索算法等虽然降低了时间复杂性，但同时也影响了图像的压缩质量，本文把分布并行机制引入分形压缩算法，提出分布并行的自适应四分树分形压缩算法，并在基于Java RMI的分布并行计算系统中加以实现，实验表明可以获得接近计算结点数的加速比。相似文献

6.

基于分治法求解对称三对角矩阵特征问题的混合并行实现

下载免费PDF全文

朱京乔赵永华《计算机系统应用》2019,28(9):246-250

基于对称三对角矩阵特征求解的分而治之方法,提出了一种改进的使用MPI/Cilk模型求解的混合并行实现,结合节点间数据并行和节点内多任务并行,实现了对分治算法中分治阶段和合并阶段的多任务划分和动态调度.节点内利用Cilk任务并行模型解决了线程级并行的数据依赖和饥饿等待等问题,提高了并行性;节点间通过改进合并过程中的通信流程,使组内进程间只进行互补的数据交换,降低了通信开销.数值实验体现了该混合并行算法在计算效率和扩展性方面的优势. 相似文献

7.

并行多块结构重叠网格装配算法及应用

马文鹏陆忠华袁武梁姗《计算机应用研究》2016,33(3)

针对多块结构重叠网格并行装配的问题,设计了支持初始网格系统细分的多块结构重叠网格框架,并在此框架基础上提出了基于局部洞映射的并行挖洞算法、格心网格下可跨块寻点的并行搜索算法,使之可适应大规模并行数值模拟时的分布式计算环境。此算法被模块化的集成到了自主研发的大规模多块结构网格数值求解器（CCFD-MGMB）中,可支持大规模并行非定常多体分离数值模拟。并行测试结果表明,本文发展的算法具有良好的局部数据结构组织,数据可扩展性强。数值应用模拟结果表明了该算法的有效性及正确性,千核并行非定常数值计算效率（相对于64核）可达58%。相似文献

8.

基于Pivots选择的有效图像块描述子

下载免费PDF全文

谢博鋆朱杰于剑《软件学报》2015,26(11):2930-2938

相似文献

9.

对称矩阵三对角化的有效并行块算法设计 总被引：1，自引：0，他引：1

赵永华迟学斌程强陈江赵涛《数值计算与计算机应用》2006,27(2):123-132

在矩阵数值计算中,块算法通常比非块算法更有效,但这也增加了并行算法设计和实现的难度．在广义稠密对称矩阵特征问题并行求解器中,并行块算法的构造可应用到正定对称矩阵的Choleski分解、对称矩阵的三对角化和回代转化(back-transiation)操作中．本文将并行块算法的讨论集中在具有代表性的对称矩阵三对角化上,给出在非块存储方式下对称矩阵三对角化的并行块算法设计方法．分析块算法大小同矩阵规模和处理器数量的关系．在深腾6800上的试验表明,我们的算法具有很好的性能,并得到了比ScaLAPACK更高的性能．相似文献

10.

碰撞问题中的量词消去算法的并行化研究

吴素萍王定康《微计算机信息》2007,23(32):251-252,293

机器人技术中的碰撞问题可以被表示成量词消去问题，但由于有些碰撞问题的复杂性使得这些问题在单个微机上求解需要花费的时间很长或者根本就解不出来。本文提出了基于分布Maple系统下量词消去算法的并行化．并针对分布Maple系统的特点以及算法的特点，通过实例分析，给出了两种并行策略，以达到在Maple软件环境下提高处理器利用率，提高量词消去算法的效率的目的。相似文献

11.

近优可扩展性：一种实用的可扩展性度量 总被引：2，自引：0，他引：2

陈军李晓梅《计算机学报》2001,24(2):179-182

良好的可扩展性是并行算法和并行机设计人员追求的一项重要性能指标,以往的可扩展模型都只是孤立地考虑了问题的某个侧面,比如某种性能或最大可利用资源,而没有从整体上进行权衡。这些可扩展模型可以满足计算机研究人员的需要,因为他们关注于更高的效率和利用率。但应用科学家更强调短小的执行时间。文中提出的近优可扩展模型,它同时考虑了并行系统的效率和执行两个因素。在一个典型MPP上的两个算法实例分析表明,该可扩展模型不仅可以描述并行算法的可扩展能力,而且,当按照适当的可扩展曲线扩展时,可以使得执行时间接近量短,而效率不低,这对算法和并行机的最优匹配有指导作用,同时有益于并行算法设计和改进。相似文献

12.

多核图像处理并行设计范式的研究与应用 总被引：1，自引：0，他引：1

王成良谢克家刘昕《计算机工程》2011,37(14):220-222

多核计算环境下采用图像处理并行算法可提高图像处理的速度,但已有的并行设计只针对边缘检测、图像投影等特定算法进行,没有形成通用的并行算法设计范式。为此,在研究图像处理算法可并行处理机制和多核架构特点的基础上,提出分析、建模、映射、调试和性能评价及测试发布等5个设计步骤的基于多核计算环境的图像处理算法并行设计范式,以图像傅里叶变换并行算法设计为例在单核、双核、四核、八核计算环境下验证了该并行范式的有效性。实验结果表明,该范式在图像处理并行设计方面可扩展图像处理的应用空间。相似文献

13.

J. M. Badía A. M. Vidal 《Concurrency and Computation》2000,12(13):1275-1290

In this paper we present a parallel algorithm for solving the inverse Toeplitz Eigenvalue Problem. The algorithm has been implemented by using a cluster of personal computers, interconnected by a high‐performance Myrinet network. We have utilized standard public domain parallel environments for implementing the calculation part as well as the communications, thus producing portable software. The results obtained allow us to confirm the scalability and efficiency of the algorithm. Moreover, we have checked that by using the theoretical cost model provided by the ScaLAPACK we can predict the behaviour of the experimental results. Copyright © 2000 John Wiley & Sons, Ltd. 相似文献

14.

并行计算系统可扩展性的研究

祝永志李丙峰孙婷婷李佩《计算机工程与应用》2011,47(21):47-49

可扩展性是设计并行计算系统和并行算法所要考虑的一个重要性能指标。分析了等效率、等速度、平均延迟和等并行计算开销比几种并行系统可扩展性模型的特征,提出了一种新的更有效的可扩展性度量标准。通过实验结果分析,该模型能很好地评测并行计算系统的可扩展性。相似文献

15.

网络并行计算中矩阵QR分解的并行算法

张艳孙世新《计算机应用》2000,20(10):29-32

随着高速网络技术（如ＡＴＭ）的出现,网络并行计算系统（ＮＯＷ）已成为并行处理的主要平台,由于它的高通信延迟,某些在并行机上实现的细粒度并行算法已不适合在该环境下运行。为此,有必要对算法重新进行任务划分,研究它在网络环境中的并行实现。基于这一点,本文对矩阵的ＱＲ分解提出了一种新的任务划分策略,并由此得到了它的一种粗粒度并行算法,实验结果表明,设计的并行算法在网络并行计算环境中具有较高的加速比。相似文献

16.

跟踪界面活动网格法并行程序的性能分析

陈军袁国兴李晓梅《数值计算与计算机应用》2002,23(3):167-175

随着超级计算机向着更大规模趋势发展,并行算法与并行机相结合的可扩展性日益得到重视,特别是对实际应用程序的可扩展性研究愈为迫切.新的并行机的发展己成为科学计算本身的一个巨大挑战.目前仍然缺乏能求解“巨大挑战性问题”的数值方法和并行度高、可扩展性好的应用软件.大规模并行计算的一个关键问题是可扩展性问题[1].不可能期望通过将串行代码移植到并行系统上就能获得很大的性能增益.当处理机节点数超过64,16甚至8时,这种做法将使可扩展性降低.我国目前仍局限于中小型计算,原有算法和并行软件是否能求解更大规模问题是个值得关注的问题. 相似文献

17.

无约束最优化问题的BFGS并行算法与实现

李文敬王汝凉廖伟志《计算机工程》2009,35(15):58-60,6

介绍无约束最优化问题的BFGS算法及其收敛性,提出利用行卷帘格式并行Cholesky分解法、同步并行Wolfe-Powell非线性搜索和并行处理BFGS修正公式来构建BFGS的并行算法,并对该算法的时间复杂性、加速比进行分析。在PC机群数值实验的结果表明,BFGS并行算法提高了无约束最优化问题的求解速度,理论分析与实验结果相一致,并行算法具有线性加速比。相似文献

18.

并行计算六十年 总被引：10，自引：0，他引：10

杨学军《计算机工程与科学》2012,34(8):1-10

并行计算是实现高性能计算的主要技术手段。本文回顾了并行计算技术六十多年来的发展历史,重温了并行可扩展性度量公式在并行计算发展进程中的重要地位。分析了并行计算向未来E级计算发展时面临的挑战,并建立了新的并行计算可扩展性度量模型,建模了访存、通信、可靠性、能耗等影响E级计算的因素。通过定量分析,发现和研究了并行计算向更高性能发展面临的可扩展性\"墙\"。最后,针对我国国情,提出了作者关于我国高性能计算未来发展的体会与思考。相似文献