共查询到17条相似文献,搜索用时 140 毫秒
1.
2.
采用有限元法进行电法勘探时,会产生大型稀疏线性方程组,如何提高方程组的求解效率成为物探研究的关键。针对传统直接法难以实现并行求解的缺点,提出了在Beowulf集群环境下,采用并行PCG算法求解物探系统线性方程组。在集群环境下,该算法具有机器间相互通讯少、时间复杂度低等优点,并且易于并行实现。实验结果表明,采用PCG算法获得了良好的并行效果。 相似文献
3.
4.
提出了分布式存储环境下求解带状线性方程组的并行交替方向迭代算法。充分利用系数矩阵的结构特点,给出了在系数矩阵分别为Hermite正定矩阵和M-矩阵时算法的充分条件,并针对采用的分裂方式,讨论了参数的收敛范围,最后在HPrx2600集群系统上进行了数值计算,结果表明实算与理论相一致,算法简便可行且具有良好的并行性。 相似文献
5.
在传统的线性方程组高斯消元法中需要的时间复杂度,因此在实际工程中,一个高阶的线性方程组的求解可能需要数天甚至数月的时间来求解。为了进一步提高高阶线性方程组的求解效率,本文在基于消息传递接口的并行环境下,对线性方程组的连续高斯消元算法的设计与实现进行了研究,研究的结果表明相较于传统高斯消元法,并行环境下的高斯消元解法具有更好的性能。 相似文献
6.
系统工程计算在科学计算中,单台处理机不能满足需要,为提高计算效率和精度,采用并行处理是一个非常好的块三对角线性方程组的办法,提出了分布式环境下求解块三对角线性方程组的一种并行计算,算法是充分利用系数矩阵结构的特殊性,通过对系数矩阵进行适当地分解构造的迭代算法,使得算法需要在相邻处理机之间进行并行通信三次.并从理论上给出了算法收敛的一个充分条件.最后,在HP rx2600集群上进行了数值仿真,结果表明,实算与理论是一致的,提高了并行效率和精度. 相似文献
7.
针对弹塑性问题的有限元分析非常耗时,基于消息传递接口(MPI)集群环境,提出了残余平滑的子结构预处理共轭梯度并行算法。采取区域分解,将子结构通过界面条件处理为独立的有限元模型。整体分析时,每个处理器仅存储与其相关的子结构信息并生成局部刚度矩阵。采用对角存储方式和最小残余平滑法,设计出了结合残余平滑(MR)的并行子结构预处理共轭梯度(PCG)算法。并行算法中对负载平衡进行了探讨,对处理器间的通信进行了优化。利用子步法对弹塑性应力应变进行积分,根据预定的容许值自动调整每个子步的大小来控制积分过程的误差。在工作站集群上实现了数值算例,分析了算法的性能,计算性能与传统的PCG算法进行了比较。算例显示:所提算法具有良好的加速比和效率,优于传统的PCG算法,对弹塑性问题的有限元分析,是一种有效的并行求解算法。 相似文献
8.
针对非线性数值优化问题,提出一种在分布式环境下的基于牛顿法的并行算法。引入松弛变量,将不等式约束转换为等式约束,利用广义拉格朗日乘子将约束优化问题转换为无约束子优化问题。为了并行地求解这些子优化问题,将Newton迭代法中的Hessian矩阵进行适当的分裂,采用简单迭代法求解Newton法中的线性方程组。在理论上对该算法进行了收敛性分析。在HP rx2600集群上进行的数值实验结果表明并行效率达90%以上。 相似文献
9.
提出了一种在MIMD分布式存储环境下求解块三对角线性方程组的并行算法。基于Galerkin原理适当取基构造算法,使整个计算过程只在相邻处理机间通信两次,并给出了系数矩阵为对称正定矩阵时算法收敛的条件。在HP rx2600集群系统上进行的数值计算结果表明该算法与多分裂方法相比具有较高的加速比和并行效率。 相似文献
10.
11.
目前,在研究有限元并行计算时,讨论并行算法理论和并行算法设计与分析的居多,研究并行算法的实现并解决实际问题较少。在Beowulf集群环境下,采用EBE策略设计出基于PVM平台的EBE-PCG算法,并通过一个电法勘探的典型工程算例对该算法在有限元计算中的性能进行了测试。实验结果表明,该算法加速比和并行效率均较为理想;在处理同等规模的问题时,同CG算法、PCG算法相比,具有并行度更高,耗时更少等优点。 相似文献
12.
《Journal of Parallel and Distributed Computing》2002,62(2):306-325
This paper analyzes the performance of two parallel algorithms for solving the linear-quadratic optimal control problem arising in discrete-time periodic linear systems. The algorithms perform a sequence of orthogonal reordering transformations on formal matrix products associated with the periodic linear system and then employ the so-called matrix disk function to solve the resulting discrete-time periodic algebraic Riccati equations needed to determine the optimal periodic feedback. We parallelize these solvers using two different approaches, based on a coarse-grain and a medium-grain distribution of the computational load. The experimental results report the high performance and scalability of the parallel algorithms on a Beowulf cluster. 相似文献
13.
基于MPICH的Beowulf集群系统构建与性能评测 总被引:2,自引:0,他引:2
Beowulf集群系统是基于广泛应用的高性能网络环境的由一些微机组成的系统,它可以运行于很多操作系统如Linux、Windows。论文主要介绍了如何在Linux操作系统下构建Beowulf集群系统的方法,并利用矩阵相乘算法对该系统进行了系统性能测试。 相似文献
14.
15.
Beowulf集群系统是基于广泛应用的高性能网络环境的由一些微机组成的系统,它可以运行于很多操作系统,如Linux、Windows。Java在作为科学与工程计算语言方面,并没有显著的缺点,却有一些明显的优点。随着Java编译技术的进步,用户会发现用Java编写新应用程序将变得更有吸引力。HPJava语言作为一种支持科学和并行计算的Java新扩展语言,尤其适合大型的并行编程和分布式存储的计算机。HPJava是用Java来实现科学和并行编程的环境,它是基于Java语言的扩充。主要介绍了HPJava在Linux系统下构建集群的方法,并用矩阵相乘算法对该系统进行了性能分析。 相似文献
16.
The problem of solving systems of linear algebraic equations by parallel Monte Carlo numerical methods is considered. A parallel Monte Carlo method with relaxation is presented. This is a report of a research in progress, showing the effectiveness of this algorithm. Theoretical justification of this algorithm and numerical experiments are presented. The algorithms were implemented on a cluster of workstations using MPI. 相似文献
17.
工业CT图像的重建速度是工业CT产品的一个重要指标。使用并行算法是提高重建速度的一个行之有效的方法。提出了基于Beowulf集群系统的滤波反投影算法的并行实现方法;并且提出了基于Intel 奔腾SIMD技术的加速算法。在用4台P4/2.9 G微机构建的集群系统平台上对工业CT采集的4个不同的断层投影数据进行重建实验,实验数据表明使用SIMD技术可以得到4-6倍的加速,使用集群并行技术的算法能够得到1.5-3倍的加速,综合应用这两项技术可以得到8-10倍的加速。 相似文献