首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 83 毫秒
1.
针对集群系统内存不足导致大规模矩阵无法调入的情况,设计并实现一种基于文件拆分与高斯消去的线性方程组求解算法,将大规模系数矩阵文件连续拆分为多个规模可控的子文件进行存储和计算,使服务器空闲内存小且具有较好的计算能力。在ABEEMσπ模型中的应用结果表明,当Altix3700服务器任务提交量大、CPU占有率高时,该算法仍可以计算出蛋白质分子的电荷分布。  相似文献   

2.
吴素萍  王定康 《微计算机信息》2007,23(32):251-252,293
机器人技术中的碰撞问题可以被表示成量词消去问题,但由于有些碰撞问题的复杂性使得这些问题在单个微机上求解需要花费的时间很长或者根本就解不出来。本文提出了基于分布Maple系统下量词消去算法的并行化.并针对分布Maple系统的特点以及算法的特点,通过实例分析,给出了两种并行策略,以达到在Maple软件环境下提高处理器利用率,提高量词消去算法的效率的目的。  相似文献   

3.
为了解决串行部分选主元的高斯消去算法不能充分利用多核处理器的问题,提出并实现了并行多线程的部分选主元的高斯消去算法,并将整个算法进行了分析和优化,使数据的存储布局和算法的访存模式匹配,从而大幅提高了程序的性能。通过对本地Linux服务器以及美国亚马逊EC2云的多种平台上的实验结果的比较和分析,确定了部分选主元的高斯消去算法受缓存影响较大,所以在CPU和内存/缓存配置较为均衡的平台上运行性能最好。文中展现了一种高效率、扩展性好的多线程并行部分选主元的高斯消去算法以及将一般性串行算法进行并行化和优化的方法。  相似文献   

4.
针对大规模项目资源库中项目资源信息无序而导致无法准确快速找出项目资源库中所需资源的问题,提出了基于MapReduce的并行化模糊聚类划分算法。该算法首先抽象原始项目资源特征属性并标准化;其次,根据标准化后的特征属性建立项目相似矩阵,运用矩阵分块思想分割矩阵;然后,利用MapReduce技术处理分块矩阵并合并结果;最后,运用阈值评判划分成若干个有序的项目组。与K-means算法和遗传算法的对比实验结果证明:该算法具有较高的准确率和查全率,并且在大规模数据计算时能够得到较高的加速比,可以有效准确地划分项目资源。  相似文献   

5.
按行及按列划分的并行矩阵向量乘法的分析   总被引:1,自引:0,他引:1  
文中首先总结按衍划分和按列划分的并行矩阵向世乘法在原理上的异同。然后实现基于MPT模型的按行划分以及按列划分的矩阵向量乘法的程序,并分析了程序在基本框架方面的异同。最后给出测试这两种崔序的实验条件和任务,并对这两种程序在不同情况下的执行时问进行分析。  相似文献   

6.
为了能运用广义逆矩阵理论来研究B样条曲线的节点消去问题,以解决在B样条曲线曲面拟合过程中产生的冗余节点数据,提出了一种基于广义逆矩阵的B样条曲线节点消去算法,该算法首先利用广义逆矩阵在处理奇异性问题上的独特作用来获得B样条曲线的节点可以消去的充要条件;然后在此基础上,又提出了消去多个节点的算法,算法对每个可以消去的节点都可计算相应的广义逆矩阵,而且仅进行一次矩阵的相乘即可得到由消去这个节点而产生的新的控制顶点和节点。实验表明,该算法的精度优于或近似于现有的Tiller算法,而时间效率则同于或近似于Tiller的算法。由于通过调整算法中的误差阈值,可以有效地控制消去节点后的曲线与原来曲线的误差,因此算法可以用于工程实践。  相似文献   

7.
文中首先总结按行划分和按列划分的并行矩阵向量乘法在原理上的异同。然后实现基于MPI模型的按行划分以及按列划分的矩阵向量乘法的程序,并分析了程序在基本框架方面的异同。最后给出测试这两种程序的实验条件和任务,并对这两种程序在不同情况下的执行时间进行分析。  相似文献   

8.
使用CUDA平台,提出在通用图形处理器(GPGPU)上实现并行的全选主元、归一和消去等操作,加速实现并行全选主元高斯-约当消去法求解线性方程组的一种基本方法。该方法在CPU上完成解向量的恢复。根据NVIDIA公司最新Fermi架构图形处理器的特点,通过一系列的优化设计,使通用GPGPU相对Intel最新架构CPU的加速比超过了6.5倍,比Intel上一代CPU的加速比超过了10倍。  相似文献   

9.
模拟退火算法是一种能应用到求最小值问题或连续更新的学习过程(随机或决定性的)。在此过程中,每一步更新过程的长度都与相应的参数成正比,这些参数扮演着温度的角色。标准模拟退火算法仅进行串行优化,其效率很难提高。因此,考虑引入多种群群体优化机制构造并行算法,并对接受准则进行讨论。  相似文献   

10.
模拟退火算法是一种能应用到求最小值问题或连续更新的学习过程(随机或决定性的)。在此过程中,每一步更新过程的长度都与相应的参数成正比,这些参数扮演着温度的角色。标准模拟退火算法仅进行串行优化,其效率很难提高。因此,考虑引入多种群群体优化机制构造并行算法,并对接受准则进行讨论。  相似文献   

11.
通过《九章算术》解三元一次方程组的过程与增广矩阵的初等行变换进行对照,得出高斯消元法是中国古法的结论。  相似文献   

12.
Parallel Gaussian elimination on an MIMD computer   总被引:3,自引:0,他引:3  
This paper introduces a graph-theoretic approach to analyse the performances of several parallel Gaussian-like triangularization algorithms on an MIMD computer. We show that the SAXPY, GAXPY and DOT algorithms of Dongarra, Gustavson and Karp, as well as parallel versions of the LDMt, LDLt, Doolittle and Cholesky algorithms, can be classified into four task graph models. We derive new complexity results and compare the asymptotic performances of these parallel versions.  相似文献   

13.
运动检测和背景分离技术是智能视频监控系统中的一项关键技术。由于目前广泛使用的高斯混合模型背景分离法是在像素域的时间尺度上对像素进行分类,因此常常造成误判,且无法解决阴影问题。为解决此问题,提出了一种空间域上的背景分离法。该方法首先将像素检测从像素域拓展至空间域的局部窗口内;然后在得到前景点集后,再将此空间域检测思想结合像素亮度特征运用到阴影消除中;最后,对经典模型的部分参数估计方法进行了修改。相关的实验结果证明,该方法可用于提高背景分离的检测精度和实现运动物体阴影消除。  相似文献   

14.
In this paper, we propose a parallel convolution algorithm for estimating the partial derivatives of 2D and 3D images on distributed-memory MIMD architectures. Exploiting the separable characteristics of the Gaussian filter, the proposed algorithm consists of multiple phases such that each phase corresponds to a separated filter. Furthermore, it exploits both the task and data parallelism, and reduces communication through data redistribution. We have implemented the proposed algorithm on the Intel Paragon and obtained a substantial speedup using more than 100 processors. The performance of the algorithm is also evaluated analytically. The analytical results confirming with the experimental results indicate that the proposed algorithm scales very well with the problem size and number of processors. We have also applied our algorithm to the design and implementation of an efficient parallel scheme for the 3D surface tracking process. Although our focus is on 3D image data, the algorithm is also applicable to 2D image data, and can be useful for a myriad of important applications including medical imaging, magnetic resonance imaging, ultrasonic imagery, scientific visualization, and image sequence analysis.  相似文献   

15.
张博为  吴艳霞  顾国昌  孙霖 《计算机工程》2012,38(11):281-283,286
针对求解GF(2)域的线性方程组问题,改进现有的高斯消元算法,提出一种快速求解未知向量的硬件并行结构,通过增加消元与行循环位移的并行操作以降低时间复杂度,采用一类仿“smart memory”基本单元的互联完成整个算法在硬件上的映射。对结构的性能分析表明,对于密度远大于或小于0.5的n阶二值增广矩阵,并行结构平均计算时间约为2n个时钟周期,远小于软件算法时间(1/4n3)。在 3阶~50阶的二值非稀疏增广矩阵上的实现结果表明,与软件实现相比,该结构的性能可提高约2个数量级。  相似文献   

16.
Gaussian elimination is a canonical linear algebra procedure for solving linear systems of equations. In the last few years, the algorithm has received a lot of attention in an attempt to improve its parallel performance. This article surveys recent developments in parallel implementations of Gaussian elimination for shared memory architecture. Five different flavors are investigated. Three of them are based on different strategies for pivoting: partial pivoting, incremental pivoting, and tournament pivoting. The fourth one replaces pivoting with the Partial Random Butterfly Transformation, and finally, an implementation without pivoting is used as a performance baseline. The technique of iterative refinement is applied to recover numerical accuracy when necessary. All parallel implementations are produced using dynamic, superscalar, runtime scheduling and tile matrix layout. Results on two multisocket multicore systems are presented. Performance and numerical accuracy is analyzed. Copyright © 2014 John Wiley & Sons, Ltd.  相似文献   

17.
考虑短期内需求不确定情况下同类型产品的定价策略研究,引入高斯过程进行需求函数的学习,利用批量汤普森算法建立基于探索-利用的两阶段学习和决策过程的定价模型。在利用提出的GP-PTS(Gaussian processparallel Thompson sampling)算法完成数值实验和某平台出行的真实数据应用后得出的结果表明:算法的精准度取决于特征是否完备,若给定一个先验且产品特征完备时,基于GP-PTS算法模拟出来的价格会取得比目前平台价格策略更好的收益,为企业在短期内进行定价决策提供良好借鉴。  相似文献   

18.
《Parallel Computing》1990,15(1-3):133-145
This paper describes a parallel algorithm for the LU decomposition of band matrices using Gaussian elimination. The matrix dimension is n × n with 2r−1 diagonals. In the case when 1 r 2 p an optimal number of the processors, , is determined according to the equation . When 2 p r n a number of processors, p, statged by Veldhorst is adopted (see [7]). For band matrix with 2r-1 diagonals (1 r 2p) the task scheduling procedure with the aim to obtain maximal parallelism in system operation, i.e. good load balancing, is defined. The architecture of the system is of MIMD type. The connection between the processors is realised via a common bus. Communication and synchronization is performed by message passing technique.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号