首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
高效的并行有限差分Stencil 算法对于求解大型线性方程组是十分重要的.针对并行有限差分Stencil 算法中数据局部性差、同步和通信开销大的问题.首先改进传统有限差分Stencil 算法,提出了多层对称遍历有限差分Stencil 算法.然后给出了以迭代空间条块序作为执行序的串行算法,通过沿时间轴对迭代空间进行时滞划分,在不改变迭代算法性质的同时,对迭代空间条块内部多次迭代计算,提高算法的数据局部性.最后提出一种基于迭代空间条块的并行算法,该算法利用改进的多面体模型对迭代空间网格划分,并通过网格条块重排序减少了Cache 缺失率、通信启动和同步次数.理论分析和实验结果表明,该并行模型比传统的区域分解方法和红黑排序并行算法具有更好的数据局部性,并行效率和可扩展性.  相似文献   

2.
针对网络并行环境的计算能力强而通信相对较慢的实际情况,给出了一种局域网上求解线性方程组的并行Gauss-Seidel迭代算法.该算法将线性方程组的系数矩阵及右端项按行分块,然后将分块的系数矩阵及右端项按卷帘方式存储在各处理机,每次迭代通过循环传送已求出的部分解分量以减少处理机间的通信开销,提高并行算法的效率.试验结果表明该算法具有较高的并行效率和加速比.  相似文献   

3.
几何迭代法,即渐进迭代逼近(progressive-iterative approximation,PIA),作为一种有效的数据拟合方法,吸引了众多研究者的关注,并获得广泛的应用.针对经典LSPIA算法收敛速度较慢的问题,提出一种基于Gauss-Seidel迭代方法的快速PIA算法,称为GS-LSPIA.首先,从给定的...  相似文献   

4.
5.
讨论大规模并行机数据并行语言编译技术中的并行循环迭代分布算法。数据并行语言的数据分布方式有BLOCK,BLOCK(1),BLOCK(N)和:4种,而循环迭代分布是与数据分布对准的,文中给出与这些分布方式对应的循环迭代分布算法,算法允许确定数据分布方式的对准数组的下标可以是任意系数的一阶线性表达式;并行循环的循环增量可以为任意非零整数。  相似文献   

6.
提出了一种新的面向科学计算的构件技术——编译指导的构件并行技术,旨在提高构件间的并行度和数据的局部性,避免通信瓶颈。该技术分为两个阶段:域划分和子构件组合。其中域划分利用了编译时的数据依赖分析技术,子构件纪合利用了所设计的基于区间数据的模糊聚类算法。  相似文献   

7.
基于种群迭代搜索的智能优化算法在农业、交通、工业等很多领域都取得了广泛的应用.但是该类算法迭代寻优的特点使其求解效率通常较低,很难应用到大规模、高维或实时性要求较高的复杂优化问题中.随并行分布式技术的发展,国内外很多学者开始着手研究智能优化算法的并行化.本文首要介绍了并行智能优化算法的基本概念;其次从协同机制、并行模型以及硬件结构3个维度综述了几类常见的并行智能优化算法,详细分析阐述了它们优点及不足;最后对并行智能优化算法的未来研究进行了展望.  相似文献   

8.
卫星遥感图像并行几何校正算法研究   总被引:7,自引:0,他引:7  
几何校正是遥感图像处理过程中的重要环节,具有计算量大、耗时长的特点,导致遥感图像处理的效率低下.该文提出一种分布存储环境下的并行几何校正算法,每个处理器通过计算本地输入子图像在目标图像中的范围,确定其需要进行重采样计算的区域,使计算过程中所需的数据均为本地数据,很好地解决了数据局部性问题.文章利用首尾相连的闭线段近似表示理想的输出图像块边界这一思想,详细讨论了局部输出区域的计算方法,并采用一种新的存储结构用于保存校正后的输出图像块信息.在机群系统上对算法进行实现,结果表明该算法具有良好的并行性能.  相似文献   

9.
张帅  徐顺  刘倩  金钟 《计算机科学》2018,45(10):291-294, 299
分子动力学模拟存在空间和时间的复杂性,并行加速分子的模拟过程尤为重要。基于GPU硬件数据并行架构的特点,组合分子动力学模拟的原子划分和空间划分的并行策略,优化实现了短程作用力计算Cell Verlet算法,并对分子动力学核心基础算法的GPU实现做了优化和性能分析。Cell Verlet算法实现首先采用原子划分的方式,将每个粒子的模拟计算任务映射到每个GPU线程,并采用空间划分的方式将模拟区域进行元胞划分,建立元胞索引表,实现粒子在模拟空间的实时定位;而在计算粒子间的作用力时,引入希尔伯特空间填充曲线方法来保持数据的线性存储与数据的三维空间分布的局部相关性,以便通过缓存加速GPU的全局内存访问;也利用了访存地址对齐和块内共享等技术来优化设计GPU分子动力学模拟过程。实例测试与对比分析显示,当前的算法实现具有强可扩展性和加速比等优势。  相似文献   

10.
并行数据操作算法和查询优化技术   总被引:22,自引:4,他引:22       下载免费PDF全文
李建中 《软件学报》1994,5(10):11-23
本文是并行数据库的查询处理并行化技术和物理设计方法”一文的续篇,继续综述并行数据库系统的另外两个重要研究领域:并行数据操作算法和并行数据库查询优化技术.最后,作为并行数据库系统研究与进展情况综述的结尾,本文将探讨并行数据库系统今后的研究方向和问题.  相似文献   

11.
刘勇  陆林生  何王全 《软件学报》2010,21(Z1):290-297
考虑到硬件管理Cache 多级存储结构在功耗和面积方面的开销过大,众核处理器倾向于采用软件管理的多级存储结构,这就需要软件规划好程序的数据在各级存储上的布局和传输.尝试了一种依赖程序原有循环结构和问题规模的简易数据自动分块方法,根据循环层内的数据访存范围进行相应的分块,避免数据复杂的依赖关系分析,使得该方法易于在编译器中实现.同时可根据需要进一步结合程序变换如循环交换、循环联合和循环分裂等方法得到更佳的分块参数.实验结果表明,在大多数问题规模下与一般分块方法的优化性能相当,但在某些特定问题规模下能够获得较高的优化性能.  相似文献   

12.
The iteration space of a loop nest is the set of all loop iterations bounded by the loop limits. Tiling the iteration space can effectively exploit the available parallelism, which is essential to multiprocessor compiling and pipelined architecture design. Another improvement brought by tiling is the better data locality that can dramatically reduce memory access and, consequently, the relevant memory access energy consumptions. However, previous studies on tiling were based on the data dependence, thus arrays without dependencies such as input arrays (data streams) were not considered. In this paper, we extend the tiling exploration to also accommodate those dependence-free arrays, and propose a stream-conscious tiling scheme for off-chip memory access optimization. We show that input arrays are as important, if not more, as the arrays with data dependencies when the focus is on memory access optimization instead of parallelism extraction. Our approach is verified on TI’s low power C55X DSP with popular multimedia applications, exhibiting off-chip memory access reduction by 67% on average over the traditional iteration space tiling.  相似文献   

13.
Tiling is a known problem especially in the field of computational geometry and its related engineering branches. In fact, a tile is a set of points in the Cartesian space. The goal is to partition the space of the points as tiles with optimal dimensions and shapes such that a number of predefined semantic relations holds amongst the tiles. So far, this problem has been solved in special cases with two or three dimensions. The problem of determining the optimal tile is an NP-Hard problem. Presenting a novel constraint genetic algorithm in this paper, we have been able to solve the tiling problem in Cartesian spaces with more than two dimensions, for the loop parallelization problem.  相似文献   

14.
图像重采样问题应用广泛,具有计算复杂度高、运行时间长的特点.为了提高处理性能,针对Cluster并行环境,对一种并行几何校正算法进行改进,提出了并行重采样算法PIWA—LOC.采用一种新的存储结构用于保存各计算结点上的不规则输出子图像,并提出线段近似法用于获取不规则输出子图像的边界,使算法的通用性大大提高,适用于具有复杂几何变换的图像重采样问题.实验结果表明,该算法对大图像的重采样问题具有良好的并行性能,且网络带宽越高算法的可扩展性越好.  相似文献   

15.
论文提出了一种在WDM光网络中支持优先级的备用路由算法,该算法结合波长的使用情况,通过给优先级较高的光路建立请求预留较多的备用路由,从而降低了高优先级的光路连接的阻塞率。同时由于使用了备用路由,使较低优先级的光路建立请求性能得到优化。同现有的支持优先级的算法相比,该算法更多地考虑了路由问题,而且也增强了网络的抗毁性。计算机仿真结果表明,该算法在支持优先级的同时能有效降低网络各优先级光路的阻塞率。  相似文献   

16.
WDM网络中备用路由下支持优先级的一种新的波长分配算法   总被引:3,自引:0,他引:3  
文章研究了WDM光网络中动态业务下的波长分配问题,提出了一种改进的动态门限算法。该算法不仅能保证高优先级的请求有较低的阻塞率,同时还能优化低优先级请求的阻塞率,从而改善全网的平均阻塞率。此外,该算法利用相对最小影响算法,能更加精确地描述波长分配对全网状态的影响,从而更加有效地利用了网络资源。计算机仿真表明,该算法性能较好。  相似文献   

17.
模拟退火遗传算法的轮廓线拼接研究   总被引:1,自引:0,他引:1  
基于断层数据的三维重构是三维数据场可视化技术的主要研究内容,重构物体的三维模型也是分析、仿真的前提.应用模拟退火遗传算法设计和实现了三维物体表面重建算法.通过在遗传算法中融人退火处理操作,提高了种群的多样性,避免了遗传算法中存在的早熟收敛问题,有效地增强了算法的全局寻优能力.此外,提出了一种基于边的最小交叉多边形算法,提高了交叉操作效率.根据轮廓线拼接问题的特点,设计了针对性强的交叉、变异操作.实验结果表明,算法有效地提高了传统的全局法轮廓线拼接算法的效率.  相似文献   

18.
This paper describes a neuro-based optimization algorithm for 2 dimensional (2-D) tiling problems which are to pack a checkerboard with polyominoes. First, we review the previous neuro-based parallel algorithms for tiling problems without rotation. Next, we expand the algorithm, which has been proposed for 2-D tiling problems without rotation, to the optimization one for 2-D tiling problems with rotation, where a novel nonlinear energy function is defined. Finally, we show the simulation results and the estimation.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号