共查询到18条相似文献,搜索用时 78 毫秒
1.
迭代空间交错条块并行Gauss-Seidel算法 总被引:1,自引:0,他引:1
针对并行GS(Gauss-Seidel)迭代算法中数据局部性差、同步和通信开销大的问题,首先改进传统GS迭代,提出了多层对称GS迭代算法.然后给出了以迭代空间条块序作为执行序的串行执行模型.该模型通过对迭代空间进行"时滞"划分,对迭代空间条块内部多次迭代计算,提高算法的数据局部性.最后提出一种基于迭代空间条块的并行执行模型.该模型改进了迭代空间网格划分,并通过网格条块重排序减少了cache缺失率、通信启动和同步次数.实验结果表明,迭代空间交错条块并行算法比传统的区域分解方法和红黑排序并行算法具有更好的并行效率和可扩展性. 相似文献
2.
Stencil计算是一种科学和工程应用中常见的循环模式,而分块技术是一种提高数据局部性和并行性的强大转换方法。与以往直接对整个迭代空间进行分块的分块技术不同,提出了一种新的两层密铺分块的并行算法。首先,利用不同分块密铺数据空间;然后,所有分块沿时间维度扩展密铺迭代空间。该算法有以下优点:(1)最大化并发执行;(2)无冗余计算;(3)简洁的循环条件;(4)适应Stencil不同的尺寸、形状、阶数和边界条件。实验结果表明,对于3D27p Stencil,非周期边界的性能比Pluto高12%,周期边界的性能比Pochoir最高提升40%。 相似文献
3.
为了满足工程上一些模拟分析的需要,作者实现了基于AutoCAD AME的有限差分网格划分,并在实际工程分析中得以应用而且取得满意结果。 相似文献
4.
蝗虫算法(Grasshopper optimization algorithm,GOA),是一种以蝗虫群体行为为理论基础的新群智能算法,其性能优越,但仍然存在求解精度不高,收敛速度慢,陷入局部最优的不足.为了提高蝗虫算法的求解精度和收敛速度,减低其搜索盲目性,提出了一种基于差分进化改进的蝗虫优化算法(DE-GOA).在... 相似文献
5.
有限差分算法是一种基于偏微分方程的数值离散方法,被广泛应用于弹性波传播问题的数值模拟中。该算法访存跨度大、计算密度高、CPU利用率低,这在实际应用中成为了性能瓶颈。针对上述问题,在详析3D有限差分算法(3DFD)的基础上,基于Intel MIC架构,采用三步递进法对其进行优化:首先,通过分支消除、循环展开、不变量外提等基本优化法削减计算强度并为向量化扫除障碍;然后,通过分析数据依赖及循环分块,使用向量指令集改写核心算法等并行优化法,充分利用MIC协处理器多线程、长向量的机制;最后,在异构众核平台(CPU+MIC:Many Integra-ted Cores)下通过数据传输最小化、负载均衡等异构协同优化法实现CPU和MIC的并行计算。实验验证,与原有算法相比,优化后的算法在异构平台上获得了50~120倍的加速。 相似文献
6.
随着许多工程领域的计算量在不断加大,就提出了并行计算技术问题。而在目前高性能计算机系统中,最广泛使用的一种标准是MPI,它已成为一种并行程序的标准。MPI的理念就是需要将问题的并行求解算法转化为特定的适合并行计算模型的并行算法。麦克斯韦旋度方程的数值分析有多种方法,但其中的时域有限差分法是一种较好的方法。在用时域有限差分法进行数值计算时,需要进行大量的数据采集与计算。在这里,采用并行的方法给予实现,提高计算速度。 相似文献
7.
云计算MapReduce并行编程模型广泛应用于数据密集型应用领域,基于该模型的开源平台Hadoop在大数据领域获得了成功应用。然而,对于计算密集型任务,特别是迭代运算,频繁启动Map和Reduce过程将导致负载过大,影响计算效率。弹性分布式数据集(RDD)是一种基于内存的集群计算模型,有效地支持迭代运算,能够克服负载过大的问题。因此提出基于RDD模型的并行差分进化算法SparkDE。SparkDE首先将整个种群划分为若干个独立岛,然后将一个岛对应RDD中的一个分区,每个岛在RDD的一个分区中独立进化指定代数后,利用迁移算子在岛之间交换信息。利用标准测试问题对SparkDE、基于MapReduce模型的MRDE和基本DE进行对比实验研究。实验结果表明SparkDE求解精度高,计算速度快,加速效果明显,可以作为云计算平台的下一代优化器。 相似文献
8.
9.
针对基本果蝇优化算法在求解高维函数时存在求解精度低、迭代收敛速度较慢等问题,提出一种基于差分演化的果蝇优化算法。该算法将差分演化策略融合到果蝇优化算法中,对每代产生的群体进行变异、交叉、选择操作,增加种群的多样性,使其能更快、更有效地求解高维函数问题。对12个基准函数进行了仿真验证,结果表明,与基本的果蝇优化算法和差分演化算法相比,新算法在收敛速度、求解精度上都具有明显的优越性。 相似文献
10.
研究井间地震波场的形成过程以及波场的传播机理、规律,对于指导实际井间地震勘探有着重要的意义.从具有倾斜对称轴的横向各向同性介质(TTI)的二维三分量一阶速度-应力弹性波方程出发,采用高阶紧致交错网格差分算子对方程进行差分离散,得到了TTI介质中井间地震波场正演的高阶有限差分格式.并推导了TTI介质完全匹配层吸收边界条件公式和相应的紧致交错网格高阶差分格式,在此基础上实现了二维三分量TTI介质中井间地震波场模拟.数值算例表明:紧致交错网格高阶有限差分方法模拟的记录精度高,数值频散小,该方法能够精确的模拟复杂各向异性介质中的地震波传播过程,可以得到高精度的正演记录.完全匹配层吸收边界能有效地解决人工边界问题,是一种高效的边界吸收算法. 相似文献
11.
Stencil计算(模板计算)是科学工程应用中一类常见的嵌套循环算法.分块方法是提高数据局部性和并行性的高效优化技术之一,目前已有大量针对分块方法的探索,但现有工作往往对不同Stencil形状都采用同一处理方法.首先在空间层面引出“自然块”的概念来区分星型Stencil和盒型Stencil的特征,然后提出一个新的针对星型Stencil的2层密铺方案,此方案中自然块和它的后继块可以密铺数据空间区域,这些分块沿着时间维度扩展,能够密铺整个迭代空间.此外,针对星型Stencil设计了一个新颖的“2次更新”优化技术,改善了核内数据重用模式.理论分析表明:此方案相比现有方法有更低的缓存复杂度,实验结果证实了此方案的有效性. 相似文献
12.
基于精确划分的思想提出了一种新的集合差并行算法DIFF—DL。利用DL子算法查找最终全局序列中等分位置上的划分点,将数据平均划分并分配给所有处理机,使每个处理机具有相同的工作负载。给出了网络并行计算环境下的实验结果,并与DIFF-S、DIFF-NS算法进行了对比。理论分析和实验的结果都表明,DIFF-DL算法具有很高的并行效率和扩展性,原因是划分类算法的性能和划分后区间数据量的平均程度正相关。 相似文献
13.
随着无人机技术的成熟,配备摄像头的无人机被广泛应用于各个领域,自动高效地分析和理解从无人机收集的视觉数据非常重要.基于深度卷积神经网络的目标检测算法在许多实际应用上取得了惊人的成绩,但往往伴随着巨大的资源消耗和内存占用.因此,对于无人机上携带的计算能力受限的嵌入式设备来说,直接运行深度卷积神经网络非常具有挑战性.为了应对这些挑战,以经典的目标检测方法YOLOv3(you only look once)为例,基于迭代稀疏训练的剪枝方式可以实现有效的模型压缩,同时通过组合不同数据增强方式与相关优化手段保证压缩前后检测器精度误差在可接受范围内.实验结果证明,基于迭代稀疏训练的剪枝方法在YOLOv3上取得了非常可观的压缩效果,并且将精度误差控制在了2%以内,为无人机目标检测实时应用提供了支持. 相似文献
14.
《国际计算机数学杂志》2012,89(11):2588-2600
The paper gives the numerical stencil for the two-dimensional convection diffusion equation and the technique of elimination, and builds up the new iterative scheme to solve the implicit difference equation. The scheme's convergence and its higher rate of convergence than the Jacobi iteration are proved. And the numerical example indicates that the new scheme has the same parallelism and a higher rate of convergence than the Jacobi iteration. 相似文献
15.
当前, 应用广泛的一阶深度学习优化器包括学习率非自适应优化器和学习率自适应优化器, 前者以SGDM为代表, 后者以Adam为代表, 这两类方法都使用指数滑动平均法来估计总体的梯度. 然而使用指数滑动平均法来估计总体梯度是有偏差且具有滞后性的, 本文提出基于差分修正的SGDM算法——RSGDM算法. 我们的贡献主要有3点... 相似文献
16.
17.
逐次超松弛迭代方法被广泛应用于油藏数值模拟中压力方程的求解.其并行实现是提高模拟速度的重要途径.传统并行方案大都只是在一次迭代内进行数据划分,而没有进一步将数据划分与迭代空间划分相结合,故针对SOR算法和SMP(symmetric multi-processors)系统的特点,以OpenMP为并行化实现工具,提出了基于SMP的并行逐次超松弛迭代方法(parallelSOR).方法通过改变不同迭代步内数据点的更新次序,使不同区域内的数据点可以并行执行多次迭代.总结出针对三维油藏区域在数据空间划分和迭代空间合并上相对较优的策略,分析了迭代过程中网格块的生长形状.与传统的并行策略相比,该方法具有可减小同步开销、改进数据局部性、cache命中率高等优点.实验结果表明,该方法具有较高的加速比和效率. 相似文献