期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

迭代空间交错条块并行Gauss-Seidel算法 总被引：1，自引：0，他引：1

胡长军张纪林王珏李建江《软件学报》2008,19(6):1274-1282

针对并行GS(Gauss-Seidel)迭代算法中数据局部性差、同步和通信开销大的问题,首先改进传统GS迭代,提出了多层对称GS迭代算法.然后给出了以迭代空间条块序作为执行序的串行执行模型.该模型通过对迭代空间进行"时滞"划分,对迭代空间条块内部多次迭代计算,提高算法的数据局部性.最后提出一种基于迭代空间条块的并行执行模型.该模型改进了迭代空间网格划分,并通过网格条块重排序减少了cache缺失率、通信启动和同步次数.实验结果表明,迭代空间交错条块并行算法比传统的区域分解方法和红黑排序并行算法具有更好的并行效率和可扩展性. 相似文献

2.

基于空间密铺的并行Stencil算法

郭鹏袁良张云泉黄珊《计算机科学与探索》2019,13(2):181-194

Stencil计算是一种科学和工程应用中常见的循环模式,而分块技术是一种提高数据局部性和并行性的强大转换方法。与以往直接对整个迭代空间进行分块的分块技术不同,提出了一种新的两层密铺分块的并行算法。首先,利用不同分块密铺数据空间;然后,所有分块沿时间维度扩展密铺迭代空间。该算法有以下优点:(1)最大化并发执行;(2)无冗余计算;(3)简洁的循环条件;(4)适应Stencil不同的尺寸、形状、阶数和边界条件。实验结果表明,对于3D27p Stencil,非周期边界的性能比Pluto高12%,周期边界的性能比Pochoir最高提升40%。相似文献

3.

基于AutoCAD AME的有限差分网格划分

白雪峰陈瑶《计算机辅助设计与制造》1998,(1):48-51

为了满足工程上一些模拟分析的需要，作者实现了基于ＡｕｔｏＣＡＤＡＭＥ的有限差分网格划分，并在实际工程分析中得以应用而且取得满意结果。相似文献

4.

基于差分进化改进的蝗虫优化算法

宋长新马克《自动化技术与应用》2022,41(3):12-16

蝗虫算法(Grasshopper optimization algorithm,GOA),是一种以蝗虫群体行为为理论基础的新群智能算法,其性能优越,但仍然存在求解精度不高,收敛速度慢,陷入局部最优的不足.为了提高蝗虫算法的求解精度和收敛速度,减低其搜索盲目性,提出了一种基于差分进化改进的蝗虫优化算法(DE-GOA).在... 相似文献

5.

基于Intel MIC架构的3D有限差分算法优化

郝鑫郭绍忠《计算机科学》2017,44(5):26-32

有限差分算法是一种基于偏微分方程的数值离散方法,被广泛应用于弹性波传播问题的数值模拟中。该算法访存跨度大、计算密度高、CPU利用率低,这在实际应用中成为了性能瓶颈。针对上述问题,在详析3D有限差分算法(3DFD)的基础上,基于Intel MIC架构,采用三步递进法对其进行优化:首先,通过分支消除、循环展开、不变量外提等基本优化法削减计算强度并为向量化扫除障碍;然后,通过分析数据依赖及循环分块,使用向量指令集改写核心算法等并行优化法,充分利用MIC协处理器多线程、长向量的机制;最后,在异构众核平台(CPU+MIC:Many Integra-ted Cores)下通过数据传输最小化、负载均衡等异构协同优化法实现CPU和MIC的并行计算。实验验证,与原有算法相比,优化后的算法在异构平台上获得了50～120倍的加速。相似文献

6.

时域有限差分算法的并行实现

叶旭东邢涛《计算机与数字工程》2006,34(5):93-96

随着许多工程领域的计算量在不断加大，就提出了并行计算技术问题。而在目前高性能计算机系统中，最广泛使用的一种标准是MPI，它已成为一种并行程序的标准。MPI的理念就是需要将问题的并行求解算法转化为特定的适合并行计算模型的并行算法。麦克斯韦旋度方程的数值分析有多种方法，但其中的时域有限差分法是一种较好的方法。在用时域有限差分法进行数值计算时，需要进行大量的数据采集与计算。在这里，采用并行的方法给予实现，提高计算速度。相似文献

7.

SparkDE:一种基于RDD云计算模型的并行差分进化算法

谭旭杰邓长寿董小刚袁斯昊吴志健彭虎《计算机科学》2016,43(9):116-119, 139

云计算MapReduce并行编程模型广泛应用于数据密集型应用领域,基于该模型的开源平台Hadoop在大数据领域获得了成功应用。然而,对于计算密集型任务,特别是迭代运算,频繁启动Map和Reduce过程将导致负载过大,影响计算效率。弹性分布式数据集(RDD)是一种基于内存的集群计算模型,有效地支持迭代运算,能够克服负载过大的问题。因此提出基于RDD模型的并行差分进化算法SparkDE。SparkDE首先将整个种群划分为若干个独立岛,然后将一个岛对应RDD中的一个分区,每个岛在RDD的一个分区中独立进化指定代数后,利用迁移算子在岛之间交换信息。利用标准测试问题对SparkDE、基于MapReduce模型的MRDE和基本DE进行对比实验研究。实验结果表明SparkDE求解精度高,计算速度快,加速效果明显,可以作为云计算平台的下一代优化器。相似文献

8.

一种基于反向的差分算法

陈德祥《电脑编程技巧与维护》2014,(4):16-17

为解决约束优化问题,设计了一种基于反向向量的差分算法,通过对差分的选择算子的改进,在仿真实验里,能够得到较好的结果。相似文献

9.

基于差分演化的果蝇优化算法

潘欣高晓智《微型机与应用》2015,(1):23-25,28

针对基本果蝇优化算法在求解高维函数时存在求解精度低、迭代收敛速度较慢等问题,提出一种基于差分演化的果蝇优化算法。该算法将差分演化策略融合到果蝇优化算法中,对每代产生的群体进行变异、交叉、选择操作,增加种群的多样性,使其能更快、更有效地求解高维函数问题。对12个基准函数进行了仿真验证,结果表明,与基本的果蝇优化算法和差分演化算法相比,新算法在收敛速度、求解精度上都具有明显的优越性。相似文献

10.

TTI介质井间地震波场紧致交错网格高阶有限差分模拟及边界条件

刘薇薇张亮马光克隋波张扬《数值计算与计算机应用》2012,33(4):261-273

研究井间地震波场的形成过程以及波场的传播机理、规律,对于指导实际井间地震勘探有着重要的意义．从具有倾斜对称轴的横向各向同性介质（TTI）的二维三分量一阶速度-应力弹性波方程出发,采用高阶紧致交错网格差分算子对方程进行差分离散,得到了TTI介质中井间地震波场正演的高阶有限差分格式．并推导了TTI介质完全匹配层吸收边界条件公式和相应的紧致交错网格高阶差分格式,在此基础上实现了二维三分量TTI介质中井间地震波场模拟．数值算例表明：紧致交错网格高阶有限差分方法模拟的记录精度高,数值频散小,该方法能够精确的模拟复杂各向异性介质中的地震波传播过程,可以得到高精度的正演记录．完全匹配层吸收边界能有效地解决人工边界问题,是一种高效的边界吸收算法．相似文献

11.

一种基于空间密铺的星型Stencil并行算法

曹杭袁良黄珊张云泉徐勇军陆鹏起张广婷《计算机研究与发展》2020,57(12):2621-2634

Stencil计算(模板计算)是科学工程应用中一类常见的嵌套循环算法.分块方法是提高数据局部性和并行性的高效优化技术之一,目前已有大量针对分块方法的探索,但现有工作往往对不同Stencil形状都采用同一处理方法.首先在空间层面引出“自然块”的概念来区分星型Stencil和盒型Stencil的特征,然后提出一个新的针对星型Stencil的2层密铺方案,此方案中自然块和它的后继块可以密铺数据空间区域,这些分块沿着时间维度扩展,能够密铺整个迭代空间.此外,针对星型Stencil设计了一个新颖的“2次更新”优化技术,改善了核内数据重用模式.理论分析表明：此方案相比现有方法有更低的缓存复杂度,实验结果证实了此方案的有效性. 相似文献

12.

一种基于平衡划分的集合差并行算法

沈燕芬颜启华《计算机时代》2010,(11):46-49

基于精确划分的思想提出了一种新的集合差并行算法DIFF—DL。利用DL子算法查找最终全局序列中等分位置上的划分点,将数据平均划分并分配给所有处理机,使每个处理机具有相同的工作负载。给出了网络并行计算环境下的实验结果,并与DIFF-S、DIFF-NS算法进行了对比。理论分析和实验的结果都表明,DIFF-DL算法具有很高的并行效率和扩展性,原因是划分类算法的性能和划分后区间数据量的平均程度正相关。相似文献

13.

基于迭代稀疏训练的轻量化无人机目标检测算法

侯鑫曲国远魏大洲张佳程《计算机研究与发展》2022,59(4):882-893

随着无人机技术的成熟,配备摄像头的无人机被广泛应用于各个领域,自动高效地分析和理解从无人机收集的视觉数据非常重要.基于深度卷积神经网络的目标检测算法在许多实际应用上取得了惊人的成绩,但往往伴随着巨大的资源消耗和内存占用.因此,对于无人机上携带的计算能力受限的嵌入式设备来说,直接运行深度卷积神经网络非常具有挑战性.为了应对这些挑战,以经典的目标检测方法YOLOv3(you only look once)为例,基于迭代稀疏训练的剪枝方式可以实现有效的模型压缩,同时通过组合不同数据增强方式与相关优化手段保证压缩前后检测器精度误差在可接受范围内.实验结果证明,基于迭代稀疏训练的剪枝方法在YOLOv3上取得了非常可观的压缩效果,并且将精度误差控制在了2%以内,为无人机目标检测实时应用提供了支持. 相似文献

14.

A stencil of the finite-difference method for the 2D convection diffusion equation and its new iterative scheme

《国际计算机数学杂志》2012,89(11):2588-2600

The paper gives the numerical stencil for the two-dimensional convection diffusion equation and the technique of elimination, and builds up the new iterative scheme to solve the implicit difference equation. The scheme's convergence and its higher rate of convergence than the Jacobi iteration are proved. And the numerical example indicates that the new scheme has the same parallelism and a higher rate of convergence than the Jacobi iteration. 相似文献

15.

基于差分修正的SGDM算法

袁炜胡飞《计算机系统应用》2021,30(7):220-224

当前, 应用广泛的一阶深度学习优化器包括学习率非自适应优化器和学习率自适应优化器, 前者以SGDM为代表, 后者以Adam为代表, 这两类方法都使用指数滑动平均法来估计总体的梯度. 然而使用指数滑动平均法来估计总体梯度是有偏差且具有滞后性的, 本文提出基于差分修正的SGDM算法——RSGDM算法. 我们的贡献主要有3点... 相似文献

16.

基于有限差分法的轨道电路时域分析

张友鹏魏蕾赵斌张凤霞《计算机工程》2015,(6)

针对道床环境较恶劣时,在空间域难以区分轨道电路工作状态的问题,提出基于有限差分法的轨道电路时域解求解方法。利用偏微分方程数值解理论对轨道电路偏微分方程组进行离散,建立轨道电路的差分格式,并根据电压、电流在始端、终端的边界条件对调整态受电端时域电压响应进行分析,得到轨道电路的时域解。在不同初始电气参数下,通过算例仿真分析调整态受电端电压的变化情况,结果表明,所得时域解符合轨道电路的传输特性,可为轨道电路暂态分析提供理论依据。相似文献

17.

一种基于SMP的并行逐次超松弛迭代法

胡长军魏硕张纪林王珏《计算机研究与发展》2007,44(10):1688-1693

逐次超松弛迭代方法被广泛应用于油藏数值模拟中压力方程的求解.其并行实现是提高模拟速度的重要途径.传统并行方案大都只是在一次迭代内进行数据划分,而没有进一步将数据划分与迭代空间划分相结合,故针对SOR算法和SMP（symmetric multi-processors）系统的特点,以OpenMP为并行化实现工具,提出了基于SMP的并行逐次超松弛迭代方法（parallelSOR）.方法通过改变不同迭代步内数据点的更新次序,使不同区域内的数据点可以并行执行多次迭代.总结出针对三维油藏区域在数据空间划分和迭代空间合并上相对较优的策略,分析了迭代过程中网格块的生长形状.与传统的并行策略相比,该方法具有可减小同步开销、改进数据局部性、cache命中率高等优点.实验结果表明,该方法具有较高的加速比和效率. 相似文献

18.

一种基于加速迭代的大数据集谱聚类方法

陈丽敏杨静张健沛《计算机科学》2012,39(5):172-176

传统谱聚类算法的诸多优点只适合小数据集。根据Laplacian矩阵的特点重新构造新的Gram矩阵,输入新构造矩阵的若干列,然后利用加速迭代法解决大数据集的谱聚类特征提取问题,使得在大数据集条件下,谱聚类算法只需要很小的空间复杂度就可达到非常快的计算速度。相似文献