共查询到19条相似文献,搜索用时 46 毫秒
1.
针对多块结构重叠网格并行装配的问题,设计了支持初始网格系统细分的多块结构重叠网格框架,并在此框架基础上提出了基于局部洞映射的并行挖洞算法、格心网格下可跨块寻点的并行搜索算法,使之可适应大规模并行数值模拟时的分布式计算环境。此算法被模块化的集成到了自主研发的大规模多块结构网格数值求解器(CCFD-MGMB)中,可支持大规模并行非定常多体分离数值模拟。并行测试结果表明,本文发展的算法具有良好的局部数据结构组织,数据可扩展性强。数值应用模拟结果表明了该算法的有效性及正确性,千核并行非定常数值计算效率(相对于64核)可达58%。 相似文献
2.
在现代飞行器设计中,数值模拟方法以低成本、高效率和高灵活性等优点成为研究飞行器空气动力学的重要方法.在旋翼型无人机流场模拟中,由于旋翼与机身存在相互作用,为获得精确模拟结果需要对整个无人机的流场进行模拟,因此,有效地模拟旋翼与机身的相对运动是实现成功模拟的关键步骤,这使得此类模拟问题极具挑战性.文章设计了一套求解旋翼型无人机空气动力学数值模拟问题的基于非结构滑移网格技术的高可扩展并行计算方法.该方法对控制方程的离散,在空间方向采用非结构移动网格有限元方法,时间推进采用全隐式二阶向后差分格式,最后采用一种并行Newton-Krylov-Schwarz方法求解离散后的非线性方程组.作为应用,文章对一个真实旋翼型无人机模型在悬停状态下的外流场进行了数值模拟,获得了一些非常详细的流场信息.数值结果显示,算法在天河2号上使用4 096个处理器核时仍具有接近线性的并行加速比,这为下一步开展旋翼型无人机的高保真度快速模拟奠定了良好的基础. 相似文献
3.
针对基于非结构网格方法的飞行器多体分离数值模拟中的局部网格重构问题,提出了一种基于单元相邻关系的重构区域构造方法。首先,根据单元半径比检查网格质量并标记重构单元;其次,通过网格单元的相邻关系对重构区域进行扩展;最后,通过标记非二边流形边的周围单元保证重构区域边界定义满足二边流形准则。基于该方法的某分离物投放数值实验中,成功进行了16次网格局部重构操作,重构后总体网格单元半径比的平均值达到0.71以上。计算结果和风洞实验数据的比较分析表明,数值实验精确地计算出分离物的运动轨迹和运动姿态,验证了非结构动网格重构过程的有效性。 相似文献
4.
复杂物理现象通常由多类复杂的物理过程紧耦合构成,其数值模拟也通常由适用不同物理过程的多类并行应用程序紧耦合完成.如何设计这些物理过程之间的联接算法,既要保证程序之间数据传递的高效,又要保证程序各自运行和总体模拟的高效,还要保证程序各自开发的独立,是一个值得研究的课题.该文基于广泛应用于高温高压多物理研究中的辐射流体力学和中子输运多物理并行数值模拟,在非结构网格上,提出了两种联接算法:完全松散联接算法和两层紧耦合联接算法,前者侧重于实现程序各自运行的高效和开发的独立,后者在前者的基础上,还权衡了数据传递和总体模拟的高效.在两台并行机的数百个处理机上,通信复杂度分析和数值实验结果表明两个算法均是有效的,可推广适用于辐射或中子输运与其他流体力学的多物理并行数值模拟应用中.特别地,两层紧耦合联接算法是高效可扩展的,取得了近似最优的并行性能. 相似文献
5.
6.
针对民机增升构型失速特性的数值模拟,我们基于贪婪负载平衡算法的剖分工具对多块结构网格进行区域分割,在某新型超级计算机系统上完成求解软件的移植、优化和测试,采用 2 亿量级的计算网格开展大规模并行计算研究,测试完成了万核级负载平衡的网格区域分割,实现了增升构型失速特性的 4 096 核数并行计算,并行效率达到 50% 以上,提高了工程应用中对复杂流动现象的数值模拟能力。数值模拟结果加深了对增升构型失速流动机理的理解,可以为增升装置设计优化提供有意义的参考依据。 相似文献
7.
存储是地球科学类软件的重要组成部分,周期性输出中间态和检查点会带来大量的访存操作,不恰当的访存设计会严重影响软件在大规模计算时的性能表现.针对地球科学类软件的存储问题,从软件层面提出一个重叠存储优化方法,通过设置额外的I/O进程隐藏输出过程.该重叠存储优化主要有3个优势:1)将输出和计算操作重叠在一起,实现了输出的重叠化和隐藏化;2)抑制了收集通信的开销,突破了收集操作的通信带宽瓶颈和内存限制;3)能容易地使用各种高级并行输出库函数.利用重叠存储优化了天河二号上的WRF,ROMS_AGRIF,GRAPES,并完成了性能测试.结果表明:经过存储优化后,程序的峰值性能都获得了显著的提升.还讨论了在固定总进程数下,计算进程和I/O进程数的最佳比例是多少.优化后的程序与原版相比,模式专家只需要在配置文件额外设置2个新变量即可使用,十分易于学习. 相似文献
8.
重叠网格预处理技术研究 总被引:4,自引:0,他引:4
论文主要讨论重叠网格预处理方法,并提出迷路算法应用于“挖洞”过程,为重叠网格预处理提供了高效、可靠的“挖洞”方法,算法复杂度低,实现简单,健壮性好;在多层次嵌套重叠方面,引入了重叠网格主从关系图有效解决多层次嵌套重叠带来的问题;在提高找重效率方面,建立基于网格的kd树加快了找重过程。实验结果表明在大网格量、复杂重叠区域时该重叠网格预处理技术仍能得到较理想的效率。 相似文献
9.
10.
11.
介绍了重叠网格并行计算主从对之间通信量最小化方法,通过迷路算法将主网格点进行分类,在保证计算正确的前提下将主从间通信量降至最小;在嵌套重叠情况下的通信时序控制方面,提出了重叠关系有向图避免通信等待和重复插值;实验结果表明该重叠网格通信优化处理方法能得到较理想的并行效率。 相似文献
12.
基于多区结构网格的计算流体力学方法,在并行处理的难点是多个网格数据块在计算资源上的高效合理分配,以实现大规模并行环境下的负载平衡。本文围绕负载平衡问题,介绍了 CCFD 软件开展的一些工作,包括:1. 面向结构网格的双层图剖分策略,通过细层图剖分环节考虑计算量和通信量的负载平衡;2. 建立可细分的重叠网格体系,并基于该体系建立了重叠网格系统的双级负载平衡模型。算例验证表明,所采用的负载平衡策略在大规模并行环境下能获得较高并行效率。 相似文献
13.
面向二维零质量射流的动网格数值模拟方法 总被引:1,自引:0,他引:1
为了研究零质量射流的作用机理和流场结构,发展了一套面向二维零质量射流的非结构化动网格模拟方法:采用控制容积法,引入动网格控制方程,并与任意曲线坐标系下矩阵形式的时均可压缩N-S方程组联合求解,迭代过程中采用弹性类推法进行动态网格更新.基于此方法,对二维零质量射流进行数值模拟,对计算获得的流场涡线和流线分布进行了分析和讨论,并与其他学者类似算例进行了比较,表明该方法能够合理揭示零质量射流的流场结构和作用机理,可实现二维零质量射流的数值模拟. 相似文献
14.
提出了一种基于图划分的全基因组并行拼接算法.该算法巧妙地将数据划分问题转化成图划分的问题,解决了传统数据划分算法中存在的节点负载不平衡的问题.同时,算法在建立关系图时有效地利用了WGS测序中所提供reads之间的长度信息和配对信息,使reads关系图能更准确地反映出数据之间的关系特性,从而提高了数据划分的准确性.实验结果表明,该算法可以准确地划分各种模拟数据、真实数据的数据集,相对于传统数据划分算法划分质量有了明显改善. 相似文献
15.
16.
17.
网格计算环境下分布并行计算的一种实现方法 总被引:2,自引:1,他引:2
网格计算为人们处理很多复杂问题提供了新方法。文章利用GlobusToolkit来构建网格计算环境,并把它扩展为分布并行计算的支撑环境,为实现分布并行计算提供了新方法。讨论了任务分布、系统通信和容错机制等关键问题。最后给出了基于网格计算环境下的一个分布并行计算实例,取得了令人满意的实验结果。 相似文献
18.
We present an effective approach to performing data flow analysis in parallel and identify three types of parallelism inherent in this solution process: independent-problem parallelism, separate-unit parallelism and algorithmic parallelism. We present our investigations of Fortran procedures from thePerfect Benchmarks andnetlib libraries, which reveal structural characteristics of program flow graphs that are amenable to algorithmic parallelism. Previously, the utility of algorithmic parallelism had been explored using our parallel hybrid algorithm in the context of solving the Reaching Definitions problem for Fortran procedures. Here we present new refinements that optimize performance by increasing the grain size of the parallelism, to improve communication on distributed-memory machines. The empirical performance of our optimized and unoptimized hybrid algorithms for Reaching Definitions are compared on this large data set using an iPSC/2. Our empirical findings qualitatively validate the usefulness of algorithmic parallelism.This research was supported, in part, by National Science Foundation grants CCR-8920078 and CCR-9023628-1, 2/5. An earlier version of this paper appears inProceedings of the 6th ACM International Conference on Supecomputing (Washington, D.C., July 1992), pp. 236–247. 相似文献
19.
序列拼接是全基因组测序的核心问题之一.基于“overlap-layout-consensus”的传统拼接软件虽然被人们应用于人类基因组拼接等项目,但它们始终不能有效解决全基因组重复序列的拼装问题.为了克服上述不足,Pevzner等提出了欧拉超路拼接算法.由于该算法要求构造一个复杂的de Bruijin图,因此用欧拉超路算法拼接大规模全基因组存在存储瓶颈问题.该文对欧拉超路拼接算法做了并行化研究并付诸实现,有效解决了欧拉超路算法中的存储瓶颈问题.测试结果表明,该并行算法具有良好的可扩缩性,能够解决较大规模全基因组的序列拼接. 相似文献