期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李中武谭伟伟周磊《数据与计算发展前沿》2013,4(5):51-57

针对民机增升构型失速特性的数值模拟,我们基于贪婪负载平衡算法的剖分工具对多块结构网格进行区域分割,在某新型超级计算机系统上完成求解软件的移植、优化和测试,采用 2 亿量级的计算网格开展大规模并行计算研究,测试完成了万核级负载平衡的网格区域分割,实现了增升构型失速特性的 4 096 核数并行计算,并行效率达到 50% 以上,提高了工程应用中对复杂流动现象的数值模拟能力。数值模拟结果加深了对增升构型失速流动机理的理解,可以为增升装置设计优化提供有意义的参考依据。相似文献

2.

Euler方程非结构网格分布式并行计算

朱君赵宁《数值计算与计算机应用》2007,28(3):161-166

在二维非结构网格情形下,针对PC集群并行系统提出一种新的并行算法,在前景网格与背景网格之间建立起逻辑映射关系来交换边界计算数据并提高并行效率,该算法在应用中能有效地保持并行系统的负载平衡和边界计算数据的正确交换,多个数值算例的结果表明了该算法的有效性。相似文献

3.

基于结构网格的高超声速流动大规模并行数值模拟研究

丁国昊李桦潘沙高洪贺《计算机工程与科学》2012,34(8):154-159

本文采用MPI消息传递模式自主开发出适用于高超声速流动数值模拟的并行计算软件,该软件以三维Navier-Stokes方程为基本控制方程来求解层流问题,应用基于结构网格的有限体积法对计算域进行离散,采用AUSMPW+格式求解对流通量,利用MUSCL插值方法获得高阶精度,时间格式上采用LU-SGS方法进行时间迭代以加快求解定常流动的收敛过程。在高性能计算机上针对不同高超声速流动进行大规模并行计算的结果表明,所开发的CFD并行计算软件具有较高的并行计算效率,为高超声速飞行器气动力/热的准确预测提供了高效工具。相似文献

4.

基于多块结构网格大规模并行计算的负载均衡设计及实现

刘夏真马文鹏张鉴陆忠华《数据与计算发展前沿》2013,4(5):18-25

结构网格具有网格生成速度快、质量高、数据结构相对简单、较适用于流体表面应力集中的运算等优点。在大规模 CFD（Computational Fluid Dynamics）并行计算中,需要将网格区域划分为多块网格,而多块网格之间的数据通信会制约并行计算能力的提高,因此对结构网格的负载平衡优化是提高并行计算能力的重点。本文提出了一个采用多层次 k-way 多约束条件图剖分算法来改进负载平衡的方案,并对 M6 翼型和 CRM 模型的多种规模进行了实际计算,结果证明多层次 k-way图剖分算法能够有效地优化负载平衡,在此基础上得到了最优节点间的计算负载平衡和通信负载平衡,最终达到了理想的并行效率。相似文献

5.

大规模非结构网格上基于PC的流线可视化研究 总被引：2，自引：0，他引：2

张文李晓梅《计算机研究与发展》2001,38(7):856-862

针对大规模非结构网格,提出了两种基于PC的流线可视化方法：内存映像文件方法（MMFM）和多线程out-of-core方法（MTOM）。利用八叉树空间划分大规模非结构网格,并讨论了数据块的组织结构。MMFM将大规模数据文件映像成虚拟RAM,流线构造与in-core方法类似,利用空间分块组织数据,减少缺页请求。MTOM利用多线程技术实现out-of-core流线构造,使得CPU和I／O重叠,隐藏时延,在多CPU上还可并行处理。测试结果表明,MMFM,MTOM都可利用较少内存进行大规模非结构网格的流线可视化,取得了较好的性能。相似文献

6.

大规模CFD多区结构网格任务负载平衡算法 总被引：1，自引：0，他引：1

唐波王勇献《计算机工程与科学》2014,36(7):1213-1220

针对现有负载平衡算法的适应度低、可扩展性差、通信开销度量不准确的缺陷, 提出一种大规模CFD多区结构网格任务负载平衡算法。通过对网格块的分割、网格块之间的组合映射、进程上网格计算量的调整来实现并行CFD任务负载平衡。实验结果表明, 该算法既适应同构平台也适应异构平台, 既适应网格块数多于进程数的情况也适应网格块数少于进程数的情况, 该算法可使得整个计算空间分配到各进程上的计算量负载平衡, 同时使得各进程间的最大通信开销最小。相似文献

7.

过渡到大规模并行计算策略探讨

下载免费PDF全文

李晓梅莫则尧《计算机工程与科学》1993,15(2):10-16

本文综合阐述大规模并行处理机的发展概况,进行大规模并行计算存在的5个方面困难,以及探讨大规模并行计算所采用的策略,特别提出了LLNL的研制者们所采用的平稳过渡到大规模并行计算的一些策略。相似文献

8.

并行燃烧数值模拟计算优化——面向自适应非结构网格的动态负载平衡方法

王姝王小鸽杨广文《计算机工程与应用》2013,(21):220-225

燃烧数值模拟计算通常采用非结构网格模拟计算区域。在非结构网格上进行并行模拟计算时,其自适应方式使得不同进程上的计算负载频繁变动,且差异巨大,导致并行计算效率低下。为了提高并行计算的效率,一个有效的方法是采用动态负载平衡技术。提出一种针对燃烧的化学反应状态的动态负载平衡方法,该方法采用不同策略对化学反应不同阶段各进程上的计算负载进行预测,根据预测结果平均进程间的计算任务,达到负载平衡。实验分析表明,该方法能有效地降低进程间的负载不平衡程度,使得模拟计算的总体运行时间降低了10％。相似文献

9.

大规模结构网格数据的相关性统计建模轻量化方法

杨阳武昱汪云海曹轶《计算机研究与发展》2023,15(3):676-689

高置信度的数据可视分析对于大规模数值模拟至关重要,但是当前高性能计算机的存储瓶颈导致可视分析应用获取原始高分辨率网格数据越来越困难. 基于统计建模的方法能够极大降低高分辨数据存储成本,但是重建数据的不确定性高. 为此,提出了一种大规模结构网格数据的相关性统计建模轻量化方法,用于对并行数值模拟生成的大规模多块体数据进行高效分析与可视化. 该方法的技术核心是通过数据块间的统计相关性,指导邻接数据块的统计建模,从而有效地保留数据统计特征,且不需要对不同并行计算节点中的数据块进行合并与重新分块. 通过耦合数据块的数值分布信息、空间分布信息和相关性信息,该方法可以更精确地重建原始数据,降低可视化的不确定性. 实验测试采用了最大10亿网格规模的5组科学数据,定量分析结果显示,在相同数据压缩比下,该方法相比现有方法可将数据重建精度最大提升近2个数量级.

相似文献

10.

多层油藏模拟并行计算与负载平衡

刘青昆舒继武归丽忠张德富《计算机研究与发展》2004,41(2):306-310

在油藏数值模拟并行计算中,提高计算速度和资源利用率是一个重要的研究方向,给出分布式并行环境下一种多层油藏模拟并行计算的整体优化方法,其特点是使用高效的区域分解方法并行求解,动态选择两种不同的计算粒度,有效地克服了负载不均衡带来的性能下降问题,实际模型计算表明,此方法策略减少了整体模拟计算时间,并获得较高加速比,采用的算法适用于一类多层油藏模型问题。相似文献

11.

WCNS高精度并行软件的大规模计算研究 总被引：1，自引：0，他引：1

王光学张玉伦李松邓小刚《计算机工程与科学》2012,34(8):125-130

本文通过求解任意坐标系下的定常雷诺平均N-S方程和SST两方程湍流模型,采用五阶精度的加权紧致非线性格式(WCNS-E-5),实现流场的高精度数值模拟;基于分布式存储系统,采用MPI并行编程环境、非堵塞通信机制和遗传算法负载平衡,实现高精度模拟软件的并行化。在国防科学技术大学高性能计算应用研究中心的"天河"系统上完成软件移植、测试,通过对DLR-F6翼身组合体的模拟,说明软件并行策略和开发的正确性。最后,实现某民机全机的高精度并行模拟,网格规模达到1亿,为下一步WCNS高精度并行软件的大规模工程实际应用打下了坚实基础。相似文献

12.

大规模并行 CFD 软件的负载平衡设计

梁姗刘夏真袁武《数据与计算发展前沿》2016,7(6):54-60

基于多区结构网格的计算流体力学方法,在并行处理的难点是多个网格数据块在计算资源上的高效合理分配,以实现大规模并行环境下的负载平衡。本文围绕负载平衡问题,介绍了 CCFD 软件开展的一些工作,包括：1. 面向结构网格的双层图剖分策略,通过细层图剖分环节考虑计算量和通信量的负载平衡;2. 建立可细分的重叠网格体系,并基于该体系建立了重叠网格系统的双级负载平衡模型。算例验证表明,所采用的负载平衡策略在大规模并行环境下能获得较高并行效率。相似文献

13.

CFD并行计算中的多区结构网格二次剖分方法与实现

王勇献张理论刘巍车永刚徐传福王正华《计算机研究与发展》2013,50(8)

在多区结构网格计算流体动力学(computational fluid dynamics,CFD)并行模拟中,为了与并行计算资源相适应,经常需要对原始流场网格进行二次剖分与区块分组.在对区块分组和网格二次剖分进行了总结综述的基础上,重点提出针对多区结构网格二次剖分的两种策略:几何剖分和嵌套二分.基于这两种策略完成了剖分软件工具TH-MeshSplit,可实现初级方式、专业方式和专家方式3种运行方式,为用户在自动化与灵活性方面提供了多样化选择.数值实验结果表明,两种剖分策略及其实现软件可在较短时间内完成复杂的剖分,剖分后的网格在负载平衡性、计算通信比等方面具有更优的性能,从而为后续CFD流场的高效并行加速求解奠定了基础. 相似文献

14.

大规模并行计算机电源系统稳定性分析 总被引：1，自引：0，他引：1

下载免费PDF全文

姚信安宋飞胡世平罗安《计算机工程与科学》2009,31(3)

大规模并行计算机电源系统通常都采用分布式供电架构,系统稳定性设计是其中的难点和关键点。本文提出了一种实用的输入输出阻抗匹配方法,详细分析了变换器的输入和输出阻抗,绘制了阻抗特性波特图,根据仿真结果确定了总线上的输出电容。电源系统测试和运行结果表明,在总线上放置合适的电容可以解决系统稳定性问题。相似文献

15.

一个模拟网格上并行作业调度的离散事件系统

王庆江《小型微型计算机系统》2008,29(7)

为评估计算网格上并行作业的无中心式调度,设计了基于离散事件的模拟系统J3S.离散事件包括作业提交、开始和终止,作业状态可以是等待、运行或完成.事件引起作业状态的变化 ,并触发网格层次或本地层次调度.作业由网格工作负荷模型产生,该模型基于并行计算机工作负荷模型构建.网格层次调度通过网格调度器之间的协作完成.本地层次调度模拟改进的装填法,使作业可有不同的调度优先级.网格资源性能可有差异,作业执行性能依赖作业指派.模块化实现使J3S可模拟网格上并行作业的无中心式调度的各种场景. 相似文献

16.

基于HD F5实现多区结构网格CFD程序的并行I/O

杨丽鹏车永刚《计算机研究与发展》2015,(4):861-868

计算流体动力学（computational fluid dynamics ,CFD）是高性能计算重要应用领域之一,其计算涉及大量数据访问．在大规模并行计算情况下,串行I/O的性能与计算能力不匹配,I/O成为性能瓶颈．并行I/O 是解决这一问题的主要途径之一．针对一个真实多区结构网格CFD 并行程序 HOSTA （high‐order simulator for aerodynamics）,基于HDF5（hierarchical data format v5）数据存储格式及其并行I/O编程接口,实现了其主要数据的并行I/O．在一套有6个I/O服务器结点的高性能计算机系统上,采用实际C FD算例进行了性能测试．对一个三角翼算例,并行I/O相对于串行I/O的性能加速比达到21．27,最高获得5．81 GBps的I/O吞吐率,并使程序整体性能提高10％以上;对一个网格规模更大的简单翼型算例,并行I/O最高获得了6．72 GBps的I/O吞吐率．相似文献

17.

Massively parallel SIMD simulation of markovian DEDS: Event and time synchronous methods

Stephen G. Strickland Robert G. Phelan 《Discrete Event Dynamic Systems》1995,5(2-3):141-166

We examine two schemes for parametric parallel simulation on SIMD supercomputers. In SIMD machines, the parallel processors execute a common instruction stream using local data-under the control of a front-end processor. In contrast to most parallel simulation approaches-which simulate a single system using multiple processors-we simulate distinct parametric variants at each processor. We extract some of the common computation embedded in these simulations and perform it on the front-end, leaving the rest to the parallel processors.The first simulation approach, which we call time synchronous, is essentially Vakili's standard clock. This approach generates a uniformized event process on the front-end processor which is thinned at each back-end processor based on local state information. The second scheme, which we call event synchronous, generates a standard Poisson process on the front-end, which is time-scaled and marked on the back-end processors.We develop a framawork for comparing these methods based on their simulated event rate (number of simulated events per real time unit). We show that the time synchronous method can be tuned to optimize the event rate for a given family of systems and we solve this optimal standard clock problem for several test cases. Finally we describe implementation issues peculiar to the SIMD architecture. Our focus is primarily on the M/M/1/K queue, but the methods extend to more general Jackson networks. 相似文献