首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
组合旋成体高超音速稀薄气体绕流的统计模拟   总被引:2,自引:0,他引:2  
1.引 言 近年来,采用Monte-Carlo跟踪模拟法求解Boltzmann方程取得了很大的进展.计算实践表明,这是解决有关稀薄气体绕流问题行之有效的方法.中借助于Bird-Ta-kagi的思想,对二维稀薄气体绕流得到了好的数值结果.本文则在的基础上,进一步推广而建立了三维统计模拟模型.它具有很大的通用性,原则上可适用于解有攻角的任  相似文献   

2.
绕流问题中若物体边界不规则会给格子Boltzmann方法中离散边界的格点类型判断以及后续边界处理带来一定的困难.本文提出了简单的三角形不包含算法来有效判断不规则离散边界点的格点类型.针对离散边界,通过改进虚拟平衡态分布函数插值法中的虚拟速度,提高了格子Boltzmann方法在边界处的数值稳定性和精度.通过对经典的二维圆柱,方柱和椭圆柱绕流问题的数值模拟,验证了本文方法的有效性.  相似文献   

3.
为了求解三维欧拉方程,对隐式时间离散格式间断有限元方法进行了研究。根据间断Galerkin有限元方法思想,构造内迭代SOR-LU-SGS隐式时间离散格式,结合当地时间步长技术、多重网格方法,实现了三维流场的计算。数值计算了ONERA M6机翼、大攻角尖前缘三角翼以及DLR-F4翼身组合体的亚声速绕流问题。结果表明,加入SOR内迭代步的LU-SGS隐式算法具有较大的优势,相较于GMRES算法所占用的内存少且收敛速度相当,是LU-SGS算法的3倍以上。针对三维算例,具有较好的稳定性和较高的收敛速度,能够给出准确的流场信息。与原方法相比,SOR-LU-SGS方法无论是在迭代步数上还是在CPU时间上,效率均有明显提高,适合于三维复杂流场计算。  相似文献   

4.
三维离散单元法数值模拟中查找邻居元的一种新算法   总被引:1,自引:0,他引:1  
将三维离散单元法(DEM)运用到模拟泥石流运动的计算中时,发现查找邻居元耗费大量时间和空间。为了克服缺点,文中提出了一种新的算法——链树图法,并对其原理、算法、运行时间和空间进行分析。通过与原算法盒子空间法的比较表明,新算法在运行时间和空间都明显优于原算法。  相似文献   

5.
为更好模拟行人疏散过程中微观个体行为,考虑行人身材半径及在疏散过程中行人步行速度随运动状态变化,将社会力模型运行规则引入元胞自动机模型,建立了一种社会力模型计算步行速度、空间离散化程度和步行速度较高的疏散模型,用于模拟紧急情况下的行人疏散过程。在该模型中空间划分为更小网格,每个行人占用一到多个单元格,行人的身材半径不再不变,每个行人移动的距离由其速度决定,根据基于速度的出口选择方法和行人运动规律,通过数值模拟分析,研究了疏散过程中的动态性。研究表明基于速度的网格移动数量、行人数量、期望速度、行人身材半径、松弛时间等参数影响疏散效率,结合连续模型的优点能够更加客观真实刻画疏散过程,有助于离散模型描述行人疏散微观行为特征。  相似文献   

6.
作为一种典型的拉格朗日型无网格数值方法,光滑粒子流体动力学(SPH)方法在模拟自由表面流问题时具有天然优势。但是,该方法计算量大、耗时长,为此提出了一种基于粒子分解的SPH并行算法。该算法将所有粒子平均分配到各个进程进行计算,每个时间步通信仅调用一次发送、接收和广播函数,因此易于实现且可扩展性较好。应用该并行算法对二维溃坝流和三维液滴冲击液膜问题进行数值模拟,结果表明:该并行算法能显著减少模拟所消耗的计算时间,有利于进行三维大规模计算问题的数值模拟;当粒子数大于百万时,最大加速比可达30以上。  相似文献   

7.
光流跟踪作为一种重要的二维运动估计技术,在运动目标检测和跟踪中有着重要的作用.L-K光流跟踪算法是一种利用Newton-Raphson梯度下降法进行图像匹配的算法,所以离散图像的偏导数的计算显得尤为重要.由于数字图像离散的方格结构导致在计算各阶偏导数时产生较大的误差.利用微分平滑滤波的方法先利用一个连续的基础函数模拟离...  相似文献   

8.
基于Realize k-ε湍流模型对圆球绕流进行数值模拟分析。改变颗粒雷诺数和旋转速度系数,获得单颗粒旋转作用所引起的气体湍流变动规律:颗粒旋转速度系数越大,颗粒对尾迹区的湍流削弱作用越大,尾迹涡流区湍动能越小,气体湍流变动相应越小;单颗粒旋转湍流变动与颗粒雷诺数、颗粒旋转速度系数呈二次多项式。  相似文献   

9.
基于格子 BGK建立风场模型时 ,针对所用笛卡尔晶格的离散速度数少时 ,风场模型的数值精确度低 ;而离散速度数多时 ,计算速度慢的局限性 ,提出用体心立方晶格 D3bQ15离散三维风场。 D3bQ15晶格更好的各向同性及特定空间较少的采样数 ,调和了由离散速度数决定的风场模型的精确度与计算效率之间的矛盾。实验证明 :飘雪场景仿真中风场建模时 ,用 D3bQ15晶格比用笛卡尔晶格能更好地满足飘雪场景真实性和实时性的要求。  相似文献   

10.
GPU通用计算在LBM方法中的应用   总被引:1,自引:0,他引:1  
提出了一种结合GPU通用计算与计算流体力学中的LBM算法来模拟二维流场的方法.根据GPU通用计算和LBM方法的基本原理,利用OpenGL的离屏渲染技术FBO和Cg语言,基于LBM方法中的D2Q9模型对二维方腔流进行数值模拟,并设计出基于OpenGL的GPU通用计算的二维流场数值计算框架.实验结果表明,利用GPU模拟与CPU模拟流场的数值结果相当吻合,特别地,利用GPU进行数值模拟实验的速度是利用CPU的4倍左右.  相似文献   

11.
Cluster环境下p—HPF编译器支持的并行计算范式   总被引:2,自引:0,他引:2  
p-HPF是研制的一个符合HPF(high performance Fortran)规范的并行编译系统,以HPF为核心实现多范式并行计算是开发大型并行应用系统的基础。首先论述了Cluster环境下的并行运行范式,包括farm parallel范式、流水线并行、流循环并行、基于数据并行和组合数据并行等,抽象分析了它们的性能,接着给出了利用p-HPF的外部过程机制、任务并行机制以以FORALL,INDEPENDENT DO等典型并行语句实现几种典型并行范式的方法,给出了实例程序,对实例进行了实际运行并对运行结果进行了分析。  相似文献   

12.
p—HPF支持多范例并行计算的并行编译技术   总被引:1,自引:1,他引:0  
多范例并行是大规模并行应用系统的本质特征,实现p-HPF对多范例并行计算的编译支持不仅可以弥补数据并行示例本身的一些缺点,而且可以提高并行应用系统的效率,文中在论述cluster环境下Global,Local,Serial三种典型并行计算模型的基础上,给出了实现p-HPF对三种模型的典型代表F77+MPI,ScaLAPACK调用的并行编译技术,包括参数重分布技术、存储转换技术、全局与局部信息交换技术以及局部数组参数的上下界处理技术等,给出了调用实例并分析了实现技术的正确性和有效性。  相似文献   

13.
Extrinsic是HPF中用来调用外部语言过程的机制。利用HPF Extrinsic机制可以实现多范例并行计算,文章首先给出p-HPF并行编译器中Extrinsic过程调用的支持方法,然后给出几种在分布内存的网络环境下,基于Extrinsic的并行应用模版,它们是并行算法库应用模版、协同应用模版、MPSD处理应用模版、异步I/O应用模版和流水线应用模版。并分析了它们的运行效率,给出了p-HPF实现方法。  相似文献   

14.
Pure data-parallel languages such as High Performance Fortran version 1 (HPF) do not allow efficient expression of mixed task/data-parallel computations or the coupling of separately compiled data-parallel modules. In this paper, we show how these common parallel program structures can be represented, with only minor extensions to the HPF model, by using a coordination library based on the Message Passing Interface (MPI). This library allows data-parallel tasks to exchange distributed data structures using calls to simple communication functions. We present microbenchmark results that characterize the performance of this library and that quantify the impact of optimizations that allow reuse of communication schedules in common situations. In addition, results from two-dimensional FFT, convolution, and multiblock programs demonstrate that the HPF/MPI library can provide performance superior to that of pure HPF. We conclude that this synergistic combination of two parallel programming standards represents a useful approach to task parallelism in a data-parallel framework, increasing the range of problems addressable in HPF without requiring complex compiler technology.  相似文献   

15.
A critical performance issue for a number of scientific and engineering applications is the efficient transfer of data to secondary storage. Languages such as High Performance Fortran (HPF) have been introduced to allow programming distributed-memory systems at a relatively high level of abstraction. However, the present version of HPF does not provide appropriate constructs for controlling the parallel I/O capabilities of these systems. In this paper, constructs to specify parallel I/O operations on multidimensional arrays in the context of HPF are proposed. The paper also presents implementation concepts that are based on the HPF compiler VFC and the parallel I/O run-time system Panda. Experimental performance results are discussed in the context of financial management and traffic simulation applications.  相似文献   

16.
一个用于数据并行语言计算划分的时序优化模型   总被引:2,自引:0,他引:2  
一个程序中数据并行语句的计算划分(CP)对该程序的运行性能有决定性的作用.尽管人们对这一问题已经进行了广泛的研究,但这些研究的重点都集中在如何提高被选择计算划分的空间局部性上.针对并行循环结构的计算划分问题,提出了一个时序优化模型.在该模型中,一个计算划分被表示成一个有向图,在把并行语句中的操作映射到各个处理器的同时,给出了被分配到不同处理器上的操作之间的相关性.对于一条数据并行语句,时序优化模型对它的每个计算划分选择方案分别采用多种有效的优化策略进行优化;并综合考虑各个计算划分选择方案的负载平衡性、处理器间的操作依赖性、数据访问的空间局部性和时间局部性四个方面的因素,估算每个方案的执行效率;最后从这些方案中选择一个执行效率最优的方案作为该语句的计算划分.作者已在HPF编译器p-HPF采用时序优化模型实现了对FORALL结构的支持.实验结果表明,该模型具有非常好的通用性,对不同领域多种数据并行问题均取得了理想的加速比.同时,只需略微改动,该模型也可用于其他类型数据并行语句的计算划分.  相似文献   

17.
The Earth Simulator (ES) is a large scale, distributed memory, parallel computer system consisting of 640 processor nodes (PN) with shared memory vector multi-processors (64GFLOPS/PN, 5120 APs in total, AP: arithmetic processor). All the nodes are connected via a high speed (16GB/s) single-stage crossbar network called the Interconnection Network (IN).

The operating system for the Earth Simulator is based on SUPER-UX, the UNIX operating system for the SX series scientific supercomputers. In order to realize high-performance parallel processing on the highly parallel machine, the operating system is enhanced for scalability.

The Earth Simulator system is managed as a two-level cluster system called the Super Cluster System. In the Super Cluster System, the Earth Simulator system is divided into 40 clusters (16 PNs/cluster). A single controller called Super Cluster Control Station (SCCS) manages all these clusters. This management system provides Single System Image (SSI) operation, management and job control for the large scale multi-node system.

The Job Scheduler (JS) and NQS running on the SCCS control all jobs of the system. They schedule the resources such as processing nodes and files which have not usually been treated as scheduling resources. This allows efficient scheduling of large scale jobs.

The MPI library (MPI/ES) and the HPF compiler (HPF/ES) are available for distributed parallel programming on the Earth Simulator. MPI/ES conforms to the MPI 2.0 standard and is optimized to exploit the hardware features. HPF/ES conforms to the core part of HPF 2.0 and supports some features of the HPF 2.0 approved extensions and HPF/JA 1.0 extensions. HPF/ES suitably handles the 3-level parallelism of the Earth Simulator system, that is, vectorization, shared-memory parallelization, and distributed-memory parallelization. Moreover, HPF/ES extends the language to easily handle irregular problems.  相似文献   


18.
A finite element code with a polycrystal plasticity model for simulating deformation processing of metals has been developed for parallel computers using High Performance Fortran (HPF). The conversion of the code from an original implementation on the Connection Machine systems using CM Fortran is described. The sections of the code requiring minimal inter-processor communication are easily parallelized, by changing only the syntax for specifying data layout. However, the solver routine based on the conjugate gradient method required additional modifications, which are discussed in detail. The performance of the code on a massively parallel distributed-memory Intel PARAGON supercomputer is evaluated through timing statistics. Published by Elsevier Science Ltd.  相似文献   

19.
Vienna Fortran, High Performance Fortran (HPF), and other data parallel languages have been introduced to allow the programming of massively parallel distributed-memory machines (DMMP) at a relatively high level of abstraction, based on the SPMD paradigm. Their main features include directives to express the distribution of data and computations across the processors of a machine. In this paper, we use Vienna-Fortran as a general framework for dealing with sparse data structures. We describe new methods for the representation and distribution of such data on DMMPs, and propose simple language features that permit the user to characterize a matrix as “sparse” and specify the associated representation. Together with the data distribution for the matrix, this enables the complier and runtime system to translate sequential sparse code into explicitly parallel message-passing code. We develop new compilation and runtime techniques, which focus on achieving storage economy and reducing communication overhead in the target program. The overall result is a powerful mechanism for dealing efficiently with sparse matrices in data parallel languages and their compilers for DMMPs  相似文献   

20.
本文针对遥感图像IHS、HPF、DWT等典型的像素级融合算法,提出并实现了相应的基于数据并行的并行融合算法P-IHS、P-HPF、P-DWT,并在算法时空复杂度分析的基础上进行了通信、I/O优化。针对IKONOS卫星遥感图像在机群系统上的测试结果表明,我们提出的并行算法可获得良好的并行加速比,并行效率较高。这三类算法适合于对实时性要求比较高的遥感应用领域。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号