首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
针对经典分子动力学和PIC方法等粒子类模拟方法具有粒子动态移动、粒子计算局部性好等共性,首先,提出了粒子量数据片对象.该对象是单网格片上的一团粒子,其中网格片是包含多个网格单元的矩形区域.然后,设计了并行算法,包括对象之间的粒子迁移和数据交换以及动态负载平衡.最后,在JASMIN框架上具体实现,进而开发了并行经典分子动力学程序和并行PIC程序.在64个处理器上实测表明,并行PIC程序模拟包含3百万个网格、2千万个粒子的复杂物理模型时,获得了80%的并行效率.  相似文献   

2.
负载平衡的多级并行对等计算在新药研发网格中的实现   总被引:6,自引:0,他引:6  
介绍了一种在Internet环境下利用分布的计算资源实现计算/数据密集的高通量新药筛选的应用网格——新药研发网格(drug discovery grid,DDG).对DDG中采用的多级并行对等计算模型(P2P),自适应的动态负载平衡算法及实现,网格资源的容错技术以及系统安全做了较详细的描述,给出了一组实际环境下的实验数据.实验证明,DDG具有很好的负载平衡能力和良好的系统健壮性,新药筛选应用在大规模的互连网环境下可以获得良好的并行加速效果.  相似文献   

3.
中国科学院过程工程研究所多相反应实验室,建立了一个通用粒子模拟平台并已开始应用。目前类似的并行模拟系统采用的Shift并行通信模式往往有一些问题,需要一种新的通信模式来弥补它的不足。本文设计具有良好通用性的非结构化通信模式All2All,用来完成通用粒子方法模拟平台中计算节点问的通信。本文的算例证明这种通信模式可解决在粒子并行模拟Shift通信模式所不能处理的,具有复杂拓扑关系的相邻节点间的数据通信问题。本文设计的All2All通信模式方法只需稍加修改,就可以方便地应用于其它领域的并行计算系统。  相似文献   

4.
耗散粒子动力学(DPD)模拟是一种重要的研究流体动力学特性的计算模拟方法,基于Intel MIC平台设计实现了面向大规模耗散粒子动力学模拟,充分结合了DPD模拟本身的特性和MIC平台的特征。对DPD模拟中的近邻列表构建和短程作用力关键代码实现了向量化优化,在CPU和MIC协处理器之间采用任务计算负载平衡机制,支持MPI进程内线程数量负载平衡控制。分别在原型程序上和LAMMPS集成中做了性能对比分析,实验结果显示了引入相关优化技术的有效性,为进一步研究面向MIC众核平台的分子动力学相关工作奠定了基础。  相似文献   

5.
本文探讨了在由同种类型计算机组成并具有广播通信方式的中等耦合被动多落点式分布式计算机系统(如以太网)中,由于系统中各计算机负载不均对系统效率所产生的影响,提出采用在系统各计算机间传送作业的方法来提高整个系统的效率。文中给出了一种动态负载平衡方法——XY方法,并对这种方法进行了分析和模拟试验。模拟试验结果表明,采用这种方法可以使系统的作业吞吐量提高一倍,并且系统用于负载平衡的开销也较小,因而xy方法是一种较好的负载平衡方法。  相似文献   

6.
对并行VHDL模拟的特殊性进行分析后,建立了一个并行VHDL模拟的动态负载平衡模型。在此模型中,提出动态调节最佳并行规模的动态负载平衡方法来解决系统资源紧张的问题,采用一种新的模拟中负载的度量方法——模拟推进度。此模型还包括基于标准偏差和最小通信变化量的动态负载平衡算法和一个运行中的负载迁移机制。最后对该模型进行可行性分析。  相似文献   

7.
WCNS高精度并行软件的大规模计算研究   总被引:1,自引:0,他引:1  
本文通过求解任意坐标系下的定常雷诺平均N-S方程和SST两方程湍流模型,采用五阶精度的加权紧致非线性格式(WCNS-E-5),实现流场的高精度数值模拟;基于分布式存储系统,采用MPI并行编程环境、非堵塞通信机制和遗传算法负载平衡,实现高精度模拟软件的并行化。在国防科学技术大学高性能计算应用研究中心的"天河"系统上完成软件移植、测试,通过对DLR-F6翼身组合体的模拟,说明软件并行策略和开发的正确性。最后,实现某民机全机的高精度并行模拟,网格规模达到1亿,为下一步WCNS高精度并行软件的大规模工程实际应用打下了坚实基础。  相似文献   

8.
非均匀区域油藏模拟负载平衡的分区并行算法*   总被引:1,自引:0,他引:1  
基于分布式并行计算机系统,对一类非均匀区域的油藏数值模拟问题,采用了区域分解方法并行求解,给出了并行求解的负载平衡模型及区域负载平衡的一种有效分区算法,从而将这类油藏数值模拟问题均衡映射到并行环境中,高效地并行求解.在黑油油藏数值模拟并行软件的研究中,实验结果表明,该算法有利于提高加速比.  相似文献   

9.
丘宇峰  曾国荪 《计算机科学》2009,36(12):238-242
针对传统火焰模拟耗时、模拟真实性不理想这一问题,提出了一种借助GPU(图形处理器)高通用计算能力进行并行模拟的粒子系统火焰模拟方法.该方法采用基于方位角和仰角的粒子散射器、基于层流火焰轮廓计算公式的火焰外形计算及通过拉格朗日插值方法平滑火焰骨架线等手段提高了素流火焰的模拟真实度.在提高性能方面,该方法使用全局存储空间存储粒子信息,避免了因使用纹理存储而产生的反复绑定的开销,同时结合GPU强大的通用计算能力,通过采用CUDA(计算统一设备架构)编写的并行算法,实现了基于GPU的拉格朗日插值并行求解及并行计算、更新粒子属性,并就如何确定块内线程数量作了论述.实验结果表明,该方法满足了火焰模拟的真实性和实时性要求,且较传统方法有很大的提高.  相似文献   

10.
基于多区结构网格的计算流体力学方法,在并行处理的难点是多个网格数据块在计算资源上的高效合理分配,以实现大规模并行环境下的负载平衡。本文围绕负载平衡问题,介绍了 CCFD 软件开展的一些工作,包括:1. 面向结构网格的双层图剖分策略,通过细层图剖分环节考虑计算量和通信量的负载平衡;2. 建立可细分的重叠网格体系,并基于该体系建立了重叠网格系统的双级负载平衡模型。算例验证表明,所采用的负载平衡策略在大规模并行环境下能获得较高并行效率。  相似文献   

11.
为改善记忆功放建模的精度,且针对粒子群算法早期收敛速度较快,但在后期易陷入早熟收敛,局部最优等特点,提出了一种分组并行混沌粒子群优化算法(Grouping Parallel-Chaotic Particle Swarm Optimization,GP-CPSO),将分组粒子群优化算法与混沌思想相结合,并用该算法优化动态模糊神经网络(Dynamic Fuzzy Neural Network,DFNN)参数,建立DFNN功放模型。引入分组的CPSO群算法,将种群划分为若干个组,每组单独计算,大大提高了收敛速度,同时将混沌思想运用到每个粒子当中去,避免早熟和局部最优,缩短了迭代时间。通过仿真结果可以看到,GP-CPSO优化后的动态模糊神经网络建模的训练误差减小到0.1以内,收敛速度提高32.5%,从而验证了这种建模方法有效且可靠。  相似文献   

12.
Adaptive mesh refinement (AMR) is a type of multiscale algorithm that achieves high resolution in localized regions of dynamic, multidimensional numerical simulations. One of the key issues related to AMR is dynamic load balancing (DLB), which allows large-scale adaptive applications to run efficiently on parallel systems. In this paper, we present an efficient DLB scheme for structured AMR (SAMR) applications. This scheme interleaves a grid-splitting technique with direct grid movements (e.g., direct movement from an overloaded processor to an underloaded processor), for which the objective is to efficiently redistribute workload among all the processors so as to reduce the parallel execution time. The potential benefits of our DLB scheme are examined by incorporating our techniques into a SAMR cosmology application, the ENZO code. Experiments show that by using our scheme, the parallel execution time can be reduced by up to 57% and the quality of load balancing can be improved by a factor of six, as compared to the original DLB scheme used in ENZO.  相似文献   

13.
槽流拟颗粒模型的并行算法   总被引:1,自引:1,他引:0  
将流体处理为离散粒子,应用拟颗粒硬球模型来研究槽流中的流动现象,与分子动力学模拟的算法类似,是研究槽流机理的一种行之有效的方法。为了作大规模的模拟,本文采用区域分解算法和消息传递编程模型技术,将该模型串行程序并行化,应用一维划分、单相传递的方法简化了并行算法,采用轮换搜索法来避免硬球碰撞次序对结果的影响。在可扩展的机群系统上用实例计算,通过与串行程序的对比,验证了并行程序的正确性,表明本文设计的并行算法取得了较高的并行计算效率。  相似文献   

14.
A parallel computational implementation of modern meshless system is presented for explicit for 3D bulk forming simulation problems. The system is implemented by reproducing kernel particle method. Aspects of a coarse grain parallel paradigm—domain decompose method—are detailed for a Lagrangian formulation using model partitioning. Integration cells are uniquely assigned on each process element and particles are overlap in boundary zones. Partitioning scheme multilevel recursive spectrum bisection approach is applied. The parallel contact search algorithm is also presented. Explicit message passing interface statements are used for all communication among partitions on different processors. The parallel 3D system is developed and implemented into 3D bulk metal forming problems, and the simulation results demonstrated the efficiency of the developed parallel reproducing kernel particle method system.  相似文献   

15.
In this paper, Message Passing Interface (MPI) based parallel computation and particle swarm optimization (PSO) algorithm are combined to form the parallel particle swarm optimization (PPSO) method for solving the dynamic optimal reactive power dispatch (DORPD) problem in power systems. In the proposed algorithm, the DORPD problem is divided into smaller ones, which can be carried out concurrently by multi-processors. This method is evaluated on a group of IEEE power systems test cases with time-varying loads in which the control of the generator terminal voltages, tap position of transformers and reactive power sources are involved to minimize the transmission power loss and the costs of adjusting the control devices. The simulation results demonstrate the accuracy of the PPSO algorithm and its capability of greatly reducing the runtimes of the DORPD programs.  相似文献   

16.
针对全向变异易使粒子失去已有的有利搜索信息的问题, 提出了一种并行定向变异的混合粒子群优化算法。该算法以当前群体最优位置为基准, 用变异信息矩阵和混沌位置变异矩阵对群体进行并行定向扰动, 有效利用了现有的有利搜索信息。该算法将并行定向变异与序列二次规划法融为一体, 实现了全局搜索和局部寻优的统一。仿真实验和比较分析结果表明并行定向变异混合粒子群优化算法具有良好的、稳定的优化效果。  相似文献   

17.
1.引言对于静态和动态负载平衡算法的研究,国际上已经有了30多年的历史。特别是近年来随着一些高速网络的兴起(如ATM),对于它的研究仍然方兴未艾。但是因为一些并行任务之间的互相依赖关系和通讯量的大小很难在编译时就进行确定,所以人们更加倾向于研究动态负载平衡。虽然目前国内外在这方面产生了不少各有特色的算法,譬如Hui等人就在理  相似文献   

18.
针对一种新型智能进化算法--布谷鸟搜索算法提出了基于多群体并行搜索和自适应步长的改进方法。将改进后的方法引入支持向量机参数优化中,提出了基于改进后布谷鸟搜索算法优化支持向量机模型参数的方法并将其应用于上市公司财务风险评估中,有效提高了财务风险模型的分类性能。仿真结果发现:改进的布谷鸟搜索算法用于优化支持向量机参数不仅有效提高了上市公司季度财务数据分类预测精度,而且相较改进之前的布谷鸟搜索算法、遗传算法和粒子群算法具有更快的收敛速度和稳定性。  相似文献   

19.
作为一种典型的拉格朗日型无网格数值方法,光滑粒子流体动力学(SPH)方法在模拟自由表面流问题时具有天然优势。但是,该方法计算量大、耗时长,为此提出了一种基于粒子分解的SPH并行算法。该算法将所有粒子平均分配到各个进程进行计算,每个时间步通信仅调用一次发送、接收和广播函数,因此易于实现且可扩展性较好。应用该并行算法对二维溃坝流和三维液滴冲击液膜问题进行数值模拟,结果表明:该并行算法能显著减少模拟所消耗的计算时间,有利于进行三维大规模计算问题的数值模拟;当粒子数大于百万时,最大加速比可达30以上。  相似文献   

20.
The DLB (Dynamic Load Balancing) library and LeWI (LEnd When Idle) algorithm provide a runtime solution to deal with the load imbalance of parallel applications independently of the source of imbalance. DLB relies on the usage of hybrid programming models and exploits the malleability of the second level of parallelism to redistribute computation power across processes.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号