首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
数值模拟是行星流体动力学研究的主要工具.本文介绍CPU-MIC异构众核平台的行星流体动力学数值模拟,计算并模拟地球外核的磁流体运动.本文在已有工作的基础上~([1-3]),添加了CPU-MIC异构众核环境的数值模拟支持.首先描述了CPU-MIC异构众核环境的上的数值模拟流程,然后给出了MIC上的分布式并行GMRES(m)众核解法器的实现算法.其次,实现了解法器的计算核心稀疏矩阵向量乘(SpMV)在MIC上的分布式并行算法,该SpMV实现了计算-通信重叠、数据传输-计算重叠.再次,为加速行星流体动力学方程收敛,给出了MIC上以SpMV为基本操作的分布式并行多项式预条件子.最后,提出了一些MIC众核平台的优化措施,如多线程、流存储和数据传输优化等.天河2号数值模拟表明相比CPU版的数值模拟,CPU-MIC异构众核环境下数值模拟在单MIC卡和64块MIC卡分别取得了6.93和6.0倍的加速比.  相似文献   

2.
地震波的叠前时间偏移算法是构造复杂岩层成像最有效的方法之一。地震勘探进入海量数据时代,且叠前偏移算法是数据处理中最费时的环节,对叠前偏移算法做并行计算优化有着重要的研究意义。近年来,高性能并行计算开始进入异构、众核时代,以Intel新一代至强融核MIC(Xeon Phi)为例,新型众核处理器具有成本低、性能高等特点。从最经典的Kirchhoff叠前时间偏移(PKTM)算法出发,基于CPU+MIC异构平台,采用offload编程模式实现对PKTM算法的并行移植与性能优化,对于6 000万规模(8 000×8 000)的应用问题,总的并行模拟时间从357.52s减少到1.66s,性能提升了214.37倍。  相似文献   

3.
在众核处理器应用中,主要难点在于异构并行应用模式和负载均衡的策略,对于计算流体力学,需要针对相关应用设计相应的方案。我们针对湍流直接数值模拟中串行程序含有部分并行度较高的子程序或函数的特点,设计了一种新的并行计算模式,给出了一种异构平台优化方案,并在中科院超级计算系统"元"上进行了测试和分析,对领域内的典型算例进行了性能测试,着重讨论了不同规模下采用offload模式的CPU和MIC异构并行的扩展性能。  相似文献   

4.
Python由于具有丰富的第三方库、开发高效等优点,已成为数据科学、智能科学等应用领域最流行的编程语言之一。Python强调了对科学与工程计算的支持,目前已积累了丰富的科学与工程计算库和工具。例如,SciPy和NumPy等数学库提供了高效的多维数组操作及丰富的数值计算功能。以往,Python主要作为脚本语言,起到连接数值模拟前处理、求解器和后处理的“胶水”功能,以提升数值模拟的自动化处理水平。近年来,国外已有学者尝试采用Python代码实现求解计算功能,并在高性能计算机上开展了超大规模并行计算研究,取得了不错的效果。由于自身特点,高效大规模Python数值模拟的实现和性能优化与传统基于C/C++和Fortran的数值模拟等具有很大的不同。文中实现了国际上首个完全基于Python的大规模并行三维格子玻尔兹曼多相流模拟代码PyLBMFlow,探索了Python大规模高性能计算和性能优化方法。首先,利用NumPy多维数组和通用函数设计实现了LBM流场数据结构和典型计算内核,通过一系列性能优化并对LBM边界处理算法进行重构,大幅提升了Python的计算效率,相对于基准实现,优化后的串行性能提升了两个量级。在此基础上,采用三维流场区域分解方法,基于mpi4py和Cython实现了MPI+OpenMP混合并行;在天河二号超级计算机上成功模拟了基于D3Q19离散方法和Shan-Chen BGK碰撞模型的气液两相流,算例规模达百亿网格,并行规模达1024个结点,并行效率超过90%。  相似文献   

5.
目前安装在国家超级计算天津中心的"天河一号"是我国首台千万亿次超级计算机,在2010年11月世界超级计算机Top500排名中,位列世界第一。"天河一号"采用了CPU与GPU相结合的异构融合计算体系结构,自主设计实现了高速互连通信系统,在多个高性能计算应用领域具有应用适应性强、系统运行稳定可靠、性能可扩展性好等特点,为科学研究和应用提供了重要的高性能计算平台。采用石油地震数据处理、飞行器流场模拟、生物分子动力学模拟、磁约束聚变数值模拟、湍流数值模拟、晶体硅分子动力学模拟、全球大气浅水波全隐式数值模拟、地球外核热流动数值模拟等应用的典型算例对"天河一号"进行了大规模并行程序测试,结果表明,"天河一号"在上述应用领域具有良好的可扩展性和并行效率。  相似文献   

6.
异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战,因此研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能有效描述国产众核系统的异构并行性,与其它众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据表明,Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用.  相似文献   

7.
异构并行体系结构是当前高性能计算的重要技术趋势。由于各种异构平台通常支持不同的编程模型,跨平台性能可移植异构并行应用开发非常困难。SYCL是一个基于C++语言的单源跨平台并行编程开放标准。目前针对SYCL的研究主要集中于与其他并行编程模型的性能比较,对SYCL中提供的不同并行内核实现及其性能优化研究得较少。针对这一现状,基于SYCL编程模型对开源多相流数值模拟软件openLBMmflow实现跨平台异构并行模拟,通过对比基础并行版本、细粒度调优的ND-range并行版本以及计算到工作项多对一映射方法,系统总结了SYCL并行应用的性能优化方法。测试结果表明,在Intel Xeon Platinum 9242 CPU以及NVIDIA Tesla V100 GPU上,相比优化后的OpenMP并行实现,在不需要额外调优的情况下,基础并行版本在CPU上获得了2.91的加速比,表明了SYCL的开箱即用性能具备一定优势。以基础并行版本为基准,ND-range并行版本通过改变工作组大小及形状,在CPU与GPU上分别取得了最高1.45以及2.23的加速比。通过优化计算到工作项的多对一映射改变每个工作项处理...  相似文献   

8.
高通量应用的迅猛发展使得模拟速度成为大规模众核体系结构研究的瓶颈。为此,基于高通量众核结构模拟平台,提出一系列模拟加速技术。采用查找表方法加速指令译码,从事件调度算法、时间推进算法以及队列无锁化等角度优化并行离散事件模拟框架,以内存池管理方案提高内存管理效率。实验结果表明,与优化前方案相比,查找表、并行离散事件模拟和内存池3种加速方案在模拟速度上表现较优。  相似文献   

9.
连接是数据查询处理中最耗时、使用最频繁的操作之一,对提高连接操作的速率具有重要意义。阵列众核处理器是一类重要的众核处理器,具有强大的并行能力,可用来加速并行计算。基于阵列众核处理器的结构,设计和优化了一种高效的多层分区Hash连接算法。该算法通过多层划分的策略大大降低了主存访问次数,通过分区重排方法有效消除了数据倾斜的影响,获得了很高的性能。在异构融合阵列众核处理器DFMC(Deeply-Fused Many Core)原型系统上的实验结果表明,DFMC上多层分区Hash连接算法的性能是CPU-GPU耦合结构上最快的连接算法的8.0倍,表明利用阵列众核处理器加速数据查询应用具有优势。  相似文献   

10.
开发高性能仿真程序的前提是选择合适的并行计算平台以及明确程序的并行优化方向。为此,研究了并行计算平台和高性能仿真程序之间的适用性。重点提炼出仿真程序特性集合、并行计算平台的性能指标体系和并行优化目标要素集合,从而使平台选择和程序优化技术有更完善的理论指导。基于这三项研究,提出了确定程序适用性和平台适用性的方法。实例分析表明,研究成果能够指导选择适合的并行计算平台,以及指导开发面向平台性能的并行优化技术。  相似文献   

11.
绿色计算的重定义与若干探讨   总被引:12,自引:2,他引:12  
计算机系统的环境可分为人文环境和自然环境两个部分.随着全球计算机系统大量而广泛的使用,对环境日益产生了一些负面影响.绿色计算(green computing)是一种以环境为中心的计算模式,通过努力消除计算机系统的环境不友好方面,使得计算机系统、人、社会与自然环境更加和谐,实现节能、环保和节约的目标.通过与绿色化学的比较研究,作者采取了一种更加统一和抽象的方式定义绿色计算的概念,并探讨了其主要研究内容,从而明确了绿色计算的界限和范围,理顺了相关领域的研究任务和关系.然后,提出了绿色汁算的一些基本思路和一般性方法,为下一步研究各种条件下绿色计算的具体模型、方法与工具打下了必要的基础.  相似文献   

12.
We present a simulation of Turing machines by peptide–antibody interactions. In contrast to an earlier simulation, this new technique simulates the computation steps automatically by the interaction between peptides and antibodies and does not rely on a “look-and-do” approach, in which the Turing machine program would be interpreted by an extraneous computing agent. We determine the resource requirements of the simulation. Towards a precise definition for peptide computing we construct a new theoretical model. We examine how the simulations presented in this paper fits this model. We also give conditions on the peptide computing model so that it can be simulated by a Turing machine.
M. Sakthi BalanEmail:
  相似文献   

13.
云计算研究     
王倩  曹彦 《软件》2013,34(5):116-118
云计算模式是在基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、分布式计算、并行计算和网格计算等概念演进并产生的结果。云计算模式是一种全新的计算应用模式,将会成为人们获取服务的主导方式。本文首先介绍云计算在业界中的概念,接着分析云计算和相关计算,最后关于云计算发展的前景进行展望。  相似文献   

14.
1.普及计算的基本概念 1.什么是普及计算? 我们当前所处的时代是计算机技术仍然复杂到让大部分人们难以学习的地步的时代。虽然目前计算机已经进入了许多人的家庭,但是真正能够发挥计算机全部能力的用户是很少的。计算机业界有许多的技术和专有名词,而且它们还随着时间的流逝不断发展变化。再者,过去所有的传统思路都是以计算机为中心,当计算机系统发生变化时,人们的思想也必须  相似文献   

15.
普适计算体系结构的研究   总被引:1,自引:0,他引:1  
普适计算使人在信息空间与物理空间相融合的环境下,利用任意设备,通过任意网络,在任意时间透明地获得一定质量的网络服务,根据目前国际上普适计算研究的现状和发展趋势,提出了一个普适计算体系结构的参考模型,并简要讨论了该参考模型的四个关键研究内容一移动计算、互操作计算、情感计算和上下文感知计算.  相似文献   

16.
一种分布式环境下的新型高性能计算平台   总被引:3,自引:0,他引:3  
分析了采用志愿机模式的网络计算平台的特点,针对其不足.提出了一种分布式环境下的新型高性能计算平台NH-PCP(A Novel High Performance Computing Platform in Distributed Environment).该平台具有可扩展性和容错能力,采用对象串行化技术能够使应用程序跨平台运行.NHPCP具有友好的用户界面,提供一套简单易用的API(Application Programming Interface)函数调用,任何大计算量的、可以分解成独立计算子任务的应用都可以方便地利用该平台运算.基于该平台具体实现了两个典型的并行应用实例,通过对实验结果的分析,总结了适合于本计算平台的并行应用的特点.  相似文献   

17.
一种对象化并行计算框架   总被引:1,自引:1,他引:0  
分布式计算、并行计算、内存计算是目前提高计算性能的关键技术和热点研究领域。在大数据环境下,针对数据型统计分析系统性能劣化明显、不能满足用户使用需求的问题,提出了一种轻量级高性能对象化并行计算架构,研制了该架构的对象服务组件、对象管理服务组件和客户端代理组件,并将该架构和组件在国家电网资产质量监督管理系统中进行了验证应用,其效果表明该框架能大幅提升大数据处理效率。  相似文献   

18.
介绍了当前计算方法的发展趋势,对当前主流的云计算和网格计算两种计算方法从定义、特点方面进行了详细的阐述,并对两种技术进行深入的分析比较,最终对其异同之处进行了概括总结。  相似文献   

19.
海量空间信息的处理需要分布式协同工作的GIS平台支持。为解决空间数据源的异构和分布式网络中的计算能力共享问题,设计了分布式空间信息的协同计算模型,分析了分布式空间信息协同计算具备的基本特征;从空间数据分布存储模型、空间数据分布式计算协同和分布式空间数据并行索引等方面讨论分布式空间信息的协同计算技术体系,并提出现阶段可行的实现机制。分布式对等协同计算机制避免了集中式执行引擎带来的网络拥塞和单点失效问题,提高了海量空间信息资源和计算资源协作的可靠性和可用性。  相似文献   

20.
物联网的边界计算模型:雾计算   总被引:1,自引:0,他引:1  
在物联网和云计算带来技术变革和带动产业发展的过程中,由于网络接入设备激增,而网络带宽有限的情况下,思科公司推出了雾计算的概念。首先探讨雾计算的特征和应用模式,然后分析雾计算的"雾节点"与云计算的"云节点"以及物联网的"物节点"的互操作方法,并总结了雾计算的用例,最后给出了前景展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号