共查询到19条相似文献,搜索用时 93 毫秒
1.
目前安装在国家超级计算天津中心的天河一号是我国首台千万亿次超级计算机,在2010年11月世界超级计算机Top500排名中,位列世界第一。天河一号采用了CPU与GPU相结合的异构融合计算体系结构,自主设计实现了高速互连通信系统,在多个高性能计算应用领域具有应用适应性强、系统运行稳定可靠、性能可扩展性好等特点,为科学研究和应用提供了重要的高性能计算平台。采用石油地震数据处理、飞行器流场模拟、生物分子动力学模拟、磁约束聚变数值模拟、湍流数值模拟、晶体硅分子动力学模拟、全球大气浅水波全隐式数值模拟、地球外核热流动数值模拟等应用的典型算例对天河一号进行了大规模并行程序测试,结果表明,天河一号在上述应用领域具有良好的可扩展性和并行效率。 相似文献
2.
本文首先对高性能计算和"天河一号"超级计算机进行了简要概述。随后详细描述了高性能计算在生命科学领域中的两大重要应用:一个是生物大分子的动力学模拟,介绍用户在"天河一号"取得的一些应用成果和进行的应用性能测试;另一个是生物信息学研究,重点介绍了华大基因在基于"天河一号"开展的GPU并行软件测试取得的良好结果。最后展望了高性能计算在生命科学领域中的发展趋势。 相似文献
3.
天河2号等亿亿次计算机上的大规模异构协同计算对负载平衡算法提出了3方面要求:低算法复杂度、适应多级嵌套的数据传输系统和支撑异构协同计算.通过组合3级嵌套负载平衡算法框架、贪婪剖分算法和内外子区域剖分算法,设计了一种能够同时满足这3方面要求的负载平衡算法.模型测试表明,算法可以达到90%以上的负载平衡效率.天河2号上32个节点的测试表明,算法能够保证通信开销较小.5个典型应用在天河2号上最大93.6万核的测试表明,算法能够支撑应用高效扩展,并行效率最高可达80%. 相似文献
4.
MatLab在科学和工程计算中的应用 总被引:6,自引:1,他引:6
简要介绍了MatLab在数据输入、数值运算以及图形可视化方面的功能,展示了MatLab在解决工程问题方面的简洁、快捷与直观性,对MatLab有兴趣、特别是欲利用MatLab开发软件解决科学与工程问题的读者有参考价值。 相似文献
5.
6.
面向科学与工程计算的网上实验室设计与开发 总被引:3,自引:1,他引:3
科学与工程计算问题是当代信息技术时代最富挑战性的科学领域之一。研究和开发了面向科学与工程计算的网上实验室系统,它由实验演示、实时指导、协同工作、讨论交流、资料室管理等子系统组成。该网上实验室不仅能促进专业人员对科学与工程计算的研究,而且能提高学生对学习数值计算课程的兴趣和效率。 相似文献
7.
8.
长久以来大规模虚拟仿真环境由于受到其对计算、存储、实时性等高要求的束缚未能得到广泛的应用.文中研究了网格计算技术的特点,并列出了大规模虚拟仿真环境应用与网格计算技术结合后的优势,接着分别从资源获得、时钟管理、实体交互三个方面分析了大规模虚拟仿真环境应用所存在的问题,并以解决这些问题为目的引入了网格计算技术,提出了在网格计算环境下对大规模虚拟仿真应用这些问题的解决方案. 相似文献
9.
长久以来大规模虚拟仿真环境由于受到其对计算、存储、实时性等高要求的束缚未能得到广泛的应用。文中研究了网格计算技术的特点,并列出了大规模虚拟仿真环境应用与网格计算技术结合后的优势,接着分别从资源获得、时钟管理、实体交互三个方面分析了大规模虚拟仿真环境应用所存在的问题,并以解决这些问题为目的引入了网格计算技术,提出了在网格计算环境下对大规模虚拟仿真应用这些问题的解决方案。 相似文献
10.
11.
在大规模三维复杂流动的数值模拟中,针对具有良好数值稳定性的多弛豫时间模型格子Boltzmann方法(MRT-LBM),并结合大涡模拟湍流模型和曲面边界插值格式,分析了在D3Q19离散速度模型下的网格生成、流场信息初始化和迭代计算3部分的可并行性.采用MPI编程模型,从分布式集群的特点和计算量负载均衡的角度出发,分别提出了适合于大规模分布式集群的网格生成、流场信息初始化和迭代计算的并行算法.该并行算法也能有效适用于D3Q15和D3Q27离散速度模型.通过在国产神威蓝光超级计算机上的测试,分别针对求解问题总体计算规模固定和保持每个计算核中计算量一致的2种情况的并行性能分析,验证了该并行算法在十万计算核的量级下仍具有良好的加速比和可扩展性. 相似文献
12.
Particle tracking methods are a versatile computational technique central to the simulation of a wide range of scientific applications. In this paper, we present a new parallel particle tracking framework for the applications of scientific computing. The framework includes the in-element particle tracking method, which is based on the assumption that particle trajectories are computed by problem data localized to individual elements, as well as the dynamic partitioning of particle-mesh computational systems. The ultimate goal of this research is to develop a parallel in-element particle tracking framework capable of interfacing with a different order of accuracy of ordinary differential equation (ODE) solver. The parallel efficiency of such particle-mesh systems depends on the partitioning of both the mesh elements and the particles; this distribution can change dramatically because of movement of the particles and adaptive refinement of the mesh. To address this problem we introduce a combined load function that is a function of both the particle and mesh element distributions. We present experimental results that detail the performance of this parallel load balancing approach for a three-dimensional particle-mesh test problem on an unstructured, adaptive mesh, and demonstrate the ability of interfacing with different ODE solvers. 相似文献
13.
一个科学计算服务网格应用系统的设计与实现 总被引:2,自引:0,他引:2
为扩大计算能力的共享规模,并充分复用已有的计算程序.提出了一个SCS服务的概念.一个SCS服务把一个科学计算程序和它的宿主环境(计算节点)结合起来,构成了一个提供科学计算服务的基本单元.设计了一个网格应用系统(PCG系统)来管理SCS服务.PCG系统是一个3层的架构,顶部是一个Web门户,中间是SCS服务管理器,网格中间件系统位于后端.SCS服务管理器是整个系统的核心部分,包含了四个模块:通讯模块(comm)、需求转换模块(User Requirements Translator)、服务信息查询协商模块(Service Query&Broker)和服务提交管理模块(Service Handler).基于GlobusToolkit作为中间件,PCG系统已经在北京大学校园网内跨越多个局域网进行了实现.在PCG系统上.已经成功地运行了若干个实际科学计算的实例. 相似文献
14.
大数据计算是当前云计算研究的热点之一. 在电力信息化、精益化的建设过程中,业务复杂度不断提高,数据量与日俱增,这使得传统的数据加工性能日益劣化. 在复杂的业务场景下,由于海量的电力数据,使得数据指标加工计算的效率非常低下,传统方式的加工任务经常耗时数个小时,难以满足用户的体验要求. 为了解决这个问题,全面提升数据指标加工任务效率,基于对象化并行计算(Objectification Parallel Computing,OPC)框架实现了一种高效计算服务,OPC是分布式并行内存计算框架. 在OPC框架中,大数据集被拆分成小数据集,并分布式地存储在集群内存中. OPC计算任务借鉴了分而治之和归并树的思想,将计算任务分成两个阶段:本地计算任务和计算结果收集汇总. 计算任务基于本地计算数据进行计算,得到本地计算结果,然后将计算结果通过收集结点进行汇总合并,最后得到最终结果. OPC框架技术应用在国家电网公司工程生产管理系统(PMS)中,应用效果表明该技术稳定、可靠,性能提升几十至数百倍,可满足高效计算需求. 相似文献
15.
为了提升高性能计算环境的易用性并降低使用门槛,本文提出了一种基于高性能计算环境的通用科学计算应用平台构建方案,旨在为用户提供更便捷、体验更友好、简单高效的科学计算服务。用户通过访问网页即可输入计算参数、提交任务、查看执行结果并集中管理不同应用的计算任务和历史数据,无需安装相关工具或者记忆操作命令。该方案设计充分考虑了应用间的差异性,拥有良好的扩展性,易于部署和迭代,同时拥有良好的安全性。 相似文献
16.
针对如光束平差这样的大规模优化问题,实现基于OpenCL的并行化自动微分。采用更有效的反向计算模式,实现对多参数函数的导数计算。在OpenCL框架下,主机端完成C/C++形式的函数构建以及基于拓扑排序的计算序列生成,设备端按照计算序列完成函数值以及导数的并行计算。测试结果表明,将实现的自动微分应用于光束平差的雅可比矩阵计算后,相比于采用OpenMP的Ceres Solver,运行速度提高了约3.6倍。 相似文献
17.
并行计算是CFD技术发展的必然趋势。本文从高超声速流动的特点出发,研究多分区结构网格下CFD并行计算方法,重点解决了区域之间流场信息的数据交换问题和边界处理问题,以保证流场的连续性。本文采用有限体积法求解高超声速流场,空间离散格式为Osher-Chakravarthy TVD格式,利用MPI消息传递模式完成数据交换,在自主搭建的PC集群上进行算例考核,验证了算法的可行性和正确性。 相似文献
18.
19.
走时计算是叠前时间偏移计算中最耗时的部分,通过分析传统的串行走时算法,发现静态8点插值算法非常适合在GPU上运行。首先利用CUDA技术对静态8点插值算法进行并行化改造,设计静态8点并行插值算法,然后测试其正确性,统计其相对误差情况。实验表明此算法比工业生产上的动态插值算法更准确,最后我们利用体偏作性能测试。试验结果表明,运行在GPU上的静态8点并行插值算法内核性能是运行在CPU上的动态插值算法内核的22.76倍。这说明,静态8点并行插值算法适合进行走时计算,并且可以应用于工业生产上。 相似文献