首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
"嵩山"超级计算机系统是中国自主研发的新一代异构超级计算机集群,其搭载的CPU和DCU加速器均为我国自主研发.为扩充该平台的科学计算生态,验证量子计算研究在该平台上开展的可行性,文中使用异构编程模型实现了量子傅里叶变换模拟在"嵩山"超级计算机系统上的异构版本,将程序的计算热点部分分配至DCU上运行;然后使用MPI在单计算节点上开启多进程,实现DCU加速器数据传输和计算的并发;最后,通过计算与通信的隐藏避免了DCU在数据传输时处于较长时间的空闲状态.实验首次在超算系统上实现了44 Qubits规模的量子傅里叶变换模拟,结果显示,异构版本的量子傅里叶变换模拟充分利用了DCU加速器计算资源,相较于传统CPU版本,其取得了11.594的加速比,且在集群上具有良好的可拓展性,该方法为其他量子算法在"嵩山"超级计算机系统上的模拟实现以及优化提供了参考.  相似文献   

2.
本文针对大规模人群仿真对仿真真实性和实时性的仿真要求,提出了一种基于Agent的并行人群仿真方法,通过CPUGPU混合并行的方式提高了仿真系统的性能和可扩展性。通过层次化的人群建模,使得个体更适合并行环境下的数据交互,仿真中通过感知区域视角约束对人群的运动进行控制,实现了人群平滑运动。实验部分对室外环境的人群漫游行为进行了仿真,验证了系统具有较高的性能和可扩展性。  相似文献   

3.
贺毅辉  叶晨  刘志忠  彭伟 《计算机应用》2012,32(9):2466-2469
群体仿真中个体从环境中查找相关对象时会导致较高的时间复杂度。要使大规模群体能够实时仿真,必须降低模型运算的时间复杂度或者提高计算平台的能力。通过对Biods模型为典型案例进行研究,提出一种基于统一计算架构(CUDA)的大规模群体行为实时仿真并行实现及优化的方法。实现中将个体与GPU逻辑线程一一对应,通过将仿真环境离散化来提高相关个体查找的效率,通过并行化基数排序法将个体信息组织成具有空间局部性的数组,提高图形处理器(GPU)内存带宽的利用率。通过实验验证了该方法将仿真个体的数量提升到CPU方法的约7.3倍。  相似文献   

4.
量子计算是一种遵循量子力学规律来调控量子信息单元进行计算的新型计算模式,而量子算法由一系列量子门组合而成,其实现形式为量子线路。量子线路是对量子比特进行操作的线路,以量子比特为基本的存储单元,将量子逻辑门连接在一起来实现特定的计算功能。文中在“嵩山”超级计算机上利用MPI+OpenMP混合并行编程模型,实现了将大规模量子线路拆分到不同节点上进行构建,加快了线路的构建速度,并且在CPU集群系统上具有良好的可拓展性。针对节点间通信问题,设计了序列化和反序列化函数,以保证节点间数据的传输,并且根据各节点所分配任务量间存在的指数级差异,设计了一种拆分任务量、各节点轮循处理的优化方式,实现了节点间的负载均衡。最后在超级计算机CPU集群上成功实现了大规模的量子相位估计线路的构造,相较于单节点取得了8.63的加速比,并通过HHL算法验证了所设计的并行相位估计子模块的正确性,为大规模HHL算法在超算平台上的实现提供了参考。  相似文献   

5.
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+Ope...  相似文献   

6.
刘青昆  马名威  阎慰椿 《计算机应用》2011,31(12):3327-3330
矩阵乘法在科学计算领域中起着重要的作用,不同结构模型能够改善并行矩阵乘的性能。现有的MPI+CUDA同步模型中,主机端需要进入等待状态,直到设备端完成任务后才能继续工作,这显然浪费时间。针对上述问题,提出一种基于MPI+CUDA异步模型的并行矩阵乘法。该模型避免了主机端进入等待状态,并采用CUDA流技术解决数据量超过GPU内存问题。通过分析异步模型的加速比和效率,实验结果表明,此方法显著提高了并行效率和大型矩阵乘法的运算速度,充分发挥了节点间分布式存储和节点内共享内存的优势,是一种有效可行的并行策略。  相似文献   

7.
为了支持现实世界与虚拟世界的平行互动演化,满足日益增长的复杂系统动态仿真需求,提出了一个面向服务架构下的SMP2仿真系统动态演化方法。分析了SMP2仿真系统组成及其动态演化分类,提出了一个基于SOA支持动态演化的SMP2仿真系统结构以及SMP2仿真系统动态演化需求模型,设计并实现了两个系统动态演化相关的仿真组件,以卫星导航可见卫星数量演化仿真实验为例验证了方法的可行性,并讨论了下一步的研究方向。  相似文献   

8.
IsIs以其强大的MCU实时仿真功能覆盖8051系列单片机、PIC以及ARM等等从低端到高端的各种嵌入式MCU系统。以IsIs为开发工具,设计了一种基于8051单片机系统的液晶游戏,并结合此实例对IsIs的用途及其在实际开发过程中的使用方法进行了介绍,并给出了IsIs与KeilC51集成开发系统的接口方法。它解决了一些实际存在的束缚,节省了大量的制作电路板的时间并减少了因设计错误导致的资金、时间的浪费,对提高产品的开发效率,降低开发成本等有重要作用。  相似文献   

9.
为了研究GPU的通用计算能力和适合SMP集群的编程模型,首次提出MPI+CUDA多粒度混合并行编程的新方法,节点间采用MPI实现粗粒度并行,节点内采用CUDA实现细粒度并行的混合编程方式.利用此方法在搭建的3节点SMP集群环境中,测试了大规模矩阵乘问题的并行计算能力.实验结果表明,该方法能够显著提升并行效率,同时证明MPI+CUDA混合编程模型能够充分发挥SMP集群节点间分布式存储和节点内共享内存的优势,为装有CUDA-enabled GPU的SMP集群提供了一种有效的并行策略.  相似文献   

10.
11.
基于Matlab/Simulink的可编程接口系统的仿真   总被引:1,自引:0,他引:1  
阐述了基于Matlab/Simulink的可编程接口芯片仿真系统的实现,包括总体的设计和建模,总体设计包括系统的结构框架和界面设计。结合Intel8251的“串行输出”实例介绍了仿真原理及在Matlab/Simulink中的具体实现过程和仿真结果。通过调用Simulink的模块库创建可编程芯片的仿真,删除芯片中多余的引脚,简化了各块芯片的复杂线路,突出了使用Simulink仿真的高效性和准确性。  相似文献   

12.
针对复杂民机机电系统仿真效率低的问题,提出一种基于数据分发服务的分布式并行建模与仿真方法.分析数据分发服务的通信特点;利用数据分发服务的API函数和AMESim应用程序编程接口,在现有分布式互联架构平台的基础上,设计AMESim与分布式互联架构平台的数据交互接口,实现了民机升降舵系统与液压能源系统的分布式并行建模与仿真...  相似文献   

13.
随着我国城市交通堵塞的日益严重,有必要对汽车流量及其特性进行调查研究、分析预测。随着多核平台的普及,借助多CPU计算机平台对系统进行仿真研究,对仿真输出结果的分析、对比和评估来获得系统行为表现,是一种高效且经济可行的方法。多内核是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。操作系统通过划分任务,线程应用能够充分利用多个执行内核,并可在特定的时间内执行更多任务。在多处理器平台上,OS可调度多个线程至不同的处理器运行以提高系统的运行效率。"道路交通仿真系统"借助该类平台通过多线程技术实现对交通运动随时间和空间的变化进行高效跟踪描述,对道路运输系统及其各组成部分的分析和评价中发挥了重要的作用。  相似文献   

14.
基于SOA的仿真服务系统   总被引:1,自引:0,他引:1  
何强  郝建国  黄健 《计算机仿真》2007,24(5):98-102
分布式仿真技术的发展离不开Web技术的推动,当前也只有与Web兼容才能满足不同领域仿真应用的需求.当前Web领域正经历着深刻的变化,新标准和新技术不断出现,如何将Web领域的最新成果集成应用到建模与仿真系统中以弥补现有仿真技术的不足及提高仿真系统的能力是目前仿真技术发展面临的主要问题.Web服务技术是当今IT业的新兴力量,Web服务技术的成熟使面向服务的架构在企业级应用集成中得到了广泛应用.在详细介绍SOA及其实现技术Web服务的基础上,结合分布式仿真的特点提出了基于SOA的仿真服务系统的概念,为建立基于Web的建模与仿真系统给出了一种解决方案.  相似文献   

15.
数字城市中的基础数据就是空间数据,由于计算机的硬件和数据量的限制,使得解决海量三维数据的实时仿真问题成为数字城市建设的重要制约因素.研究和分析了Vega大规模数据库调度和管理的原理,通过基于MFC的Vega应用程序设计,实现了对大规模地物模型的实时仿真.  相似文献   

16.
介绍了基于VC+ +的编程环境及采用OpenGL图形标准的三维物体运动仿真系统的开发过程.该系统只要简单的通过数据文件的改变就能使不同的三维物体做各种复杂的运动,如变速运动、随机运动等.该系统建立的目的是为各种目标跟踪系统提供一个简单实用的目标仿真环境.  相似文献   

17.
基于计算网格的机器人分布式仿真系统   总被引:3,自引:0,他引:3  
张平  宋丙林  王琼芳 《机器人》2005,27(4):309-312
基于计算网格技术,构建了机器人分布式三维图形仿真系统,经对PUMA 560工业机器人进行动力学仿真计算表明,计算网格技术提高了机器人三维图形仿真系统的计算能力.  相似文献   

18.
基于HLA的分布式导弹攻防视景仿真系统   总被引:3,自引:2,他引:1  
HLA和虚拟现实相结合,使得通过计算机生成的综合环境具有真实感,具有较高的可信度.文中基于新一代实时视景仿真软件平台Vega Prime和HLA仿真支撑平台MAK RTI设计开发了导弹攻防视景仿真系统.介绍了导弹攻防仿真大系统的总体框架,视景仿真系统的功能设计以及联邦通信,给出了程序流程.最后针对Vega Prime自带特效无法达到导弹攻防可视化要求的现状,实现了Vega Prime下调用OpenGL函数来表现特效这一关键技术.与导弹攻防仿真大系统的联调表明,该系统逼真流畅地演示出仿真系统作战想定的全过程,并且满足系统仿真的实时性要求.  相似文献   

19.
随着仿真系统应用的发展,计算能力需求的不断扩展,建立在DIS标准之上的分布式交互仿真在体系结构和技术上互操作性和可重用性方面的明显不足.传统基于通用的建模与仿真技术框架,即高层体系结构(High Level Architecture,HLA),能将更广范围的仿真系统集成到一个综合环境中,提供更大规模的仿真,而成为新一代分布式交互仿真体系结构,通过基于HLA为分布式交互仿真通过使用一个通用的技术框架和开放的标准,提供各种实现底层通信和基本功能的服务,包括发布/订阅机制、数据分发管理服务、时间管理服务、所有权管理服务等.不但满足仿真心痛的实时性需求,同时也确保了数据的安全性.其中,HLA的发布/订阅机制与数据分发管理服务可尽可能地减少成员收到不需要的数据和网络数据流量,均衡各成员的负载状况,有效地使用系统的通信带宽和处理机的计算能力来满足复杂分布式系统的可扩缩性.  相似文献   

20.
粒子系统的基本理论符合自然世界的客观规律,适用于烟花等复杂现象的仿真。针对粒子系统仿真存在的计算和内存资源消耗巨大等问题,建立了基于统一计算设备架构(CUDA)框架的粒子系统基本模型,讨论了模型中粒子的存储与运动更新,研究了基于CUDA的并行KD-TRIE邻近粒子搜索算法。运用建立的CUDA粒子系统,研究了烟花仿真的具体实现。仿真结果表明,系统能够较逼真地仿真烟花的上升与绽放过程,帧率高达每秒312帧,仿真的真实感和实时性得到增强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号