共查询到20条相似文献,搜索用时 62 毫秒
1.
高性能计算中的并行I/O技术 总被引:2,自引:0,他引:2
1 引言高性能计算能力已经日益成为一个国家经济、科技与国防实力的重要组成部分。由于科学工程计算和大规模商业事务处理需求的牵引,高性能计算中对I/O处理能力的要求简直是无止境的。大规模多媒体应用要求大容量快速存储系统支持,多用户事务处理环境要求快速I/O支持实时访问,而一些重大挑战性科学计算课题更是追求计算机系统具有3T性能(即要求能提供 1 Teraflops计算能力、1 Terabyte主存容量和1 Terabyte/s I/O带宽)。 I/O一直是高性能计算中的瓶颈。典型地,磁盘比主存的速度要慢一万倍到十万倍。近年来,随着大规模集成电路技术和网络技术的飞速发展,CPU的性能大约每三年就有一个较大的飞跃,网络带宽增长更快,但I/O设备的性能受制于机 相似文献
2.
对不同规模,不同要求的问题进行并行计算,应选用不同数量的处理器参与计算才能获得最佳的并行处理性能。本文以连续系统并行仿真为例,提出适合于并行仿真系统的我处理器数确定的方法。 相似文献
3.
该文在研究石油领域并行仿真需求的基础上,给出了四种并行仿真模式。这些并行仿真模式已在基于机群的石油勘探仿真系统中得到了很好的应用。它们同样适用于其它应用领域,用以提高并行仿真系统的性能。 相似文献
4.
立足于多年来所开展的大型导弹并行仿真的研究工作,深入分析了其仿真模型的可并行性,设计实现了以右函数为基本任务单位的任务级并行仿真算法。使用结果表明,该算法具有很高的并行效率。 相似文献
5.
6.
一种基于多Agent的人群仿真多机并行平台研究 总被引:1,自引:0,他引:1
本文提出了一种针对多Agent人群仿真模型的多机并行平台,该平台利用MPI作为节点间的通讯软件,采用主从模式设计多机并行执行环境。在主控节点中设置结果回收模块与监控模块,通过K-means算法保证执行节点之间的负载均衡,同时以此作为任务分发与调度的依据;在执行节点(从节点)中,则根据主控节点的任务调度执行相关Agent模型,并执行仿真同步与状态信息汇报等任务。实验结果表明,该多机并行平台能够执行基于多Agent的人群仿真模型,能有效地提高仿真的性能,同时具有良好的可扩展性。 相似文献
7.
乐观时间同步机制能够显著提高并行仿真的性能,但是在乐观时间推进过程中会出现因果错误,需要根据保存的状态对事件进行回退,因此事件状态保存机制是影响乐观时间推进效率的重要因素。本文首先简要介绍了并行仿真中逻辑进程的执行过程,讨论了乐观时间推进的状态保存与回退机制;然后对全状态保存技术进行了建模和理论分析,并通过实验测试了全状态保存算法的性能,测试结果验证了理论分析的正确性。 相似文献
8.
9.
10.
11.
基于新型多核SMP集群的层次化性能模型,本文在BigSim并行性能模拟器基础上实现了一个Trace驱动的多核SMP集群并行性能模拟器Sim-MSC。在一个InfiniBand多核SMP集群的宿主机平台上采用jacobi3D程序进行了测试,结果表明Sim-MSC能够模拟MPI消息传递并行应用程序在多核SMP集群上的执行特征,精确预测系统和应用性能。 相似文献
12.
基于单引擎检测的网络入侵检测系统(network intrusion detection system,NIDS)靠辅助硬件和改进检测算法来提高处理性能,但已无法适应10Gb/s以上流量的线速处理要求。利用多检测引擎进行并行处理是实现高性能入侵检测的重要技术手段,并行检测系统通过多检测引擎进行并行协同检测,具有高性能和可扩展的优点。归纳了进行流量划分时遇到的保持检测攻击所需证据和负载均衡这两方面的挑战及其解决策略。综合现有并行入侵检测框架的优点,提出了一个统一的支持多检测引擎并行检测的体系结构UPDA(uniformed parallel detection architecture)。利用NetMagic平台,基于UPDA框架,设计和实现了一个高性能并行入侵检测原型系统,并通过实验验证了系统的高性能和有效性。 相似文献
13.
文章讨论了基于SI仿真技术的高速电路设计流程,并结合高性能DSP并行系统设计实例进行展开说明。实际系统设计证明,基于该流程的设计方法能够有效的解决系统的信号完整性问题,保证了设计质量,提高了设计效率。 相似文献
14.
随着空间遥感技术和对地观测技术的不断发展,光学、热红外和微波等不同技术手段可以获取同一地区的多种遥感影像数据(多时相、多光谱、多传感器、多平台和多分辨率等),每天获取的遥感数据量越来越大。同时,大量的遥感应用需要快速地对这些遥感数据进行处理与分析,提供辅助决策信息。因此,如果不能及时进行数据处理,这些数据就会失去时效性,甚至失去数据本身的价值。高性能计算与并行处理技术,加速了遥感影像数据处理与信息提取的进度,如大规模多处理系统、网格与云计算技术、通用图形处理器(GPGPU)等。文中综述了高性能计算、并行处理及云计算技术应用于遥感领域的最新进展,给出了一些研究与应用范例,并提出了当前高性能遥感影像处理所面临的一些挑战。 相似文献
15.
面向高性能数值计算的并行计算模型DRAM(h) 总被引:11,自引:0,他引:11
提出了一个基于存储层次的新并行计算模型DRAM(h),并在该模型下对两个经典并行数值计算算法的不同实现形式:四种形式并行下三角方程求解(PTRS)和六种形式无列选主元并行LU分解(PLU),进行了分析.模型分析表明,具有近乎相同时间和空间复杂性的同一算法不同实现形式,在该模型下会有完全不同的存储复杂度.作者在日立公司SR2201MPP并行机、曙光3000超级服务器和中国科学院科学与工程计算国家重点实验室(LSEC)的128节点Linux Cluster等三种并行计算平台上对模型分析结果进行了实验验证.结果表明,该模型分析在绝大多数情况下都能较好地与不同实验平台上的实验结果吻合.个别出现偏差的分析结果,在根据计算平台的存储层次特点修改模型分析的假定后,也能够进行解释.这说明了该模型对不同形式的算法实现进行存储访问模式区分的有效性.对在计算模型中加入指令/线程级并行的可行性和方法的研究是下一步的工作. 相似文献
16.
17.
18.
Aversa Rocco Di Martino Beniamino Mazzocca Nicola Villano Umberto 《The Journal of supercomputing》2000,17(3):299-310
In this paper we present a novel approach, based on the integration of static program analysis and simulation techniques, for the performance prediction of message passing programs. PS, a simulator of PVM applications developed in the last years by our research group, is fed with traces collected by executing the parallel program to be analyzed in quasi-concurrent mode on a single workstation. Since this process is typically a non negligible part of the simulation complexity, we have devised a technique based on static analysis and code restructuring for significantly speeding up the trace generation. We show how, by statically analyzing and restructuring the program, it is possible to obtain a simplified code (shrinked code) to be run for collecting a reduced version of the traces. 相似文献
19.
在高性能计算平台上测试NFS和Lustre文件系统在大规模并行计算环境下的IO速率,根据测试结果分析该实验平台的IO瓶颈并提出改进方案;之后测试本地Cache、并行应用进行IO时的TransferSize和并行程序存取文件的FileSize等因素对分布式文件系统性能的影响,并根据实验结果提出如何合理地部署并行软件以有效地利用本地Cache,以及提出在编写并行程序时设置合适的TransferSize和FileSize以提高IO性能的建议。 相似文献
20.
LP到PP的高效映射是加速并行性能模拟的关键技术之一。针对交互规则的并行应用程序,设计映射生成方法A2-LP3M从Trace中提取LP间的交互模式,以宿主机物理进程间通信最小化为目标,兼顾计算负载平衡,从循环块映射中选取合适的映射方式。实验表明,相对于常规映射方法,A2-LP3M减少并行模拟时间最多可达16.2%。 相似文献