期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于CELL宽带引擎架构的MPI研究与实现

徐祯孙济洲于策亓大志张旭明《计算机应用研究》2010,27(13)

相似文献

2.

IBM推出革命性CELL宽带引擎（Cell BE）计算机

下载免费PDF全文

《计算机系统应用》2006,(3):94

基于Cell BE的BM系统标志着计算历史上的新纪元日前，IBM推出了摹于Cell宽带引擎（CellBE）的刀片计算系统。这种基于Cell BE的IBM系统专为那些需要Cell BE处理器的密集计算能力和独特性能来应对大量图形处理和数宇应用的公司而设计。相似文献

3.

异构环境下MPI通信技术研究

蒋艳凰赵强利卢宇彤《小型微型计算机系统》2009,30(9)

异构环境下的高性能计算技术是当前获取高性价比计算平台的重要方法,在MPI系统中提供用户透明、高性能的异构支持是实现异构环境下进程间通信的自然选择,相关技术研究已成为高性能计算领域急待解决的问题.本文对网络异构和处理器异构进行了详细阐述,分析它们对MPI通信的影响;然后基于Open MPI系统.对这两类异构问题的具体实现进行介绍,测试并分析它们对通信性能的影响;最后展望了这一研究方向的技术难点与发展趋势. 相似文献

4.

基于IBA构建高性能的MPI环境

李海军《计算机工程与应用》2004,40(15):46-48,87

IBA作为一种I/O间、主机间的下一代高速互联方式,在高性能计算领域越来越成为瞩目的焦点。消息传递接口MPI已经成为并行程序设计事实上的国际标准。该文详细介绍了在IBA之上构建一个高性能的MPI环境的方法,并对消息延迟和消息带宽进行了测试,对测试数据进行了分析。相似文献

5.

使用OpenMP+MPI的矩阵乘法并行实现

苟悦宬《广东电脑与电讯》2022,(3):77-80

相似文献

6.

基于规则引擎的电信CRM系统架构研究

杨晓花陈军《网络安全技术与应用》2013,(8):127-129

研究了电信CRM系统的功能架构.并针对目前系统架构的不足之处,提出了将规则引擎应用到CRM系统中,并构建了增加业务规则层的多层技术架构模式.使新应用的添加和变更比传统架构模式更加方便,同时能够适应大规模和复杂的应用需求,并有效降低建设和维护成本. 相似文献

7.

基于多核处理器并发计算软件构架设计与实现 总被引：3，自引：2，他引：1

汪少敏赵猛朱振博王艳琦《计算机科学》2008,35(7):283-285

目前在诸多IT应用领域中,对处理器芯片的实时并发处理能力的要求越来越高,促使多核处理器芯片以及以多核处理器为核心的高性能应用系统迅猛发展.本文提出的基于异构多核处理器系统在高性能并发处理应用中的三层软件构架,充分利用了异构处理器的多核结构,为并发处理应用进行加速;同时,该构架大大简化了异构多核平台的应用开发编程.该软件构架的有效性在基于Cell处理器平台的面向电信应用的语音会议原型系统中得到了初步试验验证. 相似文献

8.

基于RapidIO的MPI设备层的设计与实现

金亨科雷咏梅梁基《计算机工程与设计》2008,29(21)

针对RapidlO网络的特点,分析MPICH2的层次设计以及建立在TCP,SCTP网络通信协议上的MPI通信方法,通过重新定义ADI3下的CH3层,设计并实现了一种基于RapidIO的MPI设备层,建立了从MPI到RapidlO的通信通道并实现了多流通信的思想.通过在装有RapidIO网卡机器上的实验表明,在带宽和延迟通信性能上,这种专用的MPI设备层要比以太网模拟器表现出色,而且对于大数据量的通信,性能表现更好. 相似文献

9.

多源异构数据融合与高性能图数据库查询引擎设计

杨洵《信息与电脑》2024,(1):149-151

文章针对多源异构数据整合及高性能图数据库查询引擎设计问题,提出创新技术解决方案。通过深度融合实现数据整合与高效存储,并引入先进图数据库技术,以快速响应复杂查询请求。实验证明,该系统在多源异构数据融合和图数据库查询方面具有明显的性能优势,为实际应用提供了可行解决方案。相似文献

10.

基于ParaViewWeb架构的GPU高性能运算实现

褚晶辉王亚琦吕卫《计算机工程与应用》2015,51(11):150-153

针对智能手机、平板电脑等移动终端计算能力有限的问题,提出一种基于网络的通用计算服务平台。该平台以服务的方式为移动终端提供远程计算支持,增强其进行复杂运算的能力。利用ParaViewWeb架构的可扩展性,将高性能GPU通用计算与ParaViewWeb架构结合,在保留ParaViewWeb原有的三维数据分析与可视化功能的基础上,扩展其远程调用服务器GPU运算资源的能力。选取医学图像滤波算法为实验对象,验证了该平台的有效性,结果表明对比本地应用,基于网络的应用取得了显著加速。相似文献

11.

异构多核处理器体系结构设计研究 总被引：2，自引：0，他引：2

陈芳园张冬松王志英《计算机工程与科学》2011,33(12):27-36

多核技术成为当今处理器发展的重要方向,异构多核处理器由于可将不同类型的计算任务分配到不同类型的处理器核上并行处理,从而为不同需求的应用提供更加灵活、高效的处理机制而成为当今研究的热点.本文从体系结构的角度探讨了异构多核处理器设计中的关键点,从内核结构、互连方式、存储系统、操作系统支持、测试与验证、动态电压调节等方面分析... 相似文献

12.

MPI-RCDD: A Framework for MPI Runtime Communication Deadlock Detection

下载免费PDF全文

Hong-Mei Wei Jian Gao Peng Qing Kang Yu Yan-Fei Fang Ming-Lu Li 《计算机科学技术学报》2020,35(2):395-411

The message passing interface (MPI) has become a de facto standard for programming models of highperformance computing, but its rich and flexible interface semantics makes the program easy to generate communication deadlock, which seriously affects the usability of the system. However, the existing detection tools for MPI communication deadlock are not scalable enough to adapt to the continuous expansion of system scale. In this context, we propose a framework for MPI runtime communication deadlock detection, namely MPI-RCDD, which contains three kinds of main mechanisms. Firstly, MPI-RCDD has a message logging protocol that is associated with deadlock detection to ensure that the communication messages required for deadlock analysis are not lost. Secondly, it uses the asynchronous processing thread provided by the MPI to implement the transfer of dependencies between processes, so that multiple processes can participate in deadlock detection simultaneously, thus alleviating the performance bottleneck problem of centralized analysis. In addition, it uses an AND⊕OR model based algorithm named AODA to perform deadlock analysis work. The AODA algorithm combines the advantages of both timeout-based and dependency-based deadlock analysis approaches, and allows the processes in the timeout state to search for a deadlock circle or knot in the process of dependency transfer. Further, the AODA algorithm cannot lead to false positives and can represent the source of the deadlock accurately. The experimental results on typical MPI communication deadlock benchmarks such as Umpire Test Suit demonstrate the capability of MPIRCDD. Additionally, the experiments on the NPB benchmarks obtain the satisfying performance cost, which show that the MPI-RCDD has strong scalability. 相似文献

13.

多色SSOR-PCG的MPI+OpenMP混合编程实现

林绍忠许合伟颉志强《计算机辅助工程》2013,22(6):79-83

针对对称逐步超松驰预处理共轭梯度（Symmetric Successive Over Relaxation Preconditioned Conjugate Gradient,SSOR-PCG）法并行化时每步迭代都要并行求解2个三角方程组的困难,采用多色排序技术提高并行度,基于MPI＋OpenMP混合编程模型开发适合于分布共享内存计算机的并行程序,通过测试选择有效的MPI通信函数,并给出3种避免共享数据竞争的措施,供不同规模问题和不同内存容量计算机情况选用．相似文献

14.

一种支持多种访存技术的CBEA片上多核MPI并行编程模型 总被引：1，自引：0，他引：1

冯国富董小社胡冰王旭昊王恩东《计算机学报》2008,31(11)

现有的CBEA(Cell Broadband Engine Architecture)编程模型多侧重于支持类似于流处理的"批量访存"(Bulk Data Transfer)应用,传统非规则访存应用性能较低.文中基于Cell架构提出了一种同时支持"批量访存"与非规则访存应用的MPI并行编程模型,将通信分解在PPE(PowerPC Processing Element)上,拓宽模型的适用范围;在统一访存接口下,通过运行时访存剖分信息指导选择和优化访存以提高计算效率.实验结果表明,文中提出的编程模型支持多种访存模式并具有很好的并行加速比,可获得较同类相关技术30%~50%左右的性能提升. 相似文献

15.

RoCE协议下基于在网计算的MPI通信优化

李嘉群蔡文杰沈瑜齐法制曾珊李京《计算机系统应用》2022,31(11):320-329

高性能计算中,通信上的巨大开销已成为其算力提升的主要瓶颈之一,通信性能的优化一直是一个重要挑战.针对通信优化任务,提出一种基于在网计算技术降低通信开销的方法.该方法在基于以太网的超算环境下,利用RoCEv2协议、可编程交换机以及OpenMPI,实现将归约计算卸载到可编程交换机,支持Node和Socket两种通信模式.在真实超算环境下开展了集合通信基准测试和OpenFOAM应用测试实验,结果表明,当服务器节点数达到一定规模时,该方法在Node和Socket两种模式下相较于传统的主机通信,均呈现出较好的性能提升,其中集合通信基准测试有10%–30%左右性能提升,在应用级测试中应用整体性能有1%–5%左右提升. 相似文献

16.

基于MPI的不可压缩N-S方程并行计算方法的研究 总被引：1，自引：0，他引：1

李宁罗纪生《计算机工程与应用》2007,43(9):8-10

在目前的计算流体力学问题中,当求解N-S方程等大型科学计算问题时,存在着计算量大、耗时长的问题,对此提出了一种MPI并行算法,其中包括并行求解三对角矩阵与超松弛迭代。通过实例验证,该方法准确、可靠,并且可以大大缩短计算时间,对于大型科学计算问题具有很好的适用性。相似文献

17.

MPI容错机制的研究

崔丽青徐炜民《计算机工程》2004,30(16):88-90

MPI是广泛应用于集群系统的并行程序开发环境,MPI的容错是集群系统可靠性的关键问题。该文讨论了MPI标准中的容错,结合协调设置检查点和同步卷回等机制设计了基于检查点的卷回恢复系统MPIChaRR、该系统应用于Linux集群机,MPICH应用程序运行中的节点故障恢复是对用户透明的。相似文献

18.

基于SMP集群的MPI+OpenMP混合编程模型研究 总被引：4，自引：1，他引：3

潘卫陈燎原张锦华李永革潘莉夏凡《计算机应用研究》2009,26(12):4592-4594

讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。相似文献

19.

基于异构多核的CCA并行构件模型

彭云峰张炜《计算机应用研究》2014,31(12)

并行构件技术的出现提高了并行软件的开发效率,但现有的并行构件技术缺乏对异构多核平台的支持.为了提高并行构件程序在异构平台上的执行性能,扩展CCA(通用构件体系结构)并行构件模型支持CCA异构并行构件,提出了一种异构的CCA并行构件模型.使用管理者—工人模式调度CCA异构并行构件内的计算任务到异构多核平台上加速执行.在CCA构件工具包的基础上实现了支持扩展CCA并行构件模型的编译系统和运行时框架.在CELL BE和GPU两种异构多核处理器上进行的实验证明了提出的方法比原始的CCA构件程序具有较优的性能.提出的并行构件模型应用在并行程序开发中可以提高并行程序的性能. 相似文献

20.

一种基于MPI与OpenMP的矩阵乘法并行算法

张艳华刘祥港《计算机与现代化》2011,(7):84-87

阐述MPI与OpenMP进行并行计算的特点,并在Visual Studio 2010上构建一个基于两者的混合编程平台。程序在该平台上执行时能够同时实现多进程与进程内多线程编程,设计并实现一种基于数据划分的矩阵乘法的并行算法,将数据分解为两部分交给两个计算节点分别完成,并在每个计算节点内将数据进一步划分,交给多个线程同时执行。通过与非并行矩阵乘法、MPI矩阵乘法、OpenMP矩阵乘法运算性能进行比较,验证该算法可以有效地挖掘计算机的处理能力。相似文献