期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李天驹张铮张为华《计算机系统应用》2015,24(8):1-9

KD树作为一种用于查询高维键值的流行算法, 由于其准确性高、可扩展性强与较快的查询速度而应用于多媒体检索领域, 但缓慢的建树效率已不能很好的满足当前的应用场景. 针对KD树的低效建树过程, 作者探寻并分析了KD树建树现存的并行潜能并提出了一种面向KD树建树过程的多核并行算法—ParK(Parallel KD-Tree). ParK探求了不同的并行模式来充分利用现代硬件中的计算资源, 并在此基础上提出了一种新的内存分配策略来解决并行处理中的数据争用状况. 实验结果表明Park相比于原始串行版本最高能够在16核的服务器上达到21.75倍的加速. 相似文献

2.

基于FC-TR网络的MPI通信性能优化研究*

曾小荟刘清罗文浪康继昌《计算机应用研究》2011,28(4):1505-1508

为了给上层的MPI并行应用程序提供更快的基于信令寻径式光纤通道交换网络（简称为FC-TR网络）的通信支持,本文针对FC-VIA-MPI进行了通信性能优化,对点对点通信的实现提出了新的优化方法,尽量把同一节点内进程之间的网络通信转化为内存操作;同时,根据底层的FC-TR网络软硬件特性,本文对MPI的部分组通信（比如MPI_Bcast、MPI_Allreduce等）的实现也提出了新的优化算法。实验结果表明,优化的FC-VIA-MPI通信性能总体上提高了10%左右。相似文献

3.

大规模集群上多维FFT算法的实现与优化研究

《计算机科学与探索》2017,(6):863-874

快速傅里叶变换(fast Fourier transform,FFT)是用于计算离散傅里叶变换(discrete Fourier transform,DFT)或其逆运算的快速算法,在工程、科学和数学领域的应用非常广泛,例如信号分解、数字滤波、图像处理等。因此,在实际应用中对FFT算法进行细粒度优化是非常重要的。研究了FFT算法常用的分解策略以及FFT算法在大规模集群系统上的并行实现,并提出了相关的优化策略。在此基础上,对多种FFT算法在不同平台上进行了性能评估,并分析了各算法的实现、优缺点及其在大规模计算时的可扩展性。实验结果表明,相关研究有助于对现有的FFT算法进行进一步的优化,以及指导如何在大规模CPU+GPU的异构系统上根据不同需求选择实现性能更优的FFT算法。相似文献

4.

一种优化MPI程序性能的改进方法

柯鹏聂鑫《现代计算机》2011,(18):3-6

在分布式存储系统上,MPI已被证实是理想的并行程序设计模型。MPI是基于消息传递的并行编程模型,进程间的通信是通过调用库函数来实现的,因此MPI并行程序中,通信部分代码的效率对该并行程序的性能有直接的影响。通过用集群通信函数替代点对点通信函数以及通过派生数据类型和建立新通信域这两种方式,两次改进DNS的MPI并行程序实现,并通过实验给出一个优化MPI并行程序的一般思路与方法。相似文献

5.

基于群集智能的蚁群优化算法研究 总被引：7，自引：0，他引：7

李志伟《计算机工程与设计》2003,24(8):27-29

群集智能是近年来人工智能领域研究的一个新的热点课题。介绍了这一研究的思想方法和数学模型，以蚂蚁群体的智能行为研究对象，阐述了基于群集智能的蚁群优化算法，并介绍了该算法的工程应用。相似文献

6.

基于MPI的并行计算集群通信及应用 总被引：4，自引：0，他引：4

罗省贤李录明《计算机应用》2003,23(6):51-53

对能有效解大型稀疏矩阵方程的LSQR串行算法进行了并行化分析，并应用可移植消息传递标准MPI的集群通信机制在分布式存储并行系统上设计和实现了LSQR并行算法，该并行算法和程序在地震表层模型层析反演中得到了有效的应用。相似文献

7.

MPI集群通信性能分析 总被引：1，自引：0，他引：1

任波王乘《计算机工程》2004,30(11):71-73

MPICH是国内常用的集群计算消息传递系统。MPICH库函数提供的集群通信函数对并行程序的性能有很大的影响。根据集群通信的功能特性．初步地分析了MPICH集群通信的实现机制,并在Windows-10M NOWs和Linux-100M NOWs 中测试了MPICH库函数提供的常用的集群通信函数的执行效率。相似文献

8.

集群竞赛优化算法

柯晶李歧强钱积新《模式识别与人工智能》2005,18(2)

通过采用群体化策略和竞赛奖励制度,提出一种集群竞赛优化算法.该算法的基本思想可以归纳为竞争择优、胜者奖励、向优集群和保持多样.指出该算法与其它集群智能方法之间的联系与区别.采用多个经典测试函数对该算法进行评价并与其它优化方法进行比较.比较结果表明,平均起来,该算法优于粒子群优化算法和一种进化优化方法. 相似文献

9.

基于网格的消息传递接口的实现:MPICH-G2

刘黎明熊齐邦《计算机工程与设计》2004,25(9):1551-1554

MPI(消息传递接口)作为一种著名的底层并行编程模型已被提出来作为网格编程的基础。描述了基于网格的消息传递接口的实现MPICH-G2,它基于MPICH和Gllobus工具包实现,在启动和管理中隐藏了异构性,具有良好的异构通讯性能。用一个例子说明如何在一个由Globus搭建的计算网格环境中通过MPICH-G2来创建和执行MPI计算。相似文献

10.

用于并行计算的PC集群系统构建* 总被引：2，自引：0，他引：2

李敏张宜生李德群《计算机应用研究》2009,26(3):1042-1043

在注射成形模拟研究过程中,涉及材料的牛顿和非牛顿黏性流动模拟和注射成形后期的冷却过程模拟,以及随时间变化各处的压力变化等科学和工程领域经常应用大规模科学计算。随着基于网格的计算和数据处理日益复杂,很多计算一般PC系统无法满足要求,需要超级计算环境。因为不断追求更高的计算精度和日益复杂的对象而扩大计算规模,传统的串行处理方式难以满足这些要求。因此,现代高性能计算的低成本、高效率成为选择并行计算的解决方式。重点阐述如何构建一个用于并行计算的PC集群系统,结合实例阐明MPI的实现方法,以及对PC集群系统进行了性相似文献

11.

Achieving energy efficiency during collective communications

Vaibhav Sundriyal Masha Sosonkina Zhao Zhang 《Concurrency and Computation》2013,25(15):2140-2156

Energy consumption has become a major design constraint in modern computing systems. With the advent of petaflops architectures, power‐efficient software stacks have become imperative for scalability. Techniques such as dynamic voltage and frequency scaling (called DVFS) and CPU clock modulation (called throttling) are often used to reduce the power consumption of the compute nodes. To avoid significant performance losses, these techniques should be used judiciously during parallel application execution. For example, its communication phases may be good candidates to apply the DVFS and CPU throttling without incurring a considerable performance loss. They are often considered as indivisible operations although little attention is being devoted to the energy saving potential of their algorithmic steps. In this work, two important collective communication operations, all‐to‐all and allgather, are investigated as to their augmentation with energy saving strategies on the per‐call basis. The experiments prove the viability of such a fine‐grain approach. They also validate a theoretical power consumption estimate for multicore nodes proposed here. While keeping the performance loss low, the obtained energy savings were always significantly higher than those achieved when DVFS or throttling were switched on across the entire application run. Copyright © 2012 John Wiley & Sons, Ltd. 相似文献

12.

基于MPI的云计算模型 总被引：11，自引：4，他引：7

下载免费PDF全文

郭本俊王鹏陈高云黄健《计算机工程》2009,35(24):84-86

根据消息传递接口（MPI）的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为算法分布化及并行化提供新思路。相似文献

13.

基于曙光-2000的MPI循环并行方法

韩丛英贺国平张广梅《计算机工程》2003,29(3):47-49

曙光-2000并行机系统是分布式存储系统，在此类系统上直接写并行程序是很困难的。该文通过详细分析书写MPI程序的各种模式，结合曙光-2000并行机，给出一种将串行程序改写成MPI并行程序的方法：分析串行程序的循环体，考虑数据依赖关系，加以适当的 M PI函数，使之并行化。相似文献

14.

基于MPI的并行多目标粒子群算法

耿文静董红斌丁蕊《模式识别与人工智能》2018,31(7):668-676

为了进一步提高速度受限的多目标粒子群算法(SMPSO)求解多目标优化问题的效率和精度,文中提出基于消息传递接口(MPI)的并行化SMPSO算法(M-SMPSO).采用主从模式的MPI并行程序设计模式,将整个种群分成几个子种群,各子种群分别执行独立进化计算,提高算法效率.此外,为了均衡考虑算法的分布性与收敛性,提出自适应的全局最优解选择策略.使用标准测试函数验证算法性能,实验表明,相比其它多目标算法,文中算法能获得更高的加速比,更快收敛到多目标优化问题的Pareto前沿. 相似文献

15.

基于MPI的匹配方体并行计算研究

罗秋明王梅雷海军《计算机应用》2006,26(8):1916-1918

双目立体视觉的匹配方体计算过程可以进行SIMD类型的并行计算,基于MPI通信环境将视差值的计算任务分配到不同的计算节点上,然后将各节点计算所获得的DSI图像汇集在根节点上,最终通过数据规整快速获得所需的匹配方体。同时建立了该并行算法基于处理器时钟周期的相对精确的计算时间复杂度模型,用于分析不同计算平台上的性能。由于计算过程中数据相关性较低,因此在基于MPI与Myrinet网络的Linux集群计算平台上获得了较好的加速比。相似文献

16.

MPI_ALLGATHER实现算法的改进与性能分析

李占胜毕会娟都志辉焦青《计算机工程与应用》2007,43(27):66-71

首先分析了影响MPI组通信性能的各方面因素,提出了一种衡量算法性能的模型。基于这种分析及模型,提出了一种将邻居交换和递归倍增两种算法结合的新的MPI_ALLGATHER实现算法。新的算法比邻居交换算法通信次数少,比递归倍增算法具有较好的通信局部性。通过在高性能机群系统中的测试,发现新算法在多种情况下比邻居交换算法具有更优的性能,在中等长度消息通信时具有最优的性能,在长消息通信时性能比递归倍增算法和Bruck算法的性能更优,且在长消息通信时多数情况下性能最优。相似文献

17.

基于MPI的层状地层并行可视化技术

下载免费PDF全文

陈鹏任波郭振岗王乘《计算机工程》2008,34(9):281-282

为了提高层状地层的可视化绘制速度,结合地质探勘数据的特点,基于MPI开发地层的并行可视化程序,并采用Kriging方法对多个地层的数据进行并行插值计算。利用多台PC机搭建Windows2000 操作系统下的并行计算环境,计算时间统计数据对比表明并行计算方法能有效地节省计算时间。相似文献

18.

An implementation and evaluation of the MPI 3.0 one‐sided communication interface

James Dinan Pavan Balaji Darius Buntinas David Goodell William Gropp Rajeev Thakur 《Concurrency and Computation》2016,28(17):4385-4404

The Message Passing Interface (MPI) 3.0 standard includes a significant revision to MPI's remote memory access (RMA) interface, which provides support for one‐sided communication. MPI‐3 RMA is expected to greatly enhance the usability and performance of MPI RMA. We present the first complete implementation of MPI‐3 RMA and document implementation techniques and performance optimization opportunities enabled by the new interface. Our implementation targets messaging‐based networks and is publicly available in the latest release of the MPICH MPI implementation. Using this implementation, we explore the performance impact of new MPI‐3 functionality and semantics. Results indicate that the MPI‐3 RMA interface provides significant advantages over the MPI‐2 interface by enabling increased communication concurrency through relaxed semantics in the interface and additional routines that provide new window types, synchronization modes, and atomic operations. Copyright © 2016 John Wiley & Sons, Ltd. 相似文献

19.

基于MPI的并行PSO混合K均值聚类算法 总被引：2，自引：0，他引：2

吕奕清林锦贤《计算机应用》2011,31(2):428-431

传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算法的全局搜索能力,然后利用该算法提出一种新的并行聚类策略,并将该算法与K均值聚类算法、粒子群优化(PSO)聚类算法进行比较。实验结果表明,该算法不仅具有较好的全局收敛性,而且具有较高的加速比。相似文献

20.

Simple,efficient allocation of modelling runs on heterogeneous clusters with MPI

《Environmental Modelling & Software》2017

In scientific modelling and computation, the choice of an appropriate method for allocating tasks for parallel processing depends on the computational setting and on the nature of the computation. The allocation of independent but similar computational tasks, such as modelling runs or Monte Carlo trials, among the nodes of a heterogeneous computational cluster is a special case that has not been specifically evaluated previously. A simulation study shows that a method of on-demand (that is, worker-initiated) pulling from a bag of tasks in this case leads to reliably short makespans for computational jobs despite heterogeneity both within and between cluster nodes. A simple reference implementation in the C programming language with the Message Passing Interface (MPI) is provided. 相似文献