期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李占胜毕会娟都志辉焦青《计算机工程与应用》2007,43(27):66-71

首先分析了影响MPI组通信性能的各方面因素,提出了一种衡量算法性能的模型。基于这种分析及模型,提出了一种将邻居交换和递归倍增两种算法结合的新的MPI_ALLGATHER实现算法。新的算法比邻居交换算法通信次数少,比递归倍增算法具有较好的通信局部性。通过在高性能机群系统中的测试,发现新算法在多种情况下比邻居交换算法具有更优的性能,在中等长度消息通信时具有最优的性能,在长消息通信时性能比递归倍增算法和Bruck算法的性能更优,且在长消息通信时多数情况下性能最优。相似文献

2.

国产百万亿次机群系统Alltoall性能测试与分析

饶立张云泉李玉成《计算机科学》2010,37(8):186-188

随着高性能计算机的应用和发展,并行应用程序所使用的处理器数越来越多,进程间的通信量也不断增多,这对应用程序的性能有很大影响. 在采用一种快速傅里叶变换HFFT对曙光5000A进行性能测试时发现,MPI集合通信函数MPI Alltoall的巨大通信开销是并行程序设计的瓶颈.为此,对现有主流Alltoall算法在曙光5000A和深腾7000上进行性能测试与分析,以期对未来的Alltoall算法的优化工作做出贡献.利用不同消息长度和不同进程数测试了Alltoall函数多种算法的性能,这些算法包括二维网格算法、三维网格算法、Bruck算法、原始算法、成对交换算法、递归倍增算法、环算法以及LAM/MPI中的简单算法等.实验结果表明:消息长度较小时,在曙光5000A上采用原始算法和Bruck算法的性能较好,而在深腾7000上用时较少的算法是简单算法和Bruck算法;对于长消息,曙光5000A上最优的算法是环算法,深腾7000上成对交换性能最优. 相似文献

3.

一种可扩展的高效全序组通信算法

下载免费PDF全文

李磊王怀民刘惠史殿习《计算机工程与科学》2006,28(Z2):118-121

全序组通信是构建分布式应用程序的一种重要通信原语,它能够保证一个通信组中的所有成员都按照同样的顺序接收消息.现有的全序组通信算法缺乏可扩展性,即当通信组中的成员数目较大时,算法的延迟时间和吞吐量都显著下降,因此这些算法不能适用于大规模的计算系统.本文提出了一种可扩展的全序组通信算法,它通过对通信进程进行分层,从而有效地平衡系统的容错性和性能开销.模拟试验结果表明,在通信进程数目较多时,该算法在延迟时间和吞吐量等性能指标方面都优于已有算法. 相似文献

4.

一种改进的动态对等群组分担式密钥协商协议

魏楚元李陶深王高才《小型微型计算机系统》2007,28(5):805-811

TGDH协议是一种较好的适合于对等群组的密钥管理方案,通过对该协议的分析,发现该协议在通信方式上存在不足,密钥更新协议使用了多余的消息,需要占用更多的带宽.本文通过设计一个求密钥关联集的预备算法,利用该算法重新设计了密钥更新协议,改进了TGDH密钥更新协议通信方式的不足.理论分析结果表明:改进后的协议有效降低了TGDH协议的通信负载和密钥存储负载,使通信带宽从O(nlogn)降低为O(n),节点的密钥存储量由O(n)降低为O(logn);仿真实验结果进一步表明改进后的协议具有更好的通信性能. 相似文献

5.

一种新的MPI Allgather算法及其在万亿次机群系统上的实现与性能分析 总被引：4，自引：0，他引：4

陈靖张云泉张林波袁伟《计算机学报》2006,29(5):808-814

给出一个新的MPI Allgather算法--邻居交换算法（neighbor exchange）.提出的平均逻辑通信距离的概念和计算公式,可以有效地衡量通信的局部性.通过分析,发现在4种MPI Allgather算法中,邻居交换和环算法均具有最优的通信局部性.在万亿次机群深腾6800和曙光4000A上对4个MPI Allgather算法进行的性能测试和分析结果表明,邻居交换算法的长消息通信性能最优,中长消息通信性能不稳定,短消息通信性能次于递归倍增和Bruck算法. 相似文献

6.

利用泛洪寻找目标Agent的通信方法

徐俊伟王培东王湛昱《计算机与数字工程》2010,38(4):44-48

文章提出一种用泛洪在朋友的列表中寻找目标Agent的通信算法,在产生消息追逐现象时比主动通信算法要优越,消息追逐现象会导致主动通信算法传递消息失败,而改进的算法利用泛洪一定会找到目标Agent,进而把消息传递给目标Agent,通过分析验证表明改进的算法具有较佳的Agent通信性能。相似文献

7.

逻辑模块的试验互换布局算法

车明康《计算机学报》1989,12(7):555-557

本文给出了解决电路逻辑块布局问题的三种试验互换算法,把试验互换局限于电路所有模块中的一个子集,可以显著缩短计算时间,在DEC1090系统上进行的性能模拟表明,成对试验互换算法比N试验互换算法能更快地得到所需布局,非连接模块对和连接模块对都进行成对互换的算法性能最佳。相似文献

8.

非平衡进程到达模式下MPI广播的性能优化方法

刘志强宋君强卢风顺徐芬《软件学报》2011,22(10):2509-2522

为了提高非平衡进程到达(unbalanced process arrival,简称UPA)模式下MPI广播的性能,对UPA模式下的广播问题进行了理论分析,证明了在多核集群环境中通过节点内多个MPI进程的竞争可以有效减少UPA对MPI广播性能的影响,并在此基础上提出了一种新的优化方法,即竞争式流水化方法(competitive and pipelined method,简称CP).CP方法通过一种节点内进程竞争机制在广播过程中尽早启动节点间通信,经该方法优化的广播算法利用共享内存在节点内通信,利用由竞争机制产生的引导进程执行原算法在节点间通信.并且,该方法使节点间通信和节点内通信以流水方式重叠执行,能够有效利用集群系统各节点的多核优势,减少了MPI广播受UPA的影响,提高了性能.为了验证CP方法的有效性,基于此方法优化了3种典型的MPI广播算法,分别适用于不同消息长度的广播.在真实系统中,通过微基准测试和两个实际的应用程序对CP广播进行了性能评价,结果表明,该方法能够有效地提高传统广播算法在UPA模式下的性能.在应用程序的负载测试实验结果中,CP广播的性能较流水化广播的性能提高约16%,较MVAPICH21.2中广播的性能提高18%～24%. 相似文献

9.

消息传递型MPSoC通信过程分析及其优化设计

付方发王进祥王良吴子旭喻明艳《计算机辅助设计与图形学学报》2011,23(10)

通过分析消息传递型MPSoC通信过程,总结出提高通信性能的有效途径——降低一对多消息发送延迟和提高多条消息并发接收效率.从减少数据拷贝延迟的角度提出了基于硬件抽象层广播优化策略,有效地降低了一对多消息发送延迟;针对并发接收瓶颈,充分考虑减少交互次数和提高长消息通信效率,提出一种基于查找表和DMA模式相结合的接收策略.实验结果表明,广播优化策略及接收策略均能明显提高性能;在64×64的矩阵乘法中,采用优化策略整体性能提高接近1.5倍. 相似文献

10.

基于主动通信的移动Agent消息保序机制

王念一徐德启王继伟《计算机应用》2007,27(Z2):15-16

分析了现有各种移动Agent通信机制的缺陷,基于移动Agent主动通信机制,提出了一种系统并发下的消息保序机制,描述了数据结构和算法,并进行了算法分析.该机制支持移动自由和透明寻址,并能提高通信可靠性. 相似文献