期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

柯琦钟诚陈清媛陆向艳《计算机应用》2013,33(3):821-824

建立一个适用于整数序列排序的数据分配模型,在多核计算节点组成的异构机群上设计通信高效的整数序列并行算法。所提出的数据分配模型依据机群中各节点不同的计算能力、通信速率和存储容量,动态计算出调度分配给各节点的数据块的大小以平衡各个节点的负载。所设计的并行排序算法利用整数序列的特性,主节点采取两轮分发数据与接收结果的方法,从节点运用分桶打包方式返回有序的整数子序列给主节点,主节点采用桶映射方法将各个有序子序列直接整合成最终有序序列,以减少需要耗费较多通信时间的数据归并操作。分析与实验测试结果表明,给出的多核机群上的整数序列并行排序算法高效,具有良好的可扩展性。相似文献

2.

基于TBB任务调度器的N皇后多核并行算法

郑晓薇张建强《计算机工程与设计》2010,31(15)

为了充分利用多核处理器资源,研究了Intel线程构建模块并行编程模式.基于任务调度器,建立了逻辑线程和物理线程最佳匹配和映射的面向任务编程模式.利用任务调度器,设计了N皇后问题在多核处理器的并行算法.该算法将任务自动地映射到多线程,减少消息传递和数据移动带来的额外开销,提高多核CPU的使用效率.并行算法的加速比接近核数,CPU使用效率超过90%,实验结果表明,该算法有效地提升了多核计算机资源的利用率. 相似文献

3.

面向NUMA集群的代数多重网格算法优化

顾坚刘伟《计算机科学》2014,41(6):113-118

代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,从而改善了OpenMP多线程并行的数据局部性,使BoomerAMG程序在大规模多核计算平台上具有更好的并行扩展性。在单节点和小规模机群的测试中,使用NAAlloc分配器分别获得了最高16%和60%的性能提升。相似文献

4.

共享存储环境下非平衡动力学方程组并行计算

迟利华刘杰《计算机应用》2010,30(Z1)

OpenMP是现代多核机群系统采用的主要并行编程模型之一,在单CPU多核上可以获得良好的加速性能,但在整个机群系统上使用时,需要解决可扩展性差的问题.首先设计了求解非平衡动力学方程的并行算法.基于分布共享的多核机群系统,采用显式数据分布OpenMP并行计算方法,将数据进行分布式划分,分配到每个OpenMP线程,通过数据共享实现数据交换.计算结果表明显式OpenMP并行程序在保持可读性的同时,具有良好的可扩展性,在4核Xeon处理器构成的分布共享机群系统上,非平衡动力学方程组的数值并行计算可以扩展到1024个CPU核,具有明显的并行加速计算效果. 相似文献

5.

基于MPI与OpenMP混合并行计算技术的研究

李苏平刘羽刘彦宇《软件导刊》2010,(3)

针对多核机群系统的硬件体系结构特点,提出了节点间MPI消息传递、节点内部OpenMP共享存储的混合并行编程技术。该编程模型结合了两者的优点,更为有效地利用了多核机群的硬件资源。建立了单层混合并行的Jacobi求对称矩阵特征值算法。实验结果表明,与纯MPI算法相比,混合并行算法能够取得更好的加速比。相似文献

6.

存储受限异构机群系统的多目标串近似匹配并行算法 总被引：1，自引：0，他引：1

范曾钟诚崔鑫许莉莉《小型微型计算机系统》2009,30(2)

针对处理机节点具有不同的计算能力、通信延迟和存储容量的情形,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,分别建立单层和两层树结构模型的存储受限异构机群系统的目标串最优分配线性规划模型,给出相应的目标串最优分配方法,并讨论了处理机最优分配顺序.实验结果表明,本文提出的基于最优分配方法的多目标串近似匹配并行算法优于平均分配算法,获得了较好的加速并具有良好的可扩展性. 相似文献

7.

基于多核处理器的关联任务并行感知调度算法

梁秋玲张向利张红梅闫坤《计算机工程》2021,47(7):212-217

关联任务在多核处理器上并行调度所产生的通信时延,会对任务调度长度和处理器利用率造成负面影响,为了改善多核系统对关联任务的处理性能,针对关联任务在多核处理器上的调度特点,提出一种并行感知调度算法。计算各任务与终点间的最长路径值,按照该值的降序来分配任务调度次序,在分配处理器内核时兼顾关联度和任务最早可执行时间,设置最佳匹配评价函数。实验结果表明,与busHEFT和DTSV算法相比,该算法具有更短的任务调度时延、更少的通信量以及更高的处理器利用率。相似文献

8.

异构机群系统上并行计算双序列的最长公共子序列*

许莉莉魏鹰罗海鹏张林才《计算机应用研究》2010,27(5):1669-1671

针对处理机节点具有不同计算速度、不同通信能力的情况,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,提出一种存储受限异构机群系统的序列串最优分配线性规划模型,给出相应的序列串最优分配方法。实验结果表明,基于最优序列串分配方法的双序列最长公共子序列并行算法优于平均分配序列串算法,获得了较好的加速,并具有良好的可扩展性。相似文献

9.

多核并行技术在分子动力学模拟中的应用 总被引：1，自引：0，他引：1

刘青昆滕人达刘凤宫利东张建强《计算机工程与设计》2011,32(10):3395-3398

为了充分利用多核处理器资源,研究了一种用于分子动力学模拟中的多核并行技术。在多核处理器上利用OpenMP技术实现多线程创建与同步、动态设置子线程的调度运行方式以及负载均衡以减少子线程执行等待时间。通过对不同分子体系结构下的动力学模型测试,得出在不同子线程下并行计算的时间,并且得到了良好的性能加速比。实验结果表明,采用OpenMP并行技术可有效地提高电荷求解过程在分子动力学模拟运算中的时间效率,以及多核计算机资源的利用率。相似文献

10.

LUNF--基于节点失效特征的机群作业调度策略 总被引：1，自引：0，他引：1

武林平孟丹梁毅涂碧波王磊《计算机研究与发展》2005,42(6):1000-1005

良好的可扩展性使得人们可通过扩大机群系统的规模来达到所需要的计算能力,但随着机群系统节点数目的增多,节点失效对机群系统性能的影响已经成为大规模机群系统使用过程中一个不可回避的问题．机群作业调度作为机群操作系统软件的重要组成部分,完成高效资源管理与合理作业调度,机群作业调度系统功能上可分为作业选取策略和节点分配策略两部分．结合机群系统节点失效的特征,提出了正常运行时间最长节点优先(longest uptime node first,LUNF)的节点分配策略．仿真结果表明,相对于节点随机分配策略,LUNF策略的作业平均响应时间与作业平均slowdown降低10％左右．相似文献

11.

时钟共享多线程处理器通信机制的设计与实现

《电子技术应用》2016,(3):42-46

多核多线程处理器~([1])是并行技术的一个发展方向,基于多核多线程处理器,提出了一种时钟共享多线程处理器。该处理器有近邻通信和线程间通信两种通信机制,近邻通信采用近邻共享FIFO来传递信息,线程间通信通过线程间共享存储来传递信息,这样可以提高处理器的资源利用率和并行执行能力。相似文献

12.

面向MPSoC系统多特征的模糊动态调度算法

李达侯义斌黄樟钦肖春华《计算机辅助设计与图形学学报》2011,23(8):1447-1454

针对MPSoC系统中的不确定多特征,提出基于模糊集理论的多核系统动态启发式调度算法.利用模糊集描述系统的多种不确定特征,根据模糊隶属度计算确定任务和资源的调度优先级,以提高任务调度的可并发执行能力;综合资源的最早可用时间和利用率,适当选取最接近处理器评估函数均值的处理器,以提高处理器利用率和均衡处理器负载.仿真模拟结果... 相似文献

13.

一种面向流媒体的多核处理器分组调度算法*

贺鹏程王劲林邓浩江张武《计算机应用研究》2010,27(10):3911-3914

针对流媒体分组处理和多核网络处理器cache亲和性的特点,提出了综合流调度和分组调度优点的两级调度算法,即FBLA。FCFS调度算法可以达到分组级的细粒度负载均衡,但cache亲和性却很差。基于hash的调度算法可以保证很好的cache亲和性,但难以保证核间负载均衡。FBLA算法对这两种算法进行了折中,既通过cache亲和性提高处理器利用率,又能够达到细粒度的核间负载均衡。理论分析和仿真评估表明,FBLA算法具有良好的cache亲和性和负载均衡性,转发延迟和延迟波动比FCFS算法更低。在亲和因子较小时,F 相似文献

14.

异构机群系统上双序列全局比对并行算法 总被引：1，自引：1，他引：0

下载免费PDF全文

崔鑫钟诚陆向艳《计算机工程与应用》2009,45(8):58-61

对于处理机节点具有不同的计算速度、通信延迟和存储容量的异构机群系统,考虑通信启动开销,基于可分负载理论,提出一种双序列全局比对问题并行处理的最优分配策略,利用该策略确定出并行迭代次数和分配给各个从处理机的子序列长度。异构PC机群系统上的实验结果表明,提出的双序列全局比对并行算法优于基于平均分配策略的并行比对算法,获得良好的加速和可扩展性。相似文献

15.

机群环境下并行蒙特卡罗方法的研究与应用

王文凡张志鸿申杰《微计算机信息》2007,23(31):270-272

在分布式存储结构的机群系统上，采用可移植消息传递接口MPI与C语言绑定，设计并实现了并行蒙特卡罗算法．有效解决了计算量大、串行算法执行时间长的问题。通过对机群节点间通信时间开销的研究分析．采用主从式编程模型改进并行蒙特卡罗算法，实现了负载平衡，提高了机群处理器的利用率，进一步缩短了执行时间。相似文献

16.

多机群网格的数据负载均衡模型

黄雨田陈庆奎《计算机应用》2008,28(1):52-55

在多个计算机机群构成的网格环境下,为了提高异构资源的利用率,提出了一个数据负载均衡模型。根据查询节点的计算能力、存储能力、通信能力,研究了查询节点的性能模型。利用数据饱和度、数据负载矩阵、数据迁移技术描述了系统的数据负载均衡机制。试验结果表明：该模型适合海量数据的查询。相似文献

17.

多核机群下MPI程序优化技术的研究

王洁衷璐洁曾宇《计算机科学》2011,38(10):281-284

多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间。国内外学者提出了许多多核机群下MPI程序的优化方法和技术。测试了3个不同多核机群的通信性能,并分别在Intel与 AMD多核机群下实验评估了几种具有普遍意义的优化技术:混合MPI/OpcnMP、优化MPI运行时参数以及优化 MPI进程摆放,同时对实验结果和优化性能进行了分析。相似文献

18.

多核机群下MPI程序优化技术的研究

王洁衷璐洁曾宇《计算机科学与探索》2011,38(10)

多核处理器的新特性使多核机群的存储层次更加复杂,同时也给MPI程序带来了新的优化空间.国内外学者提出了许多多核机群下MPI程序的优化方法和技术.测试了3个不同多核机群的通信性能,并分别在Intel与AMD多核机群下实验评估了几种具有普遍意义的优化技术:混合MPI/Op)MP、优化MPI运行时参数以及优化MPI进程摆放,同时对实验结果和优化性能进行了分析. 相似文献

19.

基于多核集群系统的并行编程模型的研究

胡晨骏王晓蔚《微机发展》2008,18(4):70-73

并行计算技术是计算机技术发展的重要方向之一。当前并行程序模型主要有消息传递模型和共享存储模型两种。随着处理器多核技术的发展,在一枚多核处理器中集成两个或多个完整的计算引擎（内核）,并充分利用多核计算机的特性,发挥多核计算机的性能成为一个很重要的研究方向。介绍一种新的MPI实现机制,这种机制集成了共享存储模型和消息通信模型的优点,在节点内使用共享存储模型,在节点间使用消息传递模型,并且通过自动生成线程级的任务来获得更好的性能。．相似文献

20.

基于横向局部性的多核计算模型

袁良张云泉《计算机科学》2012,39(7):1-6

片内多核已成为延长摩尔定律的方式,并行算法设计、编程模型、编译器和运行时系统都需要利用计算模型进行分析。现有多核模型对线程间共享缓存等资源的竞争已有较精确的模型,但是对于线程间数据共享考虑较少。提出线程间共享缓存的横向局部性和任务共享率概念,基于此扩展串行存储层次模型RAM(h),提出考虑任务共享率的多核并行计算模型MRAM(h)。相似文献