期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

OpenMP的多核并行程序设计 总被引：3，自引：0，他引：3

黄猛《电脑编程技巧与维护》2009,(17):35-38

介绍一种多核并行编程标准OpenMP,对循环并行化的指令和使用方法进行详细解释,并给出实例证明使用OpenMP对多核环境下程序效率的提高。相似文献

2.

伊君翰《计算机工程》2009,35(8):62-64

为解决传统编程模型与并行架构间存在的矛盾,针对多媒体和网络应用程序的特点,提出一种基于多核处理器的并行编程模型,该模型采用节点化的并行程序描述方式,将并行编译器划分到多个核上运行。实验结果表明,这种新的并行编程模型能有效提高程序的执行效率。相似文献

3.

多核多线程环境下的程序并行优化方法

蔡进国郭宏李伟强江若成《现代计算机》2014,(3):3-5,14

受到功耗和温度的限制,传统的单核处理器性能难以提升,多核计算成为新的处理器模式。然而现有的多线程程序设计是以单核处理器为基础发展而来,无法高效利用多个处理核心来提升性能。以OpenMP为基础,对程序进行多线程优化,以实现多核处理器上多线程的并行,并通过经典的N皇后问题案例进行验证。相似文献

4.

多核并行编程技术在中文分词程序优化中的应用

董丽丽刘明生袁香菊《计算机工程与设计》2010,31(24)

为了充分利用多核处理器的硬件资源和计算能力,提出了多核并行编程技术在中文分词程序中的优化方案.根据中文分词最大正向匹配算法的特点,由传统的串行程序,改为并行程序.利用多核并行编程模式的思想,设计了一个混合并行编程模式,通过Intel的性能分析工具,找出了该算法的热点和瓶颈,对其进行优化.实验结果表明,优化过后的执行时间较原来串行程序的执行时间缩短了50%～60%,同时提高了程序的加速性能,取得了良好的效果. 相似文献

5.

基于通用多核处理器平台的并行基因表达式编程算法

吴江唐常杰李太勇姜玥李自力刘洋洋《计算机科学》2011,38(11):296-302

基因表达式编程(Gene Expression Programming, GEP)是一种计算量大且通用性强的新型进化算法,其传统计算形式不能充分利用目前主流的多核处理器。为提高算法效率,提出了基于通用多核处理器平台的并行基因表达式编程算法(Parallel Gene Expression Programming Based on General Multi-core Processor, PGEP-MP)。主要工作包括:O)分析通用多核处理器平台下并行基因表达式编程算法的机理;(2)利用MPI和()pcnMP混合编程模型设计基于通用多核处理器平台的基因表达式编程算法的粗粒度与细粒度相结合的并行模型;(3)提出改进PEEP-MP算法效率的进化策略;(4)通过对函数挖掘和分类的实验证明,PEEP-Ml〕算法提高了函数挖掘和分类的效率,在并行双核处理器数为4的情况下,PEEP-MP的平均并行加速比分别是传统GEP算法的4. 22倍和 4. 06倍。相似文献

6.

基于多核处理器的三维场景并行化探讨

吴玮欣陆达《计算机与现代化》2010,(3):15-18

提高三维场景的运行速度一直以来都是程序开发人员需要面临的一大难题,随着面向主流应用的多核处理器的出现与普及,利用处理器提供的多个内核而不通过编写多线程的方法来提高程序的并行性成为了一种可能。本文介绍虚拟现实开发工具OpenGL和共享存储系统并行编程接口OpenMP;分析OpenGL绘制三维场景的一般过程;并以纹理映射为例着重探讨在OpenGL程序中使用OpenMP来提高程序并行性的方法。相似文献

7.

基于CMP多核集群的混合并行编程技术研究

王文义王春霞王杰《计算机科学》2014,41(2):19-22

高性能科学计算(High Performance Science Computing,简称HPC)是验证某些理论和测试计算机系统处理能力的一种有效的实验手段。鉴于目前CMP(Chip Multi-processor)多核集群已变得越来越普及,尝试对由MPI和OpenMP两种不同并行编程技术构成的混合编程模式做一些实验性的研究。通过对程序执行时间和加速比的实验数据分析,可以看出在多核和多节点集群上采用细粒度的混合并行编程方法较单一使用MPI并行编程方法更加合理和高效,也更能体现出系统硬软件的特性与优势。相似文献

8.

基于FPGA的嵌入式多核处理器及SUSAN算法并行化 总被引：1，自引：0，他引：1

王洁张淑燕刘涛季振洲胡铭曾《计算机学报》2008,31(11)

给出了四核心嵌入式并行处理器FPEP的结构设计并建立了FPGA验证平台.为了对多核处理器平台性能进行评测,提出了基于OpenMP的3种可行的图像处理领域的经典算法SUSAN算法的并行化方法:直接并行化SUSAN、图像分块处理和多图像并行处理,并对这3种并行算法在Intel四核心平台和FPEP的FPGA验证平台上进行性能测试.实验表明,3种并行算法在两种四核心平台下均可获得接近3.0的加速比,多图像并行处理在FPEP的FPGA验证平台可以获得接近4.0的加速比. 相似文献

9.

面向多核处理器平台的并行Hash JOIN算法设计与实现

陈虎欧彦麟陈海波《计算机研究与发展》2010,47(Z1)

利用多核处理器提供的强大计算能力提升数据库系统性能是当前国内外数据库研究的重要问题.利用基于多核处理器上的并行编程模型MSI和Intel处理器上的SIMD(单指令流多数据流)指令有效地加速了数据库查询的Join操作,与串行实现相比其最大加速可以达13倍.同时,还对比不同数据分块大小情况下对算法的影响,找到了优化的数据分块方法. 相似文献

10.

关联规则挖掘算法的多核并行优化

吴华平郑晓薇张建强《微型机与应用》2011,30(1):4-6,9

分析了并行关联规则挖掘算法存在的不足,提出了一种改进的关联规则挖掘的多核并行优化算法。该算法对Apriori算法的压缩矩阵进行了改造,并在多核平台下利用OpenMP技术和TBB技术对串行程序进行循环并行化和任务分配的并行化设计,最大限度地实现并行关联规则挖掘。相似文献

11.

申威众核处理器访存与通信融合编译优化

方燕飞李雁冰董恩铭王云飞刘齐《软件学报》2024,35(6)

申威众核片上多级存储层次是缓解众核“访存墙”的重要结构.完全由软件管理的SPM结构和片上RMA通信机制给应用性能提升带来很多机会,但也给应用程序开发优化与移植提出了很大挑战.为充分挖掘片上存储层次特点提升应用程序性能,同时减轻用户编程优化负担,本文提出了一种多级存储层次访存与通信融合的编译优化方法.该方法首先设计了融合编译指示,将程序高层信息传递给编译器.其次构建了编译优化收益模型并设计了启发式循环优化方案迭代求解框架,并由编译器完成循环优化方案的求解和优化代码的变换.通过编译生成的DMA和RMA批量数据传输操作,将较低存储层次空间中高访问延迟的核心数据批量缓冲进低访问延迟的更高存储层次空间中.在三个典型测试用例上进行了优化实验测试与分析,结果表明本文所提出的优化在性能上与手工优化相当,较未优化版程序性能有显著提升. 相似文献

12.

Windows环境下CRNG多核并行算法的设计实现

沈春来洪龙胡俊《微机发展》2012,(3):77-80

多核技术的出现给人们带来了一种大幅提升计算机运行速度的方法,大量的并行算法也被设计并应用到各个场合中。文中目的在于设计一种新的用于组合随机数发生器CRNG（Combined Random Number Generator）的并行算法,以提高传统算法的运算速率。文中采用并行编程方法中的任务级的并行模式,对传统组合随机数发生器的运算过程进行任务分解,将其分配到四个执行核上并行执行,以产生最终的随机数序列。最后在Windows环境下,使用常用的并行编程工具-OpenMP对新算法进行了编程验证,结果证实该算法可充分利用现有计算机所能提供的多核计算资源,其加速比高于3。相似文献

13.

主从式单边异构多核处理器编程模型和编译架构

下载免费PDF全文

李春江杨学军《计算机工程与科学》2009,31(8)

主从式单边异构体系结构的异构多核处理器广泛应用于面向专门应用领域的计算加速,如异构多核嵌入式处理器、DSP、SoC等;高性能的该类处理器也可用于一些大规模科学和工程计算问题的处理。主从式单边异构处理器对编程模型和编译技术提出了很多挑战性问题,如编程模型的选择、编程语言的设计、编译器架构设计以及运行库的设计等。本文分析了这一类处理器结构特点和执行模型,认为功能卸载模型是最适用于这一体系结构的编程模型;并分析了面向功能卸载模型的编程语言设计关键问题,提出了编译系统的架构,讨论了相应的运行库设计问题。相似文献

14.

非线性扩散方程的显式并行计算

下载免费PDF全文

迟利华刘杰《计算机工程》2010,36(21):25-27

在分布共享的多核集群系统中,提出一种求解非线性扩散方程的显式数据分布OpenMP并行计算方法。将数据进行分布式划分后分配到每个OpenMP线程,通过数据拷贝实现同步计算,并设计全局归约算法减少障碍同步次数。性能分析和测试结果表明,该方法在 4核Xeon处理器构成的分布共享集群系统上可扩展到1 024个CPU核,相对于64个CPU核,其加速比为7.06。相似文献

15.

面向高性能数值计算的并行计算模型DRAM(h) 总被引：11，自引：0，他引：11

张云泉《计算机学报》2003,26(12):1660-1670

提出了一个基于存储层次的新并行计算模型DRAM(h)，并在该模型下对两个经典并行数值计算算法的不同实现形式：四种形式并行下三角方程求解(PTRS)和六种形式无列选主元并行LU分解(PLU)，进行了分析．模型分析表明，具有近乎相同时间和空间复杂性的同一算法不同实现形式，在该模型下会有完全不同的存储复杂度．作者在日立公司SR2201MPP并行机、曙光3000超级服务器和中国科学院科学与工程计算国家重点实验室(LSEC)的128节点Linux Cluster等三种并行计算平台上对模型分析结果进行了实验验证．结果表明，该模型分析在绝大多数情况下都能较好地与不同实验平台上的实验结果吻合．个别出现偏差的分析结果，在根据计算平台的存储层次特点修改模型分析的假定后，也能够进行解释．这说明了该模型对不同形式的算法实现进行存储访问模式区分的有效性．对在计算模型中加入指令／线程级并行的可行性和方法的研究是下一步的工作．相似文献

16.

针对特普利茨线性系统的多级并行算法

下载免费PDF全文

张哲《计算机工程》2011,37(1):36-38

利用并行体系结构中不同层次级别的内存和计算单元,提出一种求解对称结构化特普利茨线性系统的多级并行算法。通过数学推导将特普利茨线性系统转换成柯西式线性系统,利用消息传递接口和开放多平台共享内存并行程序设计工具实现该算法,并通过实验验证其可行性。相似文献

17.

基于高性能并行计算的武器装备混合调度控制方法研究

下载免费PDF全文

庞阿源刘亚洲《计算机测量与控制》2019,27(7):93-96

传统的武器装备混合调度控制方法抗干扰能力差,控制的武器装备数量很少。为了解决上述问题,基于高性能并行计算研究了一种新的武器装备混合调度控制方法,通过高性能并行计算求出混合调度周期,与基本调度周期进行对比,判断武器装备是否适合混合调度,设置实时调度集和优先调度集,确定实时调度命令,根据得到的调度命令,多次传递武器信息,实现调度工作。通过研究的调度方法在武器装备上标记电子标签,引入计算机技术提取控制指令,在多次审核武器装备信息后,完成武器装备的控制工作。为验证研究的调度控制方法操作效果,与传统调度控制方法进行对比实验,结果表明,基于高性能并行计算的武器装备混合调度控制方法具有很强的抗干扰能力,控制的武器装备数量也远远大于传统控制方法,对于现代武器装备管理有着积极的促进意义。相似文献

18.

面向层次化NoC的混合并行编程模型 总被引：1，自引：0，他引：1

下载免费PDF全文

曹祥易伟潘红兵高明伦李丽《计算机工程》2010,36(13):278-280

为更好发挥多核处理器的硬件性能,针对层次化的片上网络架构,提出MPI/OpenMP混合并行编程模型。运用基于MPI的任务级并行模型实现片内簇间的高效通信,采用OpenMP模型实现簇内四核的通信、同步和数据交换。实验结果表明,与单一并行编程模型相比,混合并行编程模型加速比提高了20%~50%。相似文献

19.

The Effect of Process Topology and Load Balancing on Parallel Programming Models for SMP Clusters and Iterative Algorithms

Nikolaos Drosinos Nectarios Koziris 《The Journal of supercomputing》2006,35(1):65-91

This article focuses on the effect of both process topology and load balancing on various programming models for SMP clusters and iterative algorithms. More specifically, we consider nested loop algorithms with constant flow dependencies, that can be parallelized on SMP clusters with the aid of the tiling transformation. We investigate three parallel programming models, namely a popular message passing monolithic parallel implementation, as well as two hybrid ones, that employ both message passing and multi-threading. We conclude that the selection of an appropriate mapping topology for the mesh of processes has a significant effect on the overall performance, and provide an algorithm for the specification of such an efficient topology according to the iteration space and data dependencies of the algorithm. We also propose static load balancing techniques for the computation distribution between threads, that diminish the disadvantage of the master thread assuming all inter-process communication due to limitations often imposed by the message passing library. Both improvements are implemented as compile-time optimizations and are further experimentally evaluated. An overall comparison of the above parallel programming styles on SMP clusters based on micro-kernel experimental evaluation is further provided, as well. 相似文献

20.

遥感影像的高性能并行处理技术研究

赵颖辉 ;蒋从锋《计算机技术与发展》2014,(7):201-205

随着空间遥感技术和对地观测技术的不断发展,光学、热红外和微波等不同技术手段可以获取同一地区的多种遥感影像数据（多时相、多光谱、多传感器、多平台和多分辨率等）,每天获取的遥感数据量越来越大。同时,大量的遥感应用需要快速地对这些遥感数据进行处理与分析,提供辅助决策信息。因此,如果不能及时进行数据处理,这些数据就会失去时效性,甚至失去数据本身的价值。高性能计算与并行处理技术,加速了遥感影像数据处理与信息提取的进度,如大规模多处理系统、网格与云计算技术、通用图形处理器（GPGPU）等。文中综述了高性能计算、并行处理及云计算技术应用于遥感领域的最新进展,给出了一些研究与应用范例,并提出了当前高性能遥感影像处理所面临的一些挑战。相似文献