首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 703 毫秒

1.  基于推理多线程技术的一种改进模型  
   王成良  吴渝《沈阳工业大学学报》,2007年第29卷第2期
   为了解决多线程处理器不同线程之间并行性低、相互之间数据依赖性高的问题,在推理多线程技术基础上提出了一种新的多线程技术模型(分级多线程Hierarchical Multithreading HMT).该模型采用两种等级处理元的方法,低等级使用指令级并行和细粒度线程级并行;高等级更多地使用间隔并行机制.通过详细的模拟研究,证明分级多线程技术通过对线程的不同粒度采用并行机制能够切实可行地提高线程之间的并行性.    

2.  并行多线程处理机体系结构分析  被引次数:1
   赵庆敏《微电子学与计算机》,2005年第22卷第5期
   并行多线程体系结构处理机由多个逻辑处理机构成,大量的流水线控制部件由所有的逻辑处理机所共享。在每个周期,处理机从多个线程取出多条指令调度执行。另外一个特点,它同时支持指令级和线程级的并行操作。本文分析了PMA工作原理。并给出一个处理机模型。    

3.  一种基于IA-64的并行架构的研究  
   邓晴莺  张民选  蒋江《计算机工程与科学》,2008年第30卷第7期
   同时多线程(SMT)能在同一时钟周期执行不同线程的指令,同时开发了指令级并行(ILP)和线程级并行(TLP)。显式并行指令计算(EPIC)关注于编译器和硬件的相互协作。在本文中,我们设计和实现了一套并行环境,其中包括并行编译器OpenUH和基于IA-64的同时多线程体系结构EDSMT,并通过NAS并行测试程序作出了性能评测。    

4.  IA-64的并行架构及其寄存器文件  
   邓晴莺  张民选  蒋江《计算机工程》,2008年第34卷第12期
   同时多线程能在同一时钟周期执行不同线程的指令,并且指令级并行和线程级并行。显式并行指令计算关注于编译器和硬件的相互协作。寄存器文件的设计在高性能处理器设计中十分重要,寄存器栈和寄存器栈引擎是提高其性能的重要手段。该文设计和实现一套并行环境,其中包括并行编译器OpenUH和基于IA-64的同时多线程体系结构EDSMT,实验表明,该并行架构适用于大多数并行应用,针对NAS的并行测试程序,该架构相对于SMTSIM平均有12.48%的性能提升。    

5.  多核并行技术在分子动力学模拟中的应用  被引次数:1
   刘青昆  滕人达  刘凤  宫利东  张建强《计算机工程与设计》,2011年第32卷第10期
   为了充分利用多核处理器资源,研究了一种用于分子动力学模拟中的多核并行技术。在多核处理器上利用OpenMP技术实现多线程创建与同步、动态设置子线程的调度运行方式以及负载均衡以减少子线程执行等待时间。通过对不同分子体系结构下的动力学模型测试,得出在不同子线程下并行计算的时间,并且得到了良好的性能加速比。实验结果表明,采用OpenMP并行技术可有效地提高电荷求解过程在分子动力学模拟运算中的时间效率,以及多核计算机资源的利用率。    

6.  多线程体系结构的几个核心问题  被引次数:1
   徐明 李磊《计算机工程与科学》,1999年第21卷第4期
   多线程计算机是控制流计计算机发展的融合,它是一种多指令流多数据流(MIMD)计算机,其特征首先表现在体系结构上。本文分析了多线程体系结构若干核心问题,并对多线程计算机的性能评价方法展开了初步的探讨。    

7.  简单高性能微处理器的设计  被引次数:2
   朱怡健  吴强  杨全胜《电气电子教学学报》,2004年第26卷第2期
   提高指令级并行度是处理器体系结构发展的重要方向,也是当前计算机组织、计算机结构课程的重要内容之一。为使学生对指令流水线、超标量等技术有更深入的理解和体会,本文介绍了一个简单的具有超标量流水线结构的微处理器模型的设计思想。针对在指令并行执行过程中出现的数据相关冲突,提出了指令相关性检查算法和数据相关性检查算法。论述了如何利用VHDL语言的特点,准确描述硬件的并行性及系统模块的划分,给出了模拟及仿真验证的例子。    

8.  IXP1200网络处理器多层次并行机制研究  被引次数:1
   刘钰 赵荣彩 张铮 芦阳《微机发展》,2004年第14卷第6期
   主要对千兆通讯的网络处理芯片IXP1200网络处理器进行研究和分析,着重探讨和研究其先进的多级并行设计机制。主要从体系结构和并行设计技术两个角度对IXP1200网络处理器的数控分层和多层次并行等设计机制进行了介绍。突出了其利用多线程、多处理器的先进设计结构来优化设计、提高处理速度的设计理念和实现过程,并在最后进一步详细讨论了如何利用特定微码指令来实现IXP1200网络处理器的指令并行和多线程并行的程序调度方法和设计技术。    

9.  IXP1200网络处理器多层次并行机制研究  
   刘钰  赵荣彩  张铮  芦阳《计算机技术与发展》,2004年第14卷第6期
   主要对千兆通讯的网络处理芯片IXP1200网络处理器进行研究和分析,着重探讨和研究其先进的多级并行设计机制.主要从体系结构和并行设计技术两个角度对IXP1200网络处理器的数控分层和多层次并行等设计机制进行了介绍.突出了其利用多线程、多处理器的先进设计结构来优化设计、提高处理速度的设计理念和实现过程,并在最后进一步详细讨论了如何利用特定微码指令来实现IXP1200网络处理器的指令并行和多线程并行的程序调度方法和设计技术.    

10.  SMA:前瞻性多线程体系结构  被引次数:4
   肖刚  周兴铭  徐明  邓鹍《计算机学报》,1999年第22卷第6期
   提出了一种新的ILP处理器体系结构-前瞻性多线程体系的结构,简称SMA.它结合了前瞻性执行机制和多线程执行机制,以整个线程为长步进行前瞻性执行,多个线程并行执行并且共享处理器硬件资源,这样,处理器既通过组合每个线程的指令窗口形成一个大的动态指令窗口,开发出程序中更大的ILP,又利用多线程执行机制屏蔽各种长延迟操作,达到较高的资源利用率;介绍了SMA执行模型,并讨论了SMA处理器的实现和其中的关键技    

11.  EDSMT微体系结构研究  被引次数:1
   蒋江  邢座程  张民选《计算机工程与科学》,2005年第27卷第4期
   本文提出了一种多线程微处理器微体系结构EDSMT。EDSMT有效结合显示并行指令计算 EPIC和动态同时多线程DSMT技术,通过软、硬件协同的方式充分开发和有效支持多个层次的并行性。EDSMT能够降低硬件设计的复杂性,提高微处理器性能。    

12.  基于计算机技术的并行测试实现方法研究  
   程嗣怡  吴华  肖明清《计算机测量与控制》,2007年第15卷第8期
   并行测试已成为未来自动测试领域的发展趋势,而计算机技术的飞速发展为并行测试提供了许多思想和实现方法;在给出理想的并行测试结构框架后,文中着重从计算机技术应用的角度论述了并行测试的方法;多处理器和单处理器并行测试结构成为并行测试的两种主要体系,这其中又具体为分布式并行测试结构,协处理器结构,以及多进程、多线程结构等;这些结构体系各有特点,在搭建并行测试系统时应适情况选取,以便更大程度地提高测试速度、效率,节约测试资源.    

13.  一种基于OpenMP的DSWP自动并行算法  
   《信息工程大学学报》,2015年第16卷第2期
   多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序。自动并行化技术是将单线程程序移植到多核上的重要手段,但是当循环中存在无法确定的数据依赖或复杂的控制流时,传统的自动并行化技术无法取得良好效果。decoupled software pipelining(DSWP)算法针对传统自动并行失败的循环实现了指令级的细粒度并行,但是需要对处理器体系结构和指令集的深入了解,对其并行性能和应用广泛性带来限制。通过对DSWP算法进行改进,提出了基于OpenMP的DSWP自动并行算法。该算法增大了并行粒度,使用OpenMP并行应用编程接口实现并行,不再依赖具体的体系结构,实现了DSWP算法的应用扩展。通过对基准测试集NPB3.3.1的测试表明,传统自动并行失败的循环,经文章算法并行后在双核处理器上平均加速比达到1.23以上;使用添加了文章算法的Open64编译器生成的并行程序,与仅使用传统自动并行方法的Intel编译器和Open64编译器所得程序相比,平均加速比分别高出22%和26%。    

14.  关于并行程序设计方法的分析与研究  被引次数:1
   王文义  赵建建  王若雨《郑州大学学报(工学版)》,2009年第30卷第2期
   并行程序设计与并行计算机的体系结构密切相关,因此其复杂性要远远大于串行程序设计.介绍了数据分解和循环体依赖等概念,提出了一个cache利用率和并行计算机有效速度的近似关系模型.通过该模型和一个实例,阐述了在并行程序设计中降低和拆解计算目标中数据依赖的方法过程,从而达到尽可能多地发掘指令级并行性,提高cache利用率即提高并行系统有效速度的目的.    

15.  龙芯2号处理器的同时多线程设计  被引次数:1
   李祖松  许先超  胡伟武  唐志敏《计算机学报》,2009年第32卷第11期
   提出了适合龙芯2号处理器的同时多线程处理器模型,并介绍了具体的微体系结构设计以及相应的Linux操作系统的实现方案.通过在设计的龙芯2号同时多线程处理器上启动Linux操作系统,并运行应用程序,例如SPEC CPU2000,进行性能评测.结果表明,龙芯2号同时多线程处理器通过挖掘线程级并行性,将龙芯2号处理器的性能提高了31.1%.    

16.  Win32平台基于通信的多核并行编程方法  
   李 青 徐璐娜《计算机应用与软件》,2014年第4期
   随着计算机硬件的发展,多核并行计算在计算机软件及应用领域的出现率也越来越频繁。目前的多核编程模型采用线程级并行模型,现有的多线程并行编程模型主要有线程库、指令模型和任务式模型三种。提出一种与MPI并行编程模型相似的基于通信的方法在Win32平台上来实现并行编程,在此基础上实现MTI并行编程模型。通过若干典型的测试给出使用MTI进行并行编程的执行结果,结果表明MTI是有效、易用的。    

17.  基于CUDA的高速并行小波算法及其在电力系统谐波分析中的应用  被引次数:3
   韩志伟  刘志刚  鲁晓帆  周登登《电力自动化设备》,2010年第30卷第1期
   针对小波分解计算速度慢、实际工程应用少的问题,采用图形处理器(GPU)作为计算平台,提出一种基于计算统一设备架构(CUDA)的细粒度高速并行小波分解算法。通过分析小波Mallat算法的并行性,并考虑GPU单个处理单元计算能力相对较弱的特点及CUDA的多层式存储器结构、多层式线程组织结构和单指令流多线程流(SIMT)体系结构,采用数据分组及轻量级线程任务分解的方式,提出了适合CUDA程序设计模型的高速并行小波分解算法,并将其用于电力系统谐波分析。实验证明,该算法相对于CPU串行小波分解和Matlab engine小波分解的计算耗时,最高可分别达到26倍和65倍的速度提升,且算法具有线性加速能力。    

18.  面向DSWP并行的OpenMP任务调度机制的扩展与实现  
   刘晓娴  赵荣彩  丁锐《计算机科学》,2013年第40卷第9期
   多核处理器能够提升多线程程序的性能,但早已存在的诸多单线程程序无法从中获益,程序员也习惯于编写单线程程序.自动并行化技术是将单线程程序移植到多核上的重要手段,但是当循环中存在无法确定的数据依赖或复杂的控制流时,传统的自动并行化技术无法取得良好效果.Ottoni等人针对传统自动并行失败的循环提出了Decoupled Software Pipelining(DSWP)算法用以实现指令级的细粒度并行,但其需要对处理器体系结构的深入了解以及对核间通信队列和专用指令的硬件支持,并行性能和应用广泛性受到限制.基于OpenMP应用编程接口实现的DSWP并行不依赖于硬件上对核间通信队列和专用指令的支持,且不受平台的限制,但现有的OpenMP任务调度机制无法满足DSWP并行中对任务调度的需求.对现有的OpenMP任务调度机制进行扩展,增加了任务与线程绑定的属性,保证了基于OpenMP的DSWP并行程序的正确执行.在GCC的OpenMP运行库libgomp中扩展了任务绑定属性子句的功能,扩展后的GCC作为OpenMP DSWP程序的基础编译器,为自动并行提供支持.通过对基准测试集NPB3.3.1的测试表明,传统自动并行失败的循环,经OpenMP DSWP自动并行后在双核处理器上平均加速比达到1.23以上;使用添加了OpenMP DSWP算法的Open64编译器生成的并行程序,与仅使用传统自动并行方法的Intel 编译器和Open64编译器所得程序相比,平均加速比分别高出22%和26%.    

19.  动态可重构指令计算机  被引次数:1
   顾士平  华晓勤  王惠斌《计算机时代》,2008年第3期
   动态可重构指令处理器没有固定的指令集,利用动态可重构集成电路可根据程序需求生成不同的指令,指令是"进程级指令";利用"面积换速度",多道并行流水线使计算机处理器的速度大大提高,同时大大降低了处理器的功耗;硬件可重用,提高了硬件的资源利用率。动态可重构指令计算机是未来计算机体系结构的发展方向。    

20.  新一代并行多线程处理机体系结构  
   李亚民《小型微型计算机系统》,1997年第12期
   随着微电子技术的发展,单个芯片可以集成越来越多的晶体管。目前的预测是,在未来的十五年,十亿晶体管可以做在一个芯片上。如何充分利用这巨大的资源,计算机体系结构设计者纷纷提出了许多建议。本文在探讨处理机体系结构发展过程的基础上,提出了一种新的"并行多线程体系结构—PMA"。PMA的主要想法是把多个逻辑处理机集成在同一芯片上,而且多个执行部件由这些逻辑处理机所共享。在每个周期,处理机从多个线程取出多条指令调度执行。与简单的单片多处理机相比,它提高了执行部件的利用效率。另一个特点便是PAM同时支持指令级和线程级的并行操作。在描述了PMA的基本原理之后,本文给出了一种可能的PMA硬件实现方案,并且讨论了对软件支持PMA所提出的新的要求。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号