期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王晶樊晓桠张盛兵王海《计算机科学》2007,34(9):256-258

片上多核多线程（CMT）结构兼具了片上多处理（CMP）和同时多线程（sMT）结构的优势，支持片上所有处于执行状态的线程每周期并行执行，导致核内与核间硬件资源共享和争用问题。该文在阐述CMT结构的资源共享特征并简要介绍SMT线程调度发展状况的基础上，主要围绕以减少资源争用为目标的线程调度策略和资源划分机制等热点，分析其研究现状，论述已有策略在处理这些问题上的优缺点，并探讨了可能的研究发展方向。相似文献

2.

同时多线程技术 总被引：2，自引：0，他引：2

刘权胜杨洪斌吴悦《计算机工程与设计》2008,29(4):963-967

同时多线程技术结合了超标量处理器与多线程处理器两者的优点,通过增加很少的硬件资源,把一个物理核映射为多个逻辑核,成为一种研制高性能处理器的重要途径.重点介绍了同时多线程处理器出现的原因、优点、基本组成结构、当前的研究成果及影响,并探讨了当前同时多线程技术的发展趋势. 相似文献

3.

基于线程级的同时多线程处理器功耗评估

下载免费PDF全文

张朝中何立强徐晓东《计算机工程》2010,36(14):259-261

针对同时多线程处理器中每个线程的功耗评估问题,提出一种同时多线程基于线程级的功耗评估方法。该方法可使系统在运行过程中统计出各线程对各部件的详细功耗情况,方便地衡量在多线程运行时各线程所产生的功耗。为同时多线程处理器进行基于功耗已知的线程调度和取指策略研究提供了基础条件。实验结果表明,各线程的功耗之和与总功耗相等。相似文献

4.

多核同时多线程处理器的线程调度器设计

《电子技术应用》2016,(1):19-21

多核同时多线程处理器(SMT_PAAG)是用于图形、图像及数字信号处理的一种多核处理器。基于这种处理器提出了一种硬件线程调度器,该调度器采用同时多线程技术,最多可同时执行四个线程,支持八个线程阻塞模式下的快速上下文切换。这样避免了因阻塞带来的等待问题,能够有效提高处理器的工作效率和资源利用率。通过在处理器上运行图形处理算法进行性能评测。结果表明,SMT-PAAG处理器通过挖掘指令级并行和线程级并行,将处理器的性能提高了69.25%。相似文献

5.

冗余多线程结构的重命名寄存器配对共享分配策略

印杰江建慧《计算机研究与发展》2011,48(3):516-527

同时多线程处理器允许多个线程同时执行,一方面提高了处理器的性能,另一方面也为通过线程冗余执行来容错提供了支持.冗余多线程结构将线程复制成两份,二者独立执行,并比较结果,从而实现检错或者容错.冗余多线程结构主要采用ICOUNT调度策略来解决线程间资源共享问题.然而这种策略有可能造成"饥饿"现象,并降低处理器吞吐率.提出一... 相似文献

6.

基于负载瞬时IPC性能的同时多线程处理器取指策略

何立强刘志勇《计算机学报》2007,30(4):629-637

同时多线程处理器在每时钟周期从多个线程读取指令执行,极大地提高了指令吞吐率.文中简单介绍了SMT技术,讨论了常用的取指策略,比较了各策略在提高性能方面的优劣.给出特定负载下理论上的最优取指策略,在此基础上提出一种基于负载瞬时IPC性能的动态取指策略IPCBFP.实验表明,该策略可以有效地提高负载的性能,平均加速比对于两线程负载可以达到17%,对于四线程负载可以达到8%.该策略还具有平均占用指令队列项少,指令队列冲突率低的特点,而且,对降低SMT的Cache失效率和TLB失效率方面也有一定的作用. 相似文献

7.

同时多线程微处理器结构的性能功耗研究 总被引：1，自引：0，他引：1

郭松柳汪东升汤志忠《计算机工程与应用》2008,44(28):4-8

为同时多线程微处理器结构建立的准确的功耗评估模型,将可给出该结构中各部件的功耗使用情况,进而可通过调整部件电压或优化部件结构的方法,达到减少整体功耗的目的;同时,此功耗评估模型也可以作为高层功耗优化研究的测试平台,为系统级、软件级功耗优化研究提供支持。相似文献

8.

基于EPIC的同时多线程处理器取指策略

下载免费PDF全文

贾小敏孙彩霞张民选《计算机工程》2007,33(4):256-258

EPIC硬件简单，同时多线程易于开发线程级并行，在EPIC上实现同时多线程可以结合二者的优点。取指策略对同时多线程处理器的性能有重要影响。该文介绍了几种有代表性的超标量同时多线程处理器取指策略，分析了这些策略在EPIC同时多线程处理器上的适用性，提出了一种新的适用于EPIC的取指策略SICOUNT。分析表明SICOUNT策略可以充分利用EPIC软硬件协同的优势，在选择取指线程时使用编译器所提供的停顿信息，能更精确地估计各个线程的流动速度，使取出指令的质量更高。相似文献

9.

MOSI:一种基于超长指令字处理器的同时多线程微体系结构

万江华陈书明《计算机学报》2006,29(3):378-383

描述了一种基于超长指令字处理器的同时多线程微体系结构——MOSI（MultiOp Splitting Issue,多操作①分离发射）．MOSI动态地发射同一多操作内的指令．并通过写回缓冲保证计算结果的写回顺序与编译器的视图一致,从而以较小的代价解决了SMT技术中的关键问题．文中详细描述了写回缓冲的结构及算法,给出了多个线程的硬件模型,最后对硬件支持线程的个数及Cache的组织结构进行了讨论．实验结果表明,基于MOSI结构的双线程处理器能够将吞吐率提高40％．相似文献

10.

面向SMT体系结构的片上资源分配策略研究

张骏樊晓桠刘松鹤《计算机科学》2008,35(6):135-138

SMT处理器通过同时执行来自多个线程中的指令来提高性能,所有线程通过竞争共享的方式来最大化片上资源的利用率.然而,SMT处理器的集中控制结构所固有的线延迟约束和多个线程对片上资源持有的不均衡性使得设计者不得不考虑在线程间进行资源分配,来减少通信延迟和可能出现的线程饥饿.本文介绍了针对SMT体系结构片上资源分配的基本原理、研究内容;分析了片上资源分配对SMT体系结构造成的影响;从显式和隐式两个角度讨论了SMT体系结构片上资源分配策略的运行机制和设计方法;举例分析了POWER5处理器的动态资源平衡策略;最后,展望了SMT处理器片上资源分配的未来发展趋势. 相似文献

11.

空间信息网格的多级资源管理结构模型 总被引：1，自引：0，他引：1

喻丹丹何炎祥涂国庆刘茂福《计算机工程》2005,31(21):40-42

在分析和比较各种资源管理模型的基础上,分析了空间信息资源的特点,提出了一种较为有效的SIG资源管理模型——基于市场的多级资源管理模型。描述了该资源管理模型的体系结构,讨论了如何有效地维护空间信息网格资源的异构性及可扩展性,同时保证资源利用的最大效益。相似文献

12.

SMT产前数据快速准备软件设计与开发

刘斌峰姜建国张坤李薇《微计算机信息》2009,25(21)

针对目前SMT产前数据准备工作操作步骤过多、人工参与频繁、准备效率不高的情况,本文设计、实现了从EDA设计文件直接提取信息进行自动快速准备的方法.针对Protel、PowerPCB、Melltor Graphic、OrCAD和VeriBest五种异构的EDA设计文件进行统一转换,提取相关参数,生成坐标文件;以坐标文件中封装与型号相同为务件自动生成位号行;参照客户提供的BOM文件对器件进行组命名;最终生成帖装机CAD文件.实际应用表明,产前数据准备效率提高60%以上. 相似文献

13.

同时多线程处理器共享资源的特性分析

下载免费PDF全文

黄彩霞《计算机工程与科学》2009,31(8)

同时多线程处理器中同时执行的线程共享处理器中的资源,而这些有限的共享资源在线程之间的分配状况将决定每个线程执行的性能和处理器的总体性能。如何根据不同类别共享资源的特性对它们进行合理有效分配成为同时多线程处理器研究的重要课题之一。本文对同时多线程处理器中各类共享资源的特性进行深入研究与分析,分析结果表明,队列类共享资源的分配方式对每个线程执行的性能和SMT处理器的总体性能具有至关重要的影响。因此,同时多线程处理器中共享资源分配的关键在于控制队列类共享资源的分配。相似文献

14.

一种提高同时多线程VLIW处理器中取指单元吞吐率的方法

下载免费PDF全文

万江华陈书明《计算机工程与科学》2007,29(6):97-101

在同时多线程处理器中,提高取指单元的吞吐率意味着各线程之间的Cache竞争更加激烈,而这种竞争又制约着取指单元吞吐率的提高。本文针对当前超长指令字体系结构的新特点,提出了一种同时提高取指单元和处理器吞吐率的方法。该方法通过尽可能早地作废取指流水线中的无效地址,减少了由无效取指导致的程序Cache冲突,也提高了整个处理器的性能。实验结果表明,该方法使处理器和取指单元的吞吐率均相对提高了12%～23%,而一级程序Cache的失效率则略微增加甚至降低。另外,它还能够减少10%～25%的一级程
程序Cache读访问,从而降低了处理器的功耗。相似文献

15.

开放系统中实时中间件关键技术研究

彭舰俞岭董鹏刘锦德《计算机科学》2003,30(10):78-80

The Real-Time Middleware is the best way to deal with open and real-time in the same time in open system. In this paper, the characteristic of open system, the policy of real-time implement in open system and the real-time CORBA specification and development are introduced, then the key technology of real-time CORBA in open system is discussed in detail according to the model of real-time CORBA including the technology of the real-time POA, real-time ORB, thread pool, pluggable network protocol, multiplexing and demultiplexing and presentation layer optimizations etc, which provides a viable method and research for open system real-time extension. 相似文献

16.

资源受限的项目调度问题的求解算法 总被引：1，自引：0，他引：1

刘敏代成琴王宇航《自动化技术与应用》2008,27(6):15-18

本文建立了不确定资源环境下的资源受限的项目调度模型,用不确定规划的方法将不确定问题转化为等价的确定性问题,并给出了一个解决该问题的二阶段算法及实例。相似文献

17.

中国水利信息网关键技术研究

蔡阳周维续《计算机工程与应用》1999,35(11):56-58

该文对网络的体系结构、组网技术、应用模式及网络安全等关键技术进行了分析和研究,并介绍了这些技术在中国水利信息网中的应用。相似文献

18.

Solving the feeder assignment,component sequencing,and nozzle assignment problems for a multi-head gantry SMT machine using improved firefly algorithm and dynamic programming

《Advanced Engineering Informatics》2022

This paper proposes a two-stage framework for developing hybrid approaches to solve the three printed circuit board assembly (PCBA) problems, component sequencing problem (CSP), feeder assignment problem (FAP), and nozzle assignment problem (NAP), simultaneously for a multi-head gantry SMT (surface-mounting technology) machine. The three essential PCBA problems affect the productivity of a multi-head gantry SMT machine considerably. However, due to the difficulty and complexity, the NAP (which assigns a given set of nozzles to the assembly heads of a machine) has been often neglected or roughly resolved in past research. The lack of considering the NAP leads to the underestimation of the total assembly time required for one printed circuit board (PCB) and eventually results in inaccurate production planning. The two-stage framework consists of metaheuristic and dynamic programming (DP) methods, which can deal with the three PCBA problems systematically. Various metaheuristics including firefly algorithm (FA), improved FA (IFA), genetic algorithm (GA), particle swarm optimization (PSO), and whale optimization algorithm (WOA) have been respectively used in this framework and experiments have been conducted to investigate their effectiveness. The results show that the hybridization of IFA with DP outperforms the others in terms of total assembly time. 相似文献

19.

网格共享目录的动态监测

桂小林李一楠王纪平《计算机工程》2004,30(20):68-69,97

针对物理资源的动态变化,设计了一个共享目录监测模型。该模型在每个网格结点驻留一个进程,用来主动地监视网格结点的可用性和物理共享目录的内容变化,及时刷新文件信息的逻辑映射。相似文献

20.

网格环境下分布式仿真应用的资源调度* 总被引：1，自引：1，他引：0

洪流万虎龚静雯陈学广《计算机应用研究》2009,26(3):890-892

针对网格环境中典型的交互密集型应用——分布式仿真问题,综合考虑具体应用的计算量及通信需求情况,结合网络资源的限制约束,提出了实现资源节点优化选择的过程框架,给出了节点优化选择的问题模型和求解算法。仿真实验表明所提出的优化策略能够显著提高分布式仿真应用执行的效率。相似文献