首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 70 毫秒
1.
面向线程级前瞻的线程划分方法浅析   总被引:1,自引:0,他引:1  
正确合理的线程划分方法是提取线程级并行性的必要前提,线程级前瞻技术是简化线程划分复杂度提高系统性能的重要手段。本文讨论了几种支持线程级前瞻的典型线程划分方法,在此基础上提出了线程级划分需要解决的关键问题,并蛄合一典型自动线程划分算法进行了具体分析,提出了线程划分需要进一步研究的问题。  相似文献   

2.
《电子技术应用》2016,(1):19-21
多核同时多线程处理器(SMT_PAAG)是用于图形、图像及数字信号处理的一种多核处理器。基于这种处理器提出了一种硬件线程调度器,该调度器采用同时多线程技术,最多可同时执行四个线程,支持八个线程阻塞模式下的快速上下文切换。这样避免了因阻塞带来的等待问题,能够有效提高处理器的工作效率和资源利用率。通过在处理器上运行图形处理算法进行性能评测。结果表明,SMT-PAAG处理器通过挖掘指令级并行和线程级并行,将处理器的性能提高了69.25%。  相似文献   

3.
针对多核环境中操作系统的线程调度问题,提出一种基于线程流水线的线程调度策略。基于片上多线程处理器,借鉴流水线技术的并行优势,引入线程流水线的概念。通过确定线程特征指标,计算线程流水线的聚合度及对应线程的吻合度,从而完成线程调度,并在此基础上对其进行嵌入式方向的优化。模拟真实环境的实验结果表明,与基于静态优先级的调度策略相比,该策略消耗时间较少。  相似文献   

4.
在当前嵌入式系统应用中,性能问题一直是人们关注的重点.大多数嵌入式Linux应用往往运行在用户态,系统运行时需要经常在内核态和用户态之间反复切换,降低了关键业务的执行效率.以往的研究较少从内核态下的线程库出发来考虑性能优化的实现方法,影响了嵌入式系统的整体性能.对此,本文提出一种适用于嵌入式Linux系统的内核级线程库(LKTL),并且分析了实现的关键技术.LKTL提供了线程管理、信号量同步、内存的动态分配和回收、日志管理以及基本的GNU C库的功能,不但大大提高了应用程序的运行效率,还方便了应用程序的开发和移植.实验表明LKTL能够显著优化嵌入式Linux系统的整体性能.  相似文献   

5.
本文就操作系统中的概念进行了JAVA方式的阐述,提出了多线程处理文件分段记录的一种方式,就关键的同步问题进行了分析,并在试验的基础上得出了应该充分利用的各种语言优势的结论。  相似文献   

6.
用户级线程   总被引:1,自引:0,他引:1       下载免费PDF全文
核心线程是微内核操作系统Mach调度的基本单位,它较好地支持了细粒度的并行计算,但核心线程在支持用户并发模型、双并发模型上还有许多缺点。用户级线程是在核心线程的支持下建立的更高层次的用户调度单位,能较好地支持用户程序的并发执行。本文重点介绍在核心线程支持下的用户级线程—CThread的实现方案  相似文献   

7.
分子动力学数值模拟程序在现代高性能计算机上的计算效率往往很低,只能发挥系统峰值性能的几个百分点。本文对并行分子动力学程序PMD3D在联想深腾6800超级计算机上进行性能优化。通过性能分析,我们发现粒子相互作用力计算中相互关联的浮点运算严重影响了处理器的指令级并行效率,为此我们应用计算缓存的方法,将大量不规则的浮点计算进行缓存,达到一定规模后再进行向量化计算。这样使得单机性能在优化后提升4倍多,达到处理器峰值性能5.2GFlops的32.3%。最后,在深腾6800的64个节点的256个CPU上进行了并行性能测试,达到峰值运算性能1.3万亿次的27%。  相似文献   

8.
基于线程池的高并发访问考试系统设计   总被引:1,自引:0,他引:1  
大量的考生机同时访问现有的考试系统会造成服务器响应缓慢甚至崩溃。基于线程池的高并发访问考试系统,采取线程池控制考试系统对数据库的操作等措施,实现考生机对考试系统的高并发访问。介绍该考试系统的设计框架,主要功能及工作流程和线程池模块的设计。  相似文献   

9.
该文介绍了线程集成,一种在通用单片微处理器或微控制器上低耗并行执行的新方法,后级编译技术有效地插入多个控制线程,并提供细粒度的多个线程而不用上下文切换的方法,这样允许用软件完成实时的功能来代替专用外围硬件。该文研究了在主线程中集成实时客户线程时的代码转移,生成的集成线程能满足所有的实时性,线程集成的概念和代码转移被应用到实际中来检验这种方法的可行性。  相似文献   

10.
Linux内核级线程研究   总被引:2,自引:0,他引:2  
Linux的内核级线程符合POSIX线程(P线程)标准。本文讨论Linux内核级线程的实现。  相似文献   

11.
It can be observed from looking backward that processor architecture is improved through spirally shifting from simple to complex and from complex to simple. Nowadays we are facing another shifting from complex to simple, and new innovative architecture will emerge to utilize the continuously increasing transistor budgets. The growing importance of wire delays, changing workloads, power consumption, and design/verification complexity will drive the forthcoming era of Chip Multiprocessors (CMPs). Furthermore, typical CMP projects both from industries and from academics are investigated. Through going into depths for some primary theoretical and implementation problems of CMPs, the great challenges and opportunities to future CMPs are presented and discussed. Finally, the Godson series microprocessors designed in China are introduced.  相似文献   

12.
13.
设计了一种轻量级的触觉传感系统,基于压敏电阻将压力信号转换为电阻变化的原理,进一步转换为电压信号进行反相滤波处理,通过低功耗蓝牙芯片CC2541读取并无线传递触觉信息.整个系统采用仿生手指结构设计,指尖覆盖与皮肤触感相近的硅胶,柔顺传递接触力.整个电路包含供电模块、电源管理模块、触觉采样处理模块和信号传递模块,集成在第二指节内.整个传感器系统集成度高,便于实际应用.  相似文献   

14.
Computation in the Context of Transport Triggered Architectures   总被引:1,自引:0,他引:1  
Processors used in embedded systems have specific requirements which are not always met by off-the-shelf processors. A templated processor architecture, which can easily be tuned towards a certain application (domain) offers a solution. The transport triggered architecture (TTA) template presented in this paper has a number of properties that make it very suitable for embedded system design. Key to its success is to give the compiler more control; it has to schedule all data transports within the processor. This paper highlights two important TTA-related issues. First a new code generation method for TTAs is discussed; it integrates scheduling and register allocation, thereby avoiding the notorious phase ordering problem between these two steps. Secondly, we discuss how to tune the instruction repertoire for an embedded processor. A tool is described which automatically detects frequent patterns of operations. These patterns can then be implemented on special function units.  相似文献   

15.
利用JMS和XML实现系统集成   总被引:2,自引:0,他引:2  
说明系统集成是信息化的必然趋势,提出用JMS-XML构建系统集成体系,具体阐述了JMS和XML的体系和实现,最后,运用JMS-XML体系来构建一个实例。  相似文献   

16.
指令调度通过调整指令之间的顺序来提高指令级并行度(ILP)。然而基本块通常很小,因而潜在的ILP也很小。随着芯片设计技术的发展,现代的处理机所包含的资源却越来越丰富。指令调度只有跨越基本块的边界(即全局指令调度)才能够充分发挥处理机潜在的和程序中固有的ILP。全局指令调度可划分为有环和无环两种。该文介绍了无环全局指令调度的几种影响力较大的算法。同时还简单介绍了有关全局指令调度的新的热点。  相似文献   

17.
提出了一种新型的多态高效并行阵列机结构--萤火虫2号阵列机。该结构的处理单元可以在SIMD和MIMD两种模式下运行,兼有异步执行机制,还可以实现分布式指令级并行处理。采用了硬件的多线程管理器和高效通信机制,这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和分布式指令级并行运算。尤其值得指出的是,此种阵列机的流处理性能堪与专用集成电路匹敌。该结构还能有效实现静态与动态数据流计算,可以高效实现图形、图像和数字信号处理任务。  相似文献   

18.
Global warming has currently become the most discussed environmental issue. The major portion of the carbon emission for a product is determined at the design stage of its life cycle. Given that products are made of parts, one of the major difficulties is that existing carbon emission assessment methods are machining process-oriented and lack association with design information, which makes it difficult to support low-carbon design. To address this problem, this paper develops a multi-layer integration framework for part low-carbon design based on the association mechanism among five layers, i.e., design feature, machining process, machining feature, operation feature, and carbon emission feature. The carbon emission assessment model of the part could be obtained by the method of top-down expansion and bottom-up assessment in terms of the design features through the developed framework. To obtain a low carbon design scheme, an improved differential evolution algorithm (IDE) with the multi-layer encoding method is proposed based on the hierarchical relationship of the framework, which aims to minimize the potential carbon emissions of parts and makespan of its machining processes. The proposed methodology is verified by the low carbon design of a flange plate.  相似文献   

19.
谢志鹏  吴清江 《计算机工程与设计》2005,26(6):1639-1641,1644
为保证计费系统的安全运行,Win2000客户端计费软件必须从进程列表中隐藏起来;将客户端封装成动态链接库,采用远程线程技术将其嵌入系统关键进程内,从而实现真实隐藏;动态链接库实现了客户端到服务器的登录校验,并侦听服务器的关机和续费指令,实现了网络环境下服务器对Win2k客户端的远程管理。  相似文献   

20.
同步数据触发体系结构SDTA将传统指令级并行细化到微操作级并行,具有较高的数据处理能力,但其特殊的指令格式及指令特性,给指令Cache访问带来了挑战。指令预取技术能够有效地降低指令Cache的访问失效率,增强处理器取指能力,提高性能。本文分析了SDTA指令集特性,提出了一种适合SDTA指令集特性的软硬件相结合的混合指令预取机制,采用硬件预取引擎和软件提示相结合进行预取。该方法能够有效地提高指令Cache命中率,且具有实现简单、无效预取率低、不会增加代码体积等特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号