首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
在现代微处理器的设计中,Cache是整个处理器性能的决定因素.本文描述了64住RISC微处理器"OpenSPARC T1"中的Cache的功能和结构,并提出对"OpenSPARC T1"中的Cache的优化方案.  相似文献   

2.
在高速缓存参数无关的算法与数据结构的设计中,使用了许多技术,这些技术都是利用数据的时间和空间局部性,有效地使用计算机多级存储结构,进而提高算法与数据结构的效率。文中对若干利用局部性原理的高速缓存参敷无关技术进行分析和总结。  相似文献   

3.
讨论了访问局部性原理在Cache存储系统中的体系结构设计和Cache与主存容量比的选择方面的应用.  相似文献   

4.
数据网格已逐步在科学研究领域得到应用.提高数据网格的性能以适应分布式数据管理已经成为研究数据网格的一个热点.提出了网格局部性的概念,分析了网格局部性对数据网格性能的影响,并从增强网格局部性的角度对数据网格的性能进行优化,提出了综合跳一扩散副本替换策略(jump-DRP)和参考生物外激素的任务调度策略(JARIP).实验结果表明,考虑了网格局部性因素的jump-DRP与JARIP的策略组合提高了网格平台的任务处理性能,并对各类应用背景及任务的复杂程度具有鲁棒性.  相似文献   

5.
Cache低功耗技术研究   总被引:1,自引:1,他引:1  
现代微处理器中Cache已经成为不可缺少的重要部件,其功耗约占整个芯片功耗的30% ̄60%[1,2]。如何减少Cache的功耗,已成为当今Cache设计者关注的焦点。论文提出了一种基于Cache可重组技术以及数据符号压缩技术的低功耗D-Cache设计方法,其技术关键在于动态调整Cache的组织结构,并且改变Cache-Line中数据的存储方式来降低Cache功耗。  相似文献   

6.
考虑通信实体之间的距离、可用带宽以及通信和资源使用费用,提出了抽象距离的数学模型,并结合网格资源和网格应用模型,设计了局部性网格资源调度算法,该算法在选择资源时首先考虑在同一节点的资源,其次通过抽象距离选择邻近的节点。实验表明,局部性调度在通信开销、成本、任务完成时间以及任务执行的成功率等方面都得到了改善。  相似文献   

7.
FORALL结构是FORTRAN 95的一种语法,在编译器中高效地实现FORALL结构是一项富有挑战性的工作,局部性优化对其高效实现尤其重要。本文介绍作者在G95编译器中实现FOR ALL结构时用到的两种局部性优化方法--临时空间合并和嵌套循环排序。实验结果表明,局部性优化对提高FORALL结构的性能非常有效。对某类FORALL结构,与Intel的EFC 编译器相比,我们的实现方法能提高30%的性能。  相似文献   

8.
由于模型化简的方法存在着通用性的限制,工作流模型中控制流和数据流相结合的冲突检测通常要在整个模型范围内进行,模型维护的复杂性高。首先通过分析工作流模型中存在的时序依赖和数据依赖关系,以及二者应该满足的一致性,揭示出工作流模型的拓扑结构中存在着局部性。基于工作流模型的局部性原理提出活动的稳定子图,以及工作流模型重构后的局部区域求解方法,并对方法给予证明。最后的对比分析表明,工作流模型的拓扑结构发生变化时,控制流和数据流的一致性完全可以在局部范围内验证和维护,进而提高了模型维护的效率。  相似文献   

9.
已有的LRFU(Least Recency Frequency Used)自适应算法在实际应用中根据经验调整λ值,缺乏对访问局部性强弱的量化分析,因而其可适用的访问模式有限.该文首先建立基于K阶马尔可夫链(K→∞)的局部性定量分析模型,在访问过程中根据统计信息实时量化局部性特征.然后以此分析模型为基础设计自适应替换算法LA-LRFU(Locality-Aware LRFU),随着访问特征的变化动态调整参数λ.最后应用Trace仿真对算法进行测试.实验结果显示,针对多种访问模式,LA-LRFU均可显著提高Cache命中率;在由多种访问模式构成的具体访问过程中,LA-LRFU能比现有的各类LRFU自适应算法更合理地调整参数λ.  相似文献   

10.
P2P系统的一个核心问题是如何高效定位所需资源。文中提出了一种基于兴趣局部性(Iocality)的分布式哈希表(DHT)资源定位技术,将非结构化对等网络引入到Chord中,充分利用节点在物理网络上的邻近性和节点间兴趣的局部性。模拟测试表明,该技术在路径长度和访问延迟方面的性能优千原Chord。  相似文献   

11.
A new cache architecture based on temporal and spatial locality   总被引:5,自引:0,他引:5  
A data cache system is designed as low power/high performance cache structure for embedded processors. Direct-mapped cache is a favorite choice for short cycle time, but suffers from high miss rate. Hence the proposed dual data cache is an approach to improve the miss ratio of direct-mapped cache without affecting this access time. The proposed cache system can exploit temporal and spatial locality effectively by maximizing the effective cache memory space for any given cache size. The proposed cache system consists of two caches, i.e., a direct-mapped cache with small block size and a fully associative spatial buffer with large block size. Temporal locality is utilized by caching candidate small blocks selectively into the direct-mapped cache. Also spatial locality can be utilized aggressively by fetching multiple neighboring small blocks whenever a cache miss occurs. According to the results of comparison and analysis, similar performance can be achieved by using four times smaller cache size comparing with the conventional direct-mapped cache.And it is shown that power consumption of the proposed cache can be reduced by around 4% comparing with the victim cache configuration.  相似文献   

12.
复用距离已经成为程序cache行为的一种重要度量标准,但高复杂度和可能的内存溢出问题使得其难以应用.本文在引入最大cache大小的基础上提出一种受限的复用距离分析方法.该方法有效地避免了一般复用距离分析可能导致的内存溢出问题,同时使得复用距离分析达到线性时间复杂度.文章通过对一系列整数和浮点程序的实验说明基于该复用距离分析的cache失效率分析的可行性和正确性.  相似文献   

13.
Web网站缓存设计中Cache一致性问题的研究   总被引:4,自引:0,他引:4  
从网站缓存实现机制入手,分析了Cache一致性对网站缓存效率的影响,重点讨论了一种通过服务器集群实现基于网站为单位的缓存设计,缓存不再针对具体的文件而是以整个网站为单位来进行查询和替换,更好地保证了Cache一致性原则在缓存设计中的体现。  相似文献   

14.
本文主要研究了多处理机系统中访问cache不命中的平均情况。从多机间相互干扰的角度,分析了访问cache的平均不命中次数,本文还从算法设计出发,提出了分析cache伪共享的直观方法——访问模式图  相似文献   

15.
受限于功耗,十多年前通用微处理器就停止追求更高的主频转而向集成更多处理器核的方向发展;同时,随着晶体管密度按摩尔定律不断提高,单片可集成的处理器核数成倍增长,片上多核、众核处理器已成为高性能微处理器发展的主流。未来千核级通用众核处理器支持共享存储编程模型是一种必然趋势,但传统的Cache一致性目录结构面临着查找延迟高、目录项替换频繁以及硬件代价和功耗可扩展性有限等问题。稀疏目录实现了传统目录结构硬件开销与一致性维护效率的折衷,被认为是众核处理器维护Cache一致性的一种高能效、可扩展结构。综述了近年来提高稀疏目录性能的相关研究与方法,并对其在面积、访问延迟、功耗和实现复杂性等方面进行分析,归纳出这些方法各自的优点和存在的不足,对创新设计未来高性能众核处理器共享存储体系结构具有一定的参考价值。  相似文献   

16.
Web缓存服务器技术研究与应用   总被引:7,自引:3,他引:4  
Web缓存服务器系统正在Internet及局域网上广泛地应用,对它所采用的技术做了较深入的讨论,指出利用Web Cache技术,可减少网络流量,节约资金,提高带宽利用率;同时在Cache服务器端进行内容分析过滤,可提高过滤质量和效率,有效防止有害信息的进一步传播。  相似文献   

17.
传统的指令优化方法通常不考虑调整指令高速缓存的硬件体系结构,只能得到局部优化结果.本文以实验的方法研究了指令优化设计和指令缓存配置之间的关系,通过实现程序指令优化并在不同指令缓存配置的平台上运行优化前后的程序,对比缓存缺失率,为进一步提高指令缓存性能提供了重要参考.实验结果表明指令缓存配置对指令优化的性能有极大的影响,在系统设计阶段同时考虑指令优化和指令缓存结构将能大幅度地改进指令缓存的性能.  相似文献   

18.
一种低功耗动态可重构cache算法的研究   总被引:1,自引:0,他引:1  
动态可重构cache算法根据指令时间数监测程序段的变化,确定容量调整.在程序段内,状态机根据平均访问时间对cache的访问进行预判,然后根据预判的结果确定当前程序段的cache结构.实验结果表明,此算法比传统四路组相联cache功耗降低61%,而性能损失只有2%左右.与已有算法相比,功耗和性能都得到进一步的提高.  相似文献   

19.
HTTP缓存服务器是提高HTTP Streaming系统客户并发量的关键环节。但当前主流HTTP缓存服务器,如Nginx、Squid、Varnish等,在缓存资源更新期间的行为都存在不足,当被应用在面向直播的HTTP Streaming系统中时,会周期性地把大量客户端请求转发至源服务器,从而制约了HTTP Streaming系统的可伸缩性。提出一种优化的HTTP缓存服务器在缓存更新期间的行为,即缓存服务器仅向源服务器转发一路客户端请求,缓存更新期间,拒绝其他关于该资源的请求。优化策略在使用最为广泛的Nginx服务器的基础上进行了实现。实验证明,优化后系统的伸缩性得到了显著提高。  相似文献   

20.
H. D. Baecker 《Software》1973,3(3):245-253
Some aspects of the problem of achieving reference locality within a virtual memory organization during the processing of list structures are discussed. We also describe a limited series of experiments to explore different techniques for the representation and allocation of list structures in a virtual memory. The experimental results tend to show that there are cost advantages in separating the organizational skeleton of a list from the data being structured. However, these results apply only to the cost factors inherent in the use of current hardware and may be altered by technological advances.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号