共查询到20条相似文献,搜索用时 15 毫秒
1.
在多核环境下,对共享L2 Cache的优化显得尤为重要,因为当被访问的数据块不在L2 Cache中时(发生L2缺失),CPU需要花费几百个周期访问主存的代价是相当大的.在设计Cache时,替换算法是考虑的一个重要因素,替换算法的好坏直接影响Cache的性能和计算机的整体性能.虽然LRU替换算法已经被广泛应用在片上Cache中,但是也存在着一些不足:当Cache容量小于程序工作集时,容易产生冲突缺失;且LRU替换算法不考虑数据块被访问的频率.文中把冒泡替换算法应用到多核共享Cache中,同时考虑数据块被访问的频率和最近访问的信息.通过分析实验数据,与LRU替换算法相比,采用冒泡替换算法可以使MPKI(Misses per Kilo instructions)和L2 Cache命中率均有所改善. 相似文献
2.
本文提出了一种基于改进的LRU替换策略划分最后一级共享Cache的算法,隔离了线程间的数据冲突,实现了改进的Cache替换策略,通过划分最后一级共享Cache也减少了访存延迟,提高了系统吞吐率. 相似文献
3.
双核处理器性能最优的共享Cache划分 总被引:3,自引:2,他引:1
文中使用模拟器模拟的方法,测试IPC-CP对多道程序的吞吐率、加权加速比和公平性的影响.实验结果表明:以IPC最优为目标的Cache划分在三个评估指标中都优于以失效率最优为目标的Cache划分.其中,IPC-CP的吞吐率最高比失效率最优的Cache划分高出54%,平均高出27%. 相似文献
4.
基于P2P的CDN新型网络及缓存替换算法 总被引:1,自引:0,他引:1
对内容分发网络和P2P网络的特点进行了分析,给出了一种基于P2P的CDN新型网络自治缓存系统的体系结构,提出了自治缓存区域中智能缓存替换问题并给出了智能缓存替换方法和双关键字缓存替换算法.通过仿真实验,可以找到以运算复杂度低命中率高的关键字来实现缓存替换. 相似文献
5.
LRU替换算法在单核处理器中得到了广泛应用,而多核环境大都采用多核共享最后一级Cache(LLC)的策略,随着LLC容量和相联度的增加以及多核应用的工作集增大,LRU替换算法和理论最优替换算法之间的差距越来越大。该文提出了一种平均划分下基于频率的多核共享Cache替换算法(ALRU-F)。该算法将当前所需要的部分工作集保留在Cache内,逐出无用块,同时还提出了块粒度动态划分下基于频率的替换算法(BLRU-F)。该文提出的ALRU-F算法相比传统的LRU算法缺失率降低了26.59%, CPU每一时钟周期内所执行的指令数IPC(Instruction Per Clock)则提升了13.59%。在此基础上提出的块粒度动态划分下,基于频率的BLUR-F算法相比较传统的LRU算法性能提高更大,缺失率降低了33.72%,而IPC 则提升了16.59%。提出的两种算法在性能提升的同时,并没有明显地增加能耗。 相似文献
6.
7.
一种结合动态写策略的磁盘Cache替换算法 总被引:1,自引:0,他引:1
磁盘Cache是改善I/O性能的一种技术.通过分析Cache写策略和LRU、LFU替换算法对磁盘Cache性能的影响,引入一种动态写策略,改进替换算法,使基于频率的块替换算法FBR与动态写策略相结合.二者结合较好地应用于磁盘存取中,充分利用局部性规律,提高I/O性能,使磁盘在多种工作环境和不同Cache大小下的性能更优. 相似文献
8.
本文提出了ROC(Resist-Overload Capability)缓存接纳策略和替换算法,解决了使用间隔缓存变码率视频服务器的缓存管理问题.确定性缓存接纳策略能提供确定的服务质量,却存在不适应交互应用和缓存利用率低的缺点;统计复用缓存接纳策略需要海量卷积运算,因此缺乏实用性;ROC缓存接纳策略通过简单运算,提供概率的缓存服务质量保证和较高的缓存利用率.仿真结果表明,在典型系统配置下,ROC缓存接纳策略和替换算法可以提高约25%的系统吞吐量;相对确定性缓存接纳策略和STP-L缓存替换算法,可以多服务约17%的视频流,平均缓存利用率也要高出约38%. 相似文献
9.
为提高NDN(命名数据网络)中的缓存利用率,提出了一种基于蚁群替换算法的邻居协作缓存管理(ACNCM)策略。首先将单节点的缓存替换问题,建模为0/1背包问题,并根据缓存数据的大小、使用频率以及邻居副本深度等信息定义本地存储内容的缓存价值,提出基于蚁群算法的缓存替换算法。然后利用邻域协作的思想,通过路由节点之间定期交换自身节点的缓存信息,对单个节点替换出去的缓存内容,选择邻居节点完成协作式缓存管理。实验结果表明,ACNCM策略在缓存命中率、网络开销和平均响应时延方面均优于现有方法。 相似文献
10.
随着设计复杂度的不断增加和设计规模的不断增大,传统的验证工具已难以适应当前功能验证的要求.Vera为验证增添了强大的语言能力.使用Vera建立验证平台,它独有的特性能够隐藏设计中的复杂性,从而使testbench的编写更见简洁.通过使用动态的激励驱动,实现了实际工作中的状态和全部极端的条件,从而发现设计中存在的瑕疵.使用Open Vera验证语言构建了"龙腾R2"L2cache验证平台,成功完成了"龙腾R2"的验证工作. 相似文献
11.
随着集成电路行业的不断发展,芯片设计规模空前增长,功能也越来越复杂,使得验证的难度和重要性日益增大。在此提出一种由System Verilog语言搭建的基于VMM的一种面向对象的验证平台。该验证平台主要使用覆盖率驱动的验证技术,并结合可约束随机测试和记分板技术,对一款多核处理器芯片中的L2 Cache进行功能验证。最后对验证平台的可重用性进行研究。实验结果表明,验证平台具有良好的激励生成机制,能够对L2 Cache模块的功能进行全面的验证;同时,验证平台经过少量更改就可以在基于标准的AXI接口的So C验证平台之间重用,极大地提高了验证效率,缩短了验证时间。 相似文献
12.
mc211vm is a process-level ARM-to-x86 binary translator developed in our lab in the past several years. Currently, it is able to emulate singlethreaded programs. We extend mc211vm to emulate multi-threaded programs. Our main task is to reconstruct its architecture for multi-threaded programs. Register mapping, code cache management, and address mapping in mc2llvm have all been modified. In addition, to further speed up the emulation, we collect hot paths, aggressively optimize and generate code for them at run time. Additional threads are used to alleviate the overhead. Thus, when the same hot path is walked through again, the corresponding optimized native code will be executed instead. In our experiments, our system is 8.8X faster than QEMU (quick emulator) on average when emulating the specified benchmarks with 8 guest threads. 相似文献
13.
Abstract -- This paper propose a framework Knowl- edge advantage machine (KAM) to help in organizing in- dividually discovered knowledge drawn from a narrowly bounded domain into a personal knowledge network based on personal request and tags. Ontologies folksonomy and personomy are employed in KAM to constitute the useful repositories of knowledge. Ontologies offer a flexible and expressive layer of abstraction very useful for capturing the semantics of information repositories, but they can not reflect the user's interest. The user in KAM can freely choose the words to tag the resources which are the reflection of the user's own interest. The set of tags and tagged knowledge of a user comprise the personomy. In a group the shared tags and knowledge are known as folksonomy. Our approach investigates how to map these tags in personomy and folksonomy to existing domain ontology in order to add accurate meanings. The user's behaviors are also used to re-rank the query results. So the user can find the useful knowledge quickly and accurately. 相似文献
14.
本文分析了高压模拟/I~2L兼容工艺的特点,着重介绍了一种采用介质隔离高压模拟/I~2L兼容工艺的用户线接口电路的特点、工作原理、版图设计与工艺特点,电路内部含有二-四线转换,检测用户摘挂机功能以及过压、过流保护功能,电路可承受70V以上的高压。采用薄膜电阻,使得匹配电阻精度大大提高,改善了电路的性能。 相似文献
15.
16.
17.
Using a relaying system to provide spatial diversity and improve the system performance is a tendency in the wireless cooperative communications. Amplify-and-forward(AF) mode with a low complexity is easy to be implemented. Under the consideration of cooperative communication systems, the scenario includes one information source, M relay stations and N destinations. This work proposes a relay selection algorithm in the Raleigh fading channel. Based on the exhaustive search method, easily to realize, the optimal selection scheme can be found with a highly complicated calculation. In order to reduce the computational complexity, an approximate optimal solution with a greedy algorithm applied for the relay station selection is proposed. With different situations of the communication systems, the performance evaluation obtained by both the proposed algorithm and the exhaustive search algorithm are given for comparison. It shows the proposed algorithm could provide a solution approach to the optimal one. 相似文献
18.
利用对称性改进了两维快速傅里叶变换(FFT),以这种改进的快速傅里叶变换模拟相干光的费涅耳衍射,设计出傅里叶型Kinoform和等效于透镜的Kinoform合二为一的费涅耳型Kinoform。从对称性的思路出发将一维快速傅里叶变换的对应项应用到两维快速傅里叶变换中,避免一般所采用的分别对矩阵的行和列做一维快速傅里叶变换的做法,观察到计算时间的明显缩短。将此改进的两维FFT算法应用于Gerchberg-Saxten迭代算法,设计的Kinoform的精度相对于文献[1]的结果提高了一个数量级。给出了Kinoform及其费涅耳衍射光强分布的计算机模拟结果。 相似文献
19.
介绍了光突发交换(OBS)网络中的数据信道分群调度策略,并将此信道分群调度策略引入多粒度光交换网络中,提出了一种新的基于OBS信道分群的负载平衡波带分配策略.分析表明,该调度策略能达到改善网络性能的目的. 相似文献