首页 | 本学科首页   官方微博 | 高级检索  
     

Intel64体系结构的数据预取机制及效果
引用本文:董钰山,李春江.Intel64体系结构的数据预取机制及效果[J].计算机科学,2016,43(5):34-41.
作者姓名:董钰山  李春江
作者单位:国防科学技术大学计算机学院软件研究所 长沙410073,国防科学技术大学计算机学院软件研究所 长沙410073
基金项目:本文受国家自然科学基金项目:多核多线程处理器SIMD扩展的编程模型及编译优化关键技术研究(61170046), 863计划项目:面向国产飞腾处理器的并行程序综合优化系统(2012AA010903)资助
摘    要:数据预取是为缓解微处理器与DRAM之间速度差异而出现的隐藏访存延迟的方法。当前Intel各系列处理器都采用多种预取机制来加速数据和代码向Cache的移动,从而提升程序的性能。通过对Intel64体系结构存储层次的分析,剖析了X86/X64体系的数据预取机制,包括硬件预取和软件预取,并且分析了编译器对软件预取机制的支持。最后测试了Intel64体系结构数据预取对科学计算程序中紧嵌套循环性能的影响,总结出了影响数据预取有效性的几个因素。此项工作对在Intel平台上进行循环数组预取优化有指导意义。

关 键 词:Intel  64  Cache  硬件预取  软件预取  GCC  ICC
收稿时间:2015/3/17 0:00:00
修稿时间:2015/6/27 0:00:00
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号