首页 | 本学科首页   官方微博 | 高级检索  
     

异构架构下基于放松重用距离的多平台数据布局优
引用本文:刘颖,黄磊,吕方,崔慧敏,王蕾,冯晓兵.异构架构下基于放松重用距离的多平台数据布局优[J].软件学报,2016,27(8):2168-2184.
作者姓名:刘颖  黄磊  吕方  崔慧敏  王蕾  冯晓兵
作者单位:计算机体系结构国家重点实验室(中国科学院 计算技术研究所), 北京 100190,计算机体系结构国家重点实验室(中国科学院 计算技术研究所), 北京 100190,计算机体系结构国家重点实验室(中国科学院 计算技术研究所), 北京 100190,计算机体系结构国家重点实验室(中国科学院 计算技术研究所), 北京 100190,计算机体系结构国家重点实验室(中国科学院 计算技术研究所), 北京 100190,计算机体系结构国家重点实验室(中国科学院 计算技术研究所), 北京 100190
基金项目:国家自然科学基金(61202055,61402445);国家高技术研究发展计划(863)(2015AA011505)
摘    要:异构架构迅速发展,依靠编译器来挖掘应用程序的数据局部性、充分发挥加速设备片上cache的硬件优势,是十分重要的.然而,传统的重用距离在异构背景下面临平台差异性挑战,缺乏统一的计算框架.为了更好地刻画和优化异构程序的局部性,建立了一个多平台统一的重用距离计算机制和数据布局优化框架.该框架根据应用在异构架构下的并行执行方式,从统计平均的角度提出了放松重用距离,并以OpenCL程序为例给出了它的计算方法,为多平台数据布局优化决策提供统一的依据.为了验证该方法的有效性,在Intel Xeon Phi,AMD Opteron CPU,Tilera TileGX-36这3个平台上进行了实验,结果表明,该方法在多平台上可获得至少平均1.14x的加速比.

关 键 词:OpenCL  数据布局  重用距离
收稿时间:2015/8/10 0:00:00
修稿时间:2016/5/23 0:00:00

Cross-Platform Data Layout Optimization Based on Relaxed Reuse Distance on Heterogeneous Architectures
Affiliation:State Key Laboratory of Computer Architecture (Institute of Computing Technology, The Chinese Academy of Sciences), Beijing 100190, China,State Key Laboratory of Computer Architecture (Institute of Computing Technology, The Chinese Academy of Sciences), Beijing 100190, China,State Key Laboratory of Computer Architecture (Institute of Computing Technology, The Chinese Academy of Sciences), Beijing 100190, China,State Key Laboratory of Computer Architecture (Institute of Computing Technology, The Chinese Academy of Sciences), Beijing 100190, China,State Key Laboratory of Computer Architecture (Institute of Computing Technology, The Chinese Academy of Sciences), Beijing 100190, China and State Key Laboratory of Computer Architecture (Institute of Computing Technology, The Chinese Academy of Sciences), Beijing 100190, China
Abstract:With the rapid development of heterogeneous system, it''s important to enhance data locality and fully utilize on-chip cache via compiler. However, classic reuse distance criteria exhibites platform-sensitive attribute in heterogeneous systems, therefore a unified reused distance calculation framework is needed for compiler to describe and optimize data locality. This paper proposes relaxed reuse distance with a unified calculation method in OpenCL programs as criteria for data layout optimization. Relaxed reuse distance is calculated with heterogeneous execution models and statistical approximation. Experiments are conducted on Intel Xeon Phi, AMD Opteron CPU, and Tilera Tile-GX36, and results show that this optimization can achieve at least 1.23x speedup on average.
Keywords:OpenCL  data layout  reuse distance
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号