期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	1篇
国内免费	2篇

专业分类

综合类	1篇
自动化技术	4篇

出版年

2015年	1篇
2013年	2篇
2012年	2篇

排序方式： 共有5条查询结果，搜索用时 15 毫秒

面向异构系统的OpenMP程序自动生成

下载免费PDF全文

刘晓娴黄品丰《信息工程大学学报》2012,13(4):489-495

异构系统的应用日益广泛.对一般的应用程序员而言,在异构体系结构上开发出高性能的应用程序并非易事.对OpenMP编程模型进行扩展,添加了适用于异构系统存储模型的编译子句;以Open64编译器为基础,实现了包含扩展子句OpenMP并行程序的自动生成.测试结果表明,自动生成的扩展OpenMP并行程序能够在异构系统上获得明显的性能提升. 相似文献

面向异构多核处理器的的循环分块

李雁冰赵荣彩赵博黄品丰《计算机工程与设计》2015,36(1):168-173

将OpenACC编程模型用于异构多核处理器时,由于异构多核处理器加速设备内存有限,操作大量数据的代码不能获得很好的加速。针对这一问题,在OpenACC中引入循环分块子句,对循环进行分块处理,使每个循环块使用的数据能够存储在设备内存中;提出面向异构多核处理器的循环分块子句生成算法,并在基于Open64的"源-源"自动并行化系统Auto-ACC中进行实现。测试结果表明,在异构多核处理器上,扩展的循环分块子句及所提生成算法能够对程序进行明显的加速。相似文献

面向异构多核处理器的并行代价模型

黄品丰赵荣彩姚远赵捷《计算机应用》2013,33(6):1544-1547

现有的并行代价模型大多是面向共享存储或分布存储结构设计的,不完全适合异构多核处理器。为解决这个问题,提出了面向异构多核处理器的并行代价模型,通过定量刻画计算核心运算能力、存储访问延迟和数据传输开销对循环并行执行时间的影响,提高加速并行循环识别的准确性。实验结果表明,提出的并行代价模型能有效识别加速并行循环,将其识别结果作为后端生成并行代码的依据,可有效提高并行程序在异构多核处理器上的性能。相似文献

OpenMP数据分布子句自动生成算法

黄品丰赵荣彩韩林刘晓娴《计算机工程》2013,39(3):295-299

将OpenMP程序扩展到异构多核结构时,非本地存储访问会导致访存开销增加,影响程序性能。针对该问题,引入带数组划分信息的数据分布子句,对数据在异构多核存储系统的布局进行管理,提出一种基于并行循环识别和数组引用模式分析的算法,实现该类子句的自动生成。实验结果表明,自动生成的OpenMP程序包含数据分布子句,具有较好的数据局部性,可降低访存开销,在异构多核系统上获得明显的性能提升。相似文献

基于嵌套循环分类的并行识别技术

赵捷赵荣彩丁锐黄品丰《软件学报》2012,23(10):2695-2704

传统的分布存储并行编译系统大多是在共享存储并行编译系统的基础上开发的.共享存储并行编译系统的并行识别技术适合OpenMP代码生成,实现方式是将所有嵌套循环都按照相同的识别方法进行处理,用于分布存储并行编译系统必然会导致无法高效发掘程序的并行性.分布存储并行编译系统应根据嵌套循环结构的特点进行分类处理,提出适合MPI代码生成的并行识别技术.为解决上述问题,根据嵌套循环的结构和MPI并行程序的特点,提出了一种新的嵌套循环分类方法,并针对不同的嵌套循环分别提出了相应的并行识别技术.实验结果表明,与采用传统并行识别技术的分布存储并行编译系统相比,按照所提方法对嵌套循环进行分类,采用相应并行识别技术的编译系统能够更高效地识别基准程序中的并行循环,自动生成的MPI并行代码其性能加速比提高了20%以上. 相似文献