首页 | 本学科首页   官方微博 | 高级检索  
     

基于神威蓝光处理器的向量数学软件包
引用本文:解庆春,张云泉,李焱,逄仁波,吴再龙,鲁永泉,高鹏东.基于神威蓝光处理器的向量数学软件包[J].软件学报,2014,25(S2):70-79.
作者姓名:解庆春  张云泉  李焱  逄仁波  吴再龙  鲁永泉  高鹏东
作者单位:中国传媒大学 高性能计算中心, 北京 100024;中国科学院 软件研究所 并行软件与计算科学实验室, 北京 100190,中国传媒大学 高性能计算中心, 北京 100024;中国科学院 计算技术研究所 计算机体系结构国家重点实验室, 北京 100190,中国科学院 软件研究所 并行软件与计算科学实验室, 北京 100190,国家海洋环境预报中心 网络与计算机部, 北京 100081,中国海洋大学 信息科学与工程学院, 山东 青岛 266100,中国传媒大学 高性能计算中心, 北京 100024,中国传媒大学 高性能计算中心, 北京 100024
基金项目:国家自然科学基金(61133005,61272136);国家高技术研究发展计划(863)(2012AA010902,2012AA010903);中国科学院研究生科技创新与社会实践资助
摘    要:首先介绍了SIMD扩展技术,并分析了使用SIMD扩展的3种方式,认为通过调用特定目标平台优化的第三方库是应用领域软件开发者快速开发高效并行程序的较好的方式;其次,介绍了国产神威处理器SW-1600平台,并利用SIMD扩展和循环展开等技术开发了SW-VML(SW Vector Math Library),开发过程中提出了访存对界、简化向量条件分支的优化方法,解决了非对界访存、向量与标量数组转换影响性能的问题,并根据SW编译器对OpenMP的支持,开发了多线程OpenMp版;最后,在SW-1600平台上采用不同向量规模对SW-VML进行了测试,测试结果显示,SIMD向量化相对于串行程序加速比为2.08,4线程相对单线程平均加速比为2.26.SW-VML是在国产神威系列处理器上开发高效程序的向量函数软件包,也是在神威蓝光高性能计算平台单计算节点开发高性能程序的基础软件工具包.

关 键 词:SIMD扩展  神威处理器SW_1600  向量数学库  向量化
收稿时间:8/5/2013 12:00:00 AM
修稿时间:2014/3/13 0:00:00

Package of the Vector Math Library Based on the Sunway Processor
XIE Qing-Chun,ZHANG Yun-Quan,LI Yan,PANG Ren-Bo,WU Zai-Long,LU Yong-Quan and GAO Peng-Dong.Package of the Vector Math Library Based on the Sunway Processor[J].Journal of Software,2014,25(S2):70-79.
Authors:XIE Qing-Chun  ZHANG Yun-Quan  LI Yan  PANG Ren-Bo  WU Zai-Long  LU Yong-Quan and GAO Peng-Dong
Affiliation:High Performance Computing Center, Communication University of China, Beijing 100024, China;Laboratory of Parallel Computing, Institute of Software, The Chinese Academy of Sciences, Beijing 100190, China,High Performance Computing Center, Communication University of China, Beijing 100024, China;State Key Laboratory of Computer Architecture, Institute of Computing Technology, The Chinese Academy of Sciences, Beijing 100190, China,Laboratory of Parallel Computing, Institute of Software, The Chinese Academy of Sciences, Beijing 100190, China,Department of Computer and Network, National Marine Environmental Forecasting Center, Beijing 100081, China,School of Information Sceience and Technology, The Ocean University of China, Qingdao 266100, China,High Performance Computing Center, Communication University of China, Beijing 100024, China and High Performance Computing Center, Communication University of China, Beijing 100024, China
Abstract:
Keywords:SIMD extension  sunway processor SW_1600  vector math libarary  vectorization
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号