首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
UPC并行循环优化的研究与实现   总被引:2,自引:0,他引:2  
UPC(UnifiedParallelC)是一种新型的基于全局地址空间(GlobalAddressSpace,简称GAS)访问的并行编程语言,支持SPMD(SingleProgramMulti-Data)编程模式。论文主要研究UPC原型系统的编译器优化技术的算法与实现,该UPC原型系统是建立在开放源码的BerkeleyUPC编译器基础之上的。目前该原型系统已实现了upc_forall优化和共享访问私有化,使得一部分UPC并行应用程序的效率得到了明显改善。  相似文献   

2.
SIMD自动向量化编译优化概述   总被引:1,自引:0,他引:1  
高伟  赵荣彩  韩林  庞建民  丁锐 《软件学报》2015,26(6):1265-1284
SIMD扩展部件是集成到通用处理器中的加速部件,旨在发掘多媒体程序和科学计算程序的数据级并行.首先介绍SIMD扩展部件的背景和研究现状,然后从发掘方法、数据布局、多平台向量化这3个角度介绍了SIMD自动向量化的研究问题、困难和最新研究成果,最后展望了SIMD编译优化未来的研究方向.  相似文献   

3.
结构体广泛应用在科学计算等应用程序中,向量化结构体数组存在的非连续和非对齐访存会严重影响程序的向量化效果。为减少结构体数组SIMD向量化过程中的非连续和非对齐数据访问,提出了基于域访问亲和度与域数据类型相结合的结构体拆分模型,以消除域存储间的内存“间隙”;同时利用结构体数组到二维数组的地址映射方式来满足结构体数组向量化时的访存连续和对齐要求,以降低Cache的失效率,从而提升应用程序性能。在自动向量化系统SW-VEC上,选取gcc-vec、spec2000和spec2006标准测试集中部分相关的测试用例,测试结果表明:与相应的串行程序相比, 采用该方法后,测试用例程序性能加速比提高了8%以上。  相似文献   

4.
彩虹 《个人电脑》2012,18(11):88-91
为了方便单位共享资源整合,有效改善网络管理效率,作为网络管理员的小周最近将局域网的工作组环境升级到了域环境,同时将单位所有员工的计算机全部添加到了指定域中,大大增强了对域计算机的控制力度。在局域网工作环境中,为了协同工作、相互交流,从而有效提高工作效率,员工们往往会通过网络进行共享访问操作。不过,在实际共享访问时,由于员工的操作水平参差不齐,局域网客户机安装的操作系统也不一样,员工们相互之间共享访问时,经常会遇到人为  相似文献   

5.
本文介绍了几在个实现基于消息通信源到并行编译中遇到的问题,如计算模型的选取、源程序中输入与输出语句的处理、过程参数引起的数据传送量不确定的问题、FIF句引起的消息送的不确定性、组的部分修改与整体相关的矛盾性、以及非线化的控制语句问题,并给出了其中一些产实现方案。  相似文献   

6.
主流通用处理器都已经实现了多核并行以及处理器核内的SIMD并行。虽然GCC编译器实现了面向SIMD并行的自动向量化,但是编译器针对OpenMP并行程序的自动向量化效果仍很不理想。针对多线程并行的OpenMP程序,基于GCC的OpenMP编译实现,扩展了数据对齐属性指导语句,使编译器在自动向量化时能够进行更准确的数据对齐与否的判断,优化了GCC编译器的自动向量化。  相似文献   

7.
面向SLP 的多重循环向量化   总被引:1,自引:0,他引:1  
魏帅  赵荣彩  姚远 《软件学报》2012,23(7):1717-1728
如今,越来越多的处理器集成了SIMD(single instruction multiple data)扩展,现有的编译器大多也实现了自动向量化的功能,但是一般都只针对最内层循环进行向量化,对于多重循环缺少一种通用、易行的向量化方法.为此,提出了一种面向SLP(superword level parallelism)的多重循环向量化方法,从外至内依次对各个循环层次进行分析,收集各层循环对应的一些影响向量化效果的属性值,主要包括能否对该循环进行直接循环展开和压紧、有多少数组引用相对于该循环索引连续以及该循环所包含的区域等,然后根据这些属性值决定在哪些循环层次进行直接循环展开和压紧,最后通过SLP对循环中的语句进行向量化.实验结果表明,该算法相对于内层循环向量化和简单的外层循环向量化平均加速比提升了2.13和1.41,对于一些常用的核心循环可以得到高达5.3的加速比.  相似文献   

8.
本文主要讨论流水线向量机上运行的FORTRAN语言程序中最内层DO循环的向量化,内层DO循环的一般形式为: s 把向量机的向量寄存器的分量个数记作ξ,循环的迭代次数记为N,N=r+qξ,0≤r<ξ,q≥0,如果该循环可以向量化,就可根据长度ξ把循环的迭代区间分段,从  相似文献   

9.
涉及指针访问的C语言for循环的向量化识别是一个令人棘手的问题。本文提出了一种指针循环等价变换为数组循环的方法,来解决这一问题,并且提出了一个C语言for循环的向量化识别算法,它是一种区别传统方法的新型快速算法。  相似文献   

10.
目前,计算马德龙常数在教学过程中多数是采用传统的循环方式,效率较低.使用向量化的思路,以空间换时间,加快了计算速度.  相似文献   

11.
访问单元(AU)是信报处理系统(MHS)的重要功能对象,信报处理系统通过它可以与传统的通信系统集成。本文将讨论MHS AU的概念、类型、功能、作用和配置,着重分析公共传真访问单元(PFAXAU)应具有的基本功能。文章的最后介绍了一个PFAXAU系统高效、实用的实现方法。  相似文献   

12.
在大规模并行处理系统中,采用共享存储和消息传递两种通信模型均存在各自的局限性,本文提出了一种新的改善共享存储系统性能的设计策略:用户级共享存储协议,并在基于X86处理器的分布式共享存储系统仿真器SimDSM上对两个典型应用问题进行了测试,实验结果表明,它的性能比采用传统协议有显著提高.  相似文献   

13.
SN_PDBS中数据重划分的设计与实现   总被引:1,自引:0,他引:1  
在基于共享硬件结构的并行数据库系统中,数据倾斜严重影响系统性能,数据重划分是实现数据物量重组织,解决数据放置倾斜的一种比较彻底的方法,本文提出了SN结构下并行数据库的静态和动态重划分算法,以及针对轮转重划分的静态算法,理论分析和实践表明算法是正确可行性的。  相似文献   

14.
本文介绍了一种实用的程控交换机远程维护和管理系统,给出了实现该系统的原理框图,并详细介绍了各部分的作用和具体实现技术。  相似文献   

15.
本文主要讲述现场总线的一般概念、Lonworks系统的发展、Lonworks系统中的LNS开发技术开发IC卡项目(门禁控制系统)等方面内容。  相似文献   

16.
本文首先分析介绍结构并行计算机系统的两种方法:Multiporcessors和Multicomputers,然后介绍一种Multicomputers并行计算机系统中基于messagepassing的并行程序设计环境以及并行程序设计方法,它具有程序设计简单,直观等特点,易于构造程序模型,并能获得较好的加速比。  相似文献   

17.
点阵图形矢量化的高效方法——有向边界法   总被引:10,自引:0,他引:10  
本文将点阵图的边缘定义为有向边界,并据此提出了分两步来实现点阵图矢量化的新方法-有向边界法,该法与其他方法相比,具有算法简单,运行时间短,效率高等优点。  相似文献   

18.
基于特征段的正交矢量化及其符号识别方法   总被引:7,自引:0,他引:7  
文中提出一种使用特征段的工程图矢量化方法,通过抽取图像中部分具有显著特征的行段建立特征矢量线段,经过延伸、合并求交等运算获取完整准确的矢量线.为避免毛刺、小弯度直线矢量化产生的奇异性,该研究运用正交双向矢量化的方法分别在X和Y方向对倾斜角小于45°和大于45°的直线分别进行特征段抽取.对粘连弯头短直线及端点符号识别也作了研究.  相似文献   

19.
基于角色的信息网格访问控制的研究   总被引:42,自引:1,他引:42  
信息网格是利用网格技术实现信息资源的共享、管理和提供信息服务的系统,结合中国科学院计算所织女星网格计划的研究工作,分析了信息格访问控制的关键问题,提出了一个基于角色的信息网格访问控制的模型,并讨论了信息网格访问控制的通用性问题,这一基于角色的访问控制模型正在织女星信息网格的实践中实施。  相似文献   

20.
本文介绍了在VB环境下三种基于面向对象的数据存取方法,分析比较了它们的数据存取模型,给出了每种对象方法的特点,最后检出了与数据库接的常用方式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号