共查询到20条相似文献,搜索用时 46 毫秒
1.
UPC并行循环优化的研究与实现 总被引:2,自引:0,他引:2
UPC(UnifiedParallelC)是一种新型的基于全局地址空间(GlobalAddressSpace,简称GAS)访问的并行编程语言,支持SPMD(SingleProgramMulti-Data)编程模式。论文主要研究UPC原型系统的编译器优化技术的算法与实现,该UPC原型系统是建立在开放源码的BerkeleyUPC编译器基础之上的。目前该原型系统已实现了upc_forall优化和共享访问私有化,使得一部分UPC并行应用程序的效率得到了明显改善。 相似文献
2.
3.
结构体广泛应用在科学计算等应用程序中,向量化结构体数组存在的非连续和非对齐访存会严重影响程序的向量化效果。为减少结构体数组SIMD向量化过程中的非连续和非对齐数据访问,提出了基于域访问亲和度与域数据类型相结合的结构体拆分模型,以消除域存储间的内存“间隙”;同时利用结构体数组到二维数组的地址映射方式来满足结构体数组向量化时的访存连续和对齐要求,以降低Cache的失效率,从而提升应用程序性能。在自动向量化系统SW-VEC上,选取gcc-vec、spec2000和spec2006标准测试集中部分相关的测试用例,测试结果表明:与相应的串行程序相比, 采用该方法后,测试用例程序性能加速比提高了8%以上。 相似文献
4.
5.
朱晓梅结 《计算机与数字工程》1997,25(2):46-50
本文介绍了几在个实现基于消息通信源到并行编译中遇到的问题,如计算模型的选取、源程序中输入与输出语句的处理、过程参数引起的数据传送量不确定的问题、FIF句引起的消息送的不确定性、组的部分修改与整体相关的矛盾性、以及非线化的控制语句问题,并给出了其中一些产实现方案。 相似文献
6.
主流通用处理器都已经实现了多核并行以及处理器核内的SIMD并行。虽然GCC编译器实现了面向SIMD并行的自动向量化,但是编译器针对OpenMP并行程序的自动向量化效果仍很不理想。针对多线程并行的OpenMP程序,基于GCC的OpenMP编译实现,扩展了数据对齐属性指导语句,使编译器在自动向量化时能够进行更准确的数据对齐与否的判断,优化了GCC编译器的自动向量化。 相似文献
7.
面向SLP 的多重循环向量化 总被引:1,自引:0,他引:1
如今,越来越多的处理器集成了SIMD(single instruction multiple data)扩展,现有的编译器大多也实现了自动向量化的功能,但是一般都只针对最内层循环进行向量化,对于多重循环缺少一种通用、易行的向量化方法.为此,提出了一种面向SLP(superword level parallelism)的多重循环向量化方法,从外至内依次对各个循环层次进行分析,收集各层循环对应的一些影响向量化效果的属性值,主要包括能否对该循环进行直接循环展开和压紧、有多少数组引用相对于该循环索引连续以及该循环所包含的区域等,然后根据这些属性值决定在哪些循环层次进行直接循环展开和压紧,最后通过SLP对循环中的语句进行向量化.实验结果表明,该算法相对于内层循环向量化和简单的外层循环向量化平均加速比提升了2.13和1.41,对于一些常用的核心循环可以得到高达5.3的加速比. 相似文献
8.
9.
10.
11.
访问单元(AU)是信报处理系统(MHS)的重要功能对象,信报处理系统通过它可以与传统的通信系统集成。本文将讨论MHS AU的概念、类型、功能、作用和配置,着重分析公共传真访问单元(PFAXAU)应具有的基本功能。文章的最后介绍了一个PFAXAU系统高效、实用的实现方法。 相似文献
12.
在大规模并行处理系统中,采用共享存储和消息传递两种通信模型均存在各自的局限性,本文提出了一种新的改善共享存储系统性能的设计策略:用户级共享存储协议,并在基于X86处理器的分布式共享存储系统仿真器SimDSM上对两个典型应用问题进行了测试,实验结果表明,它的性能比采用传统协议有显著提高. 相似文献
13.
SN_PDBS中数据重划分的设计与实现 总被引:1,自引:0,他引:1
在基于共享硬件结构的并行数据库系统中,数据倾斜严重影响系统性能,数据重划分是实现数据物量重组织,解决数据放置倾斜的一种比较彻底的方法,本文提出了SN结构下并行数据库的静态和动态重划分算法,以及针对轮转重划分的静态算法,理论分析和实践表明算法是正确可行性的。 相似文献
14.
本文介绍了一种实用的程控交换机远程维护和管理系统,给出了实现该系统的原理框图,并详细介绍了各部分的作用和具体实现技术。 相似文献
15.
杨虎猛 《计算机应用与软件》2005,22(3):134-136
本文主要讲述现场总线的一般概念、Lonworks系统的发展、Lonworks系统中的LNS开发技术开发IC卡项目(门禁控制系统)等方面内容。 相似文献
16.
本文首先分析介绍结构并行计算机系统的两种方法:Multiporcessors和Multicomputers,然后介绍一种Multicomputers并行计算机系统中基于messagepassing的并行程序设计环境以及并行程序设计方法,它具有程序设计简单,直观等特点,易于构造程序模型,并能获得较好的加速比。 相似文献
17.
点阵图形矢量化的高效方法——有向边界法 总被引:10,自引:0,他引:10
本文将点阵图的边缘定义为有向边界,并据此提出了分两步来实现点阵图矢量化的新方法-有向边界法,该法与其他方法相比,具有算法简单,运行时间短,效率高等优点。 相似文献
18.
基于特征段的正交矢量化及其符号识别方法 总被引:7,自引:0,他引:7
文中提出一种使用特征段的工程图矢量化方法,通过抽取图像中部分具有显著特征的行段建立特征矢量线段,经过延伸、合并求交等运算获取完整准确的矢量线.为避免毛刺、小弯度直线矢量化产生的奇异性,该研究运用正交双向矢量化的方法分别在X和Y方向对倾斜角小于45°和大于45°的直线分别进行特征段抽取.对粘连弯头短直线及端点符号识别也作了研究. 相似文献
19.
基于角色的信息网格访问控制的研究 总被引:42,自引:1,他引:42
信息网格是利用网格技术实现信息资源的共享、管理和提供信息服务的系统,结合中国科学院计算所织女星网格计划的研究工作,分析了信息格访问控制的关键问题,提出了一个基于角色的信息网格访问控制的模型,并讨论了信息网格访问控制的通用性问题,这一基于角色的访问控制模型正在织女星信息网格的实践中实施。 相似文献