共查询到17条相似文献,搜索用时 78 毫秒
1.
代码生成作为并行编译器的后端,其生成代码的优劣直接影响着并行程序的执行效率。并行分解的维内存在偏移会产生维内通信,传统算法生成的维内通信代码不够精确,会产生冗余通信。提出了通过合并数组变量生成通信链,并按照通信链生成通信代码的维内通信优化算法来消除此类冗余,对传统算法进行了改进和优化。测试结果表明该算法对维内通信的优化效果明显。 相似文献
2.
3.
基于线性不等式的数据划分方法的优化 总被引:1,自引:0,他引:1
计算和数据划分是串行程序并行化时所要解决的一个重要问题,如何对程序中引用的数据进行合理的分布以最大限度的发现程序的并行性减少数据重分布的通信开销,是并行编译优化的重点。给出的数据和计算的优化分解方法是基于Anderson-Lam的分解算法上改进得到的。根据Anderson-Lam的算法得到数据和计算划分后,以线性不等式的形式表示,然后通过分析循环嵌套中能够进行边界冗余的只读数组,重新构造数据划分不等式,根据此不等式进行数据分布,实现具有边界冗余的只读数组的数据划分,有效地减少了数据收发的通信量。 相似文献
4.
5.
对于高性能并行计算机而言,如何由给出的计算、数据划分信息及精确数组数据流分析信息自动生成并行化代码是实现串行程序并行化的一个重要问题。根据Saman P.Amarasinghe和Lam的定理,实现了一种并行化识别工具中MPI(Message Passing Interface)并行化代码自动生成技术的算法,并对该算法的性能进行分析。 相似文献
6.
7.
可扩展的访问控制标记语言(eXtensible Access Control Markup Language,XACML)逐渐成为访问控制的标准之一。为了确保系统可用性,访问控制系统需要高效的XACML策略评估引擎。针对这一问题,从XACML策略本身潜在的不足出发,从冗余消除和属性数值化两个方面对XACML策略进行了优化。冗余消除在不影响策略评估结果的前提下去除策略库中的冗余规则,同时结合规则压缩消除规则间的冗余状态。属性数值化将文本的XACML策略属性转化为数值属性,使评估引擎匹配使用高效的数值匹配方式而不是低效的字符串匹配方式,同时使用Hash表结构存储数值属性与文本属性的映射关系有利于策略维护。仿真实验结果表明,提出的策略优化方法的性能与原始Sun XACML 相比有较大提升。 相似文献
8.
并行结构骨架理论提供了一种描述并行程序设计模式的通用模型,对设计模式进行更高层次的抽象,能有效解决基于设计模式的并行程序设计方法的局限性问题,降低并行程序设计开发难度.基于并行结构骨架的并行程序设计环境--PASBPE在并行结构骨架理论的基础上,使用参数化设置快速生成用户所需并行程序框架,同时通过可视化的程序设计交互环境,简化并行程序的开发过程,提高开发效率. 相似文献
9.
针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优化算法。该算法根据给出的过程间副作用集合和基于mpi_wait/mpi_irecv移动的重排序变换规则,有序地采用重排序变换和循环分布,尽可能安全地扩大点到点非阻塞通信中通信与计算的重叠窗口,使MPI自动并行化编译器生成具有更多计算重叠通信的消息传递代码。实验结果表明,该算法能够隐藏更多的点到点非阻塞通信开销,并且明显提升消息传递程序的加速比。 相似文献
10.
11.
分布存储系统的并行编译器需要解决各局部存储器之间数据分布问题和各处理机之间通信优化问题。论文并行编程模型、代码和数据分布、通信优化以及代码生成问题四个方面论述了基于分布存储系统的并行编译关键技术并提出了进一步研究所要解决的问题。 相似文献
12.
13.
14.
非均匀稀布直线阵列通常具有较高的旁瓣,为了降低旁瓣,对传统遗传算法进行改进用于阵列优化。为了更好的解决早熟收敛问题,利用两级递阶遗传算法THGA(Two-level Hierarchic Genetic Algorithm)在各阵列电流激励幅度相同的情况下对阵元位置进行了优化,最大旁瓣降低至-15.2498dB。在各阵列电流激励幅度不同的情况下,提出了“微调”“粗调”的思想对激励和阵元位置同时进行优化。仿真结果表明,对于一个孔径为50λ的25个阵元组成的稀布直线阵列,可获得了更低的旁瓣,最大旁辩可降至-22.5955dB。 相似文献
15.
16.
17.
原先锋交换网每传送1帧(2KB)数据,发送方和接收方都分别要启动1次DMA,1M字节的数据需要发送方和接收方都启动512次DMA,启动1次DMA花费的时间几乎占了消息在网络上传送时间的一半;针对这个问题,分析了每次DMA的消息块长度与通信速率的关系,提出并实现了"大缓存方案";在网卡上采用大容量存储器作为缓存,发送方还可不等待接收方是否准备好,就发送数据,接收方网卡自动接收数据,传送长度小于1MB的消息时,收发双方各只需进行1次DMA,收发双方网卡自动完成512帧数据的传送;经实验测试,大尺寸消息的传送带宽有了很大提高。 相似文献