共查询到18条相似文献,搜索用时 78 毫秒
1.
代码生成作为并行编译器的后端,其生成代码的优劣直接影响着并行程序的执行效率。并行分解的维内存在偏移会产生维内通信,传统算法生成的维内通信代码不够精确,会产生冗余通信。提出了通过合并数组变量生成通信链,并按照通信链生成通信代码的维内通信优化算法来消除此类冗余,对传统算法进行了改进和优化。测试结果表明该算法对维内通信的优化效果明显。 相似文献
2.
3.
基于线性不等式的数据划分方法的优化 总被引:1,自引:0,他引:1
计算和数据划分是串行程序并行化时所要解决的一个重要问题,如何对程序中引用的数据进行合理的分布以最大限度的发现程序的并行性减少数据重分布的通信开销,是并行编译优化的重点。给出的数据和计算的优化分解方法是基于Anderson-Lam的分解算法上改进得到的。根据Anderson-Lam的算法得到数据和计算划分后,以线性不等式的形式表示,然后通过分析循环嵌套中能够进行边界冗余的只读数组,重新构造数据划分不等式,根据此不等式进行数据分布,实现具有边界冗余的只读数组的数据划分,有效地减少了数据收发的通信量。 相似文献
4.
5.
对于高性能并行计算机而言,如何由给出的计算、数据划分信息及精确数组数据流分析信息自动生成并行化代码是实现串行程序并行化的一个重要问题。根据Saman P.Amarasinghe和Lam的定理,实现了一种并行化识别工具中MPI(Message Passing Interface)并行化代码自动生成技术的算法,并对该算法的性能进行分析。 相似文献
6.
7.
并行结构骨架理论提供了一种描述并行程序设计模式的通用模型,对设计模式进行更高层次的抽象,能有效解决基于设计模式的并行程序设计方法的局限性问题,降低并行程序设计开发难度.基于并行结构骨架的并行程序设计环境--PASBPE在并行结构骨架理论的基础上,使用参数化设置快速生成用户所需并行程序框架,同时通过可视化的程序设计交互环境,简化并行程序的开发过程,提高开发效率. 相似文献
8.
线性矩阵不等式及其在控制工程中的应用 总被引:9,自引:0,他引:9
介绍了线性矩阵不等式的基本概念和用于求解线性矩阵不等式的软件工具箱Matlablmi的3个求解器,对线性矩阵不等式在控制系统中的应用作了详细的综述。分析了其在当前的两个研究热点,即不确定系统的鲁棒 控制与鲁棒滤波中的运用,同时探讨了时滞系统与非线性系统的研究现状,然后列举了一些具有代表性的采用LMI求解控制问题的最新结果,为了说明线性矩阵不等式的求解过程,给出了一个保性能控制的例子,在Matlab 5.3编辑器中运行程序,得到的结果是最优性能指标,copt=J^*10.6777。 相似文献
9.
可扩展的访问控制标记语言(eXtensible Access Control Markup Language,XACML)逐渐成为访问控制的标准之一。为了确保系统可用性,访问控制系统需要高效的XACML策略评估引擎。针对这一问题,从XACML策略本身潜在的不足出发,从冗余消除和属性数值化两个方面对XACML策略进行了优化。冗余消除在不影响策略评估结果的前提下去除策略库中的冗余规则,同时结合规则压缩消除规则间的冗余状态。属性数值化将文本的XACML策略属性转化为数值属性,使评估引擎匹配使用高效的数值匹配方式而不是低效的字符串匹配方式,同时使用Hash表结构存储数值属性与文本属性的映射关系有利于策略维护。仿真实验结果表明,提出的策略优化方法的性能与原始Sun XACML 相比有较大提升。 相似文献
10.
11.
12.
分布存储系统的并行编译器需要解决各局部存储器之间数据分布问题和各处理机之间通信优化问题。论文并行编程模型、代码和数据分布、通信优化以及代码生成问题四个方面论述了基于分布存储系统的并行编译关键技术并提出了进一步研究所要解决的问题。 相似文献
13.
14.
非均匀稀布直线阵列通常具有较高的旁瓣,为了降低旁瓣,对传统遗传算法进行改进用于阵列优化。为了更好的解决早熟收敛问题,利用两级递阶遗传算法THGA(Two-level Hierarchic Genetic Algorithm)在各阵列电流激励幅度相同的情况下对阵元位置进行了优化,最大旁瓣降低至-15.2498dB。在各阵列电流激励幅度不同的情况下,提出了“微调”“粗调”的思想对激励和阵元位置同时进行优化。仿真结果表明,对于一个孔径为50λ的25个阵元组成的稀布直线阵列,可获得了更低的旁瓣,最大旁辩可降至-22.5955dB。 相似文献
15.
16.
原先锋交换网每传送1帧(2KB)数据,发送方和接收方都分别要启动1次DMA,1M字节的数据需要发送方和接收方都启动512次DMA,启动1次DMA花费的时间几乎占了消息在网络上传送时间的一半;针对这个问题,分析了每次DMA的消息块长度与通信速率的关系,提出并实现了"大缓存方案";在网卡上采用大容量存储器作为缓存,发送方还可不等待接收方是否准备好,就发送数据,接收方网卡自动接收数据,传送长度小于1MB的消息时,收发双方各只需进行1次DMA,收发双方网卡自动完成512帧数据的传送;经实验测试,大尺寸消息的传送带宽有了很大提高。 相似文献
17.
针对OMAP架构处理器中Linux操作系统无法满足强实时性应用的技术难题,提出了一种通用可靠、实时性强的双核通信设计方法。通过事件同步和自陷中断的方式提高了处理器的响应速度,通过乒乓缓冲设计实现了数据的零拷贝,显著提高了操作系统的实时响应速度和稳定度,为双核通信机制提供了一种标准化的设计方法,对于低成本、高性能无线终端的研制,具有积极的参考意义。 相似文献
18.
为了提高软件开发的质量和效率,代码自动生成是当前的研究热点,代码自动生成的性能是其中的重要问题.现有代码自动生成的性能分析方法较简单,难以评估代码自动生成过程中程序员与代码自动生成工具各自的特征.本文综合考虑了代码自动生成过程中程序员与代码自动生成工具的作用,提出了一种基于半监督学习的代码自动生成性能评估方法,通过抽取... 相似文献