首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
代码生成作为并行编译器的后端,其生成代码的优劣直接影响着并行程序的执行效率。并行分解的维内存在偏移会产生维内通信,传统算法生成的维内通信代码不够精确,会产生冗余通信。提出了通过合并数组变量生成通信链,并按照通信链生成通信代码的维内通信优化算法来消除此类冗余,对传统算法进行了改进和优化。测试结果表明该算法对维内通信的优化效果明显。  相似文献   

2.
针对并行代码自动生成过程中产生的大量冗余通信代码,提出基于Define-Use分析的冗余通信消除算法。将中间代码的每一个过程划分为不同的块,同时收集各块中对数组变量的定义和引用信息。以块为节点,按控制流关系构造控制流图。以控制流图为基础,根据块间各数组变量的Define-Use关系,确定需要通信的位置,从而消除冗余通信代码,达到优化通信的目的。测试结果表明,该算法可有效提高并行程序的执行效率。  相似文献   

3.
基于线性不等式的数据划分方法的优化   总被引:1,自引:0,他引:1  
董春丽  赵荣彩  杜澎  王峥 《计算机应用》2007,27(5):1251-1253
计算和数据划分是串行程序并行化时所要解决的一个重要问题,如何对程序中引用的数据进行合理的分布以最大限度的发现程序的并行性减少数据重分布的通信开销,是并行编译优化的重点。给出的数据和计算的优化分解方法是基于Anderson-Lam的分解算法上改进得到的。根据Anderson-Lam的算法得到数据和计算划分后,以线性不等式的形式表示,然后通过分析循环嵌套中能够进行边界冗余的只读数组,重新构造数据划分不等式,根据此不等式进行数据分布,实现具有边界冗余的只读数组的数据划分,有效地减少了数据收发的通信量。  相似文献   

4.
分布存储系统中优化通信的冗余计算分割   总被引:1,自引:0,他引:1  
针对并行循环套序列,提出一种冗余计算分割的通信优化方法,根据数据流分析,文中给出用以确定每个循环套的冗余计算量的一般方法,并在此基础上提出冗余计算分割的实现和判定,针对规则依赖的程序,该文还提出了一个高效的冗余计算分割的实现方法,该技术已经在一个并行编译器中实现,试验结果表明,它比传统的通信优化技术有明显的优越性。  相似文献   

5.
对于高性能并行计算机而言,如何由给出的计算、数据划分信息及精确数组数据流分析信息自动生成并行化代码是实现串行程序并行化的一个重要问题。根据Saman P.Amarasinghe和Lam的定理,实现了一种并行化识别工具中MPI(Message Passing Interface)并行化代码自动生成技术的算法,并对该算法的性能进行分析。  相似文献   

6.
传统的控制系统难于实现设备之间以及系统与外界之间的信息交换,鉴于此,结合TMS320F2812内嵌的eCAN模块的特点和通信方式,设计一种基于嵌入式代码生成的CAN总线微型通信系统.  相似文献   

7.
戚湧  陈俊  李千目 《计算机科学》2016,43(2):163-168
可扩展的访问控制标记语言(eXtensible Access Control Markup Language,XACML)逐渐成为访问控制的标准之一。为了确保系统可用性,访问控制系统需要高效的XACML策略评估引擎。针对这一问题,从XACML策略本身潜在的不足出发,从冗余消除和属性数值化两个方面对XACML策略进行了优化。冗余消除在不影响策略评估结果的前提下去除策略库中的冗余规则,同时结合规则压缩消除规则间的冗余状态。属性数值化将文本的XACML策略属性转化为数值属性,使评估引擎匹配使用高效的数值匹配方式而不是低效的字符串匹配方式,同时使用Hash表结构存储数值属性与文本属性的映射关系有利于策略维护。仿真实验结果表明,提出的策略优化方法的性能与原始Sun XACML 相比有较大提升。  相似文献   

8.
孙敏  孙济洲  于策 《计算机工程与设计》2007,28(11):2513-2515,2523
并行结构骨架理论提供了一种描述并行程序设计模式的通用模型,对设计模式进行更高层次的抽象,能有效解决基于设计模式的并行程序设计方法的局限性问题,降低并行程序设计开发难度.基于并行结构骨架的并行程序设计环境--PASBPE在并行结构骨架理论的基础上,使用参数化设置快速生成用户所需并行程序框架,同时通过可视化的程序设计交互环境,简化并行程序的开发过程,提高开发效率.  相似文献   

9.
针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优化算法。该算法根据给出的过程间副作用集合和基于mpi_wait/mpi_irecv移动的重排序变换规则,有序地采用重排序变换和循环分布,尽可能安全地扩大点到点非阻塞通信中通信与计算的重叠窗口,使MPI自动并行化编译器生成具有更多计算重叠通信的消息传递代码。实验结果表明,该算法能够隐藏更多的点到点非阻塞通信开销,并且明显提升消息传递程序的加速比。  相似文献   

10.
L分析的线性矩阵不等式方法及其优化算法   总被引:1,自引:0,他引:1       下载免费PDF全文
富饶  杨莹  黄琳 《控制与决策》2004,19(3):247-251
通过采用S—过程和投影引理,得到了结构奇异值上界的LMI判据,该判据是基于状态空间描述的,从而消除了频率扫描过程和频率响应曲线拟合过程,并具有较好的数值性态,以该判据为基础,给出了计算结构奇异值上界的优化投影迭代算法,并将该方法应用于基准测试系统和典型电力系统,以验证其有效性,数值结果表明,该方法与经典频域方法和状态空间方法相比具有更好的求解效率。  相似文献   

11.
分布存储系统的并行编译器需要解决各局部存储器之间数据分布问题和各处理机之间通信优化问题。论文并行编程模型、代码和数据分布、通信优化以及代码生成问题四个方面论述了基于分布存储系统的并行编译关键技术并提出了进一步研究所要解决的问题。  相似文献   

12.
针对集群系统内存不足导致大规模矩阵无法调入的情况,设计并实现一种基于文件拆分与高斯消去的线性方程组求解算法,将大规模系数矩阵文件连续拆分为多个规模可控的子文件进行存储和计算,使服务器空闲内存小且具有较好的计算能力。在ABEEMσπ模型中的应用结果表明,当Altix3700服务器任务提交量大、CPU占有率高时,该算法仍可以计算出蛋白质分子的电荷分布。  相似文献   

13.
针对分布存储计算机系统并行编译过程中,为维持数据一致性而产生冗余通信的问题,提出一种优化的通信求解算法。该算法基于依赖关系分析和过程间数据流分析,通过遍历Define-Use图,获得更精确的通信数据,消除过程调用时产生的冗余通信。实验结果表 明,将算法所得结果作为后端生成MPI通信代码的依据,可以有效减少通信量,加速比接近手工MPI并行程序。  相似文献   

14.
非均匀稀布直线阵列通常具有较高的旁瓣,为了降低旁瓣,对传统遗传算法进行改进用于阵列优化。为了更好的解决早熟收敛问题,利用两级递阶遗传算法THGA(Two-level Hierarchic Genetic Algorithm)在各阵列电流激励幅度相同的情况下对阵元位置进行了优化,最大旁瓣降低至-15.2498dB。在各阵列电流激励幅度不同的情况下,提出了“微调”“粗调”的思想对激励和阵元位置同时进行优化。仿真结果表明,对于一个孔径为50λ的25个阵元组成的稀布直线阵列,可获得了更低的旁瓣,最大旁辩可降至-22.5955dB。  相似文献   

15.
基于迭代线性矩阵不等式的奇异摄动系统同时镇定   总被引:9,自引:2,他引:9  
研究了采用一个线性状态反馈控制器镇定多个线性奇异摄动系统的问题.同时镇定条件可以表达为一组矩阵不等式条件,所得条件与摄动参数无关,从而有效地回避了病态问题.采用基于快慢分解的两步法可以得到镇定控制器增益和相应的Lyapunov函数.而在每一步需要利用迭代线性矩阵不等式技术求解相应的双线性矩阵不等式,相关定理研究了算法的收敛性.本文所得结论可同时适用于标准与非标准奇异摄动系统.文末给出了相应的仿真算例.  相似文献   

16.
针对分布存储结构计算机系统在并行编译过程中存在的问题,提出一种消除冗余通信的暴露集求解算法,分另4采用数组数据流分析和自干扰分析技术对嵌套循环中的流依赖和输入依赖进行分析,从而得到暴露集空间。仿真实验结果表明,将该算法所得结果作为后端生成数据分布通信代码的依据,可有效消除冗余通信,提高系统整体性能。  相似文献   

17.
原先锋交换网每传送1帧(2KB)数据,发送方和接收方都分别要启动1次DMA,1M字节的数据需要发送方和接收方都启动512次DMA,启动1次DMA花费的时间几乎占了消息在网络上传送时间的一半;针对这个问题,分析了每次DMA的消息块长度与通信速率的关系,提出并实现了"大缓存方案";在网卡上采用大容量存储器作为缓存,发送方还可不等待接收方是否准备好,就发送数据,接收方网卡自动接收数据,传送长度小于1MB的消息时,收发双方各只需进行1次DMA,收发双方网卡自动完成512帧数据的传送;经实验测试,大尺寸消息的传送带宽有了很大提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号