首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
高性能并行仿真程序必须采用针对性的并行优化技术以获得高效的性能加速。而根据程序特性,确定适合的并行粒度是设计并行优化技术的基础。因此,以典型合成孔径雷达(SAR)成像程序--距离-多普勒(RD)程序为代表,研究了高性能SAR成像程序的并行粒度选择技术,重点针对并行粒度的基本准则和RD算法的并行粒度选择方法进行了研究。实验结果证明,经过并行粒度优化选择的SAR成像程序能够获得显著的性能提升,并且具有良好的可扩展性。  相似文献   

2.
合成孔径雷达SAR(Synthetic Aperture Radar)成像仿真对处理速度和存储空间都有很高的要求,因此基于并行计算平台的局部性优化技术成为了降低访存开销、提高SAR成像速度的关键技术之一。以典型SAR成像仿真程序——R-D程序为代表,研究SAR成像并行仿真中的访存局部性优化技术,重点根据循环变换和数据布局变换的局部性优化理论,提出对大规模SAR回波数据进行转置和分块的局部性优化技术。实验结果证明,经过访存局部性优化的SAR成像程序能够获得显著的性能提升。  相似文献   

3.
在星载合成孔径雷达(SAR)回波仿真时域算法和基于FFT的频域模拟算法的基础上,对星载SAR回波仿真的并行化算法进行了研究。基于通用计算机平台构成机群,采用SOCKET通信机制进行消息传递及数据传送,实现了回波仿真的并行化处理。通过对并行算法加速性能的分析,证明了该算法能有效地加速回波仿真的进程。利用Chirp Scaling(CS)算法对仿真数据进行成像,验证了该算法的有效性。  相似文献   

4.
图划分成功地应用在许多领域,但应用于并行计算时,使用边割度量通信量,其主要缺点是不能准确代表通信量,而且图划分模型没有考虑通信延迟和通信额外开销的分布对并行性能的影响.提出了改进的图划分模型,该模型将影响并行性能的多个要素(通信延迟、最大的局部通信额外开销和整体通信额外开销)整合到一个统一的代价函数,不仅克服了图划分模型中边割度量的一些缺点,而且可以通过调整加权参数,处理不同的优化目标和强调不同因素对并行性能的影响.  相似文献   

5.
针对现有通信优化算法无法使MPI自动并行化编译器生成加速比理想的消息传递程序问题,提出了一种基于重排序变换和循环分布的通信优化算法。该算法根据给出的过程间副作用集合和基于mpi_wait/mpi_irecv移动的重排序变换规则,有序地采用重排序变换和循环分布,尽可能安全地扩大点到点非阻塞通信中通信与计算的重叠窗口,使MPI自动并行化编译器生成具有更多计算重叠通信的消息传递代码。实验结果表明,该算法能够隐藏更多的点到点非阻塞通信开销,并且明显提升消息传递程序的加速比。  相似文献   

6.
Alltoall是一种重要的MPI(message passing interface)集合通信类别,是影响许多并行程序并行效率的重要因素。但对于大规模并行计算机上Alltoall集合通信的评测和理论分析仍较为缺乏,导致许多应用程序的通信模块设计和使用不合理。首先,开展了MPI基本通信性能的测试和分析,发现随着MPI进程数的增加,其性能波动也增加,而这种波动源自网络竞争。为此,在传统的Alltoall性能评估模型中引入了网络竞争因素,新模型不仅考虑传统的通信带宽和通信延迟参数,还考虑了通信竞争因素。某国产并行机平台上的测试结果显示:引入网络竞争模型的新Alltoall性能评估模型可以较为准确地预估Alltoall性能,体现出网络竞争开销对Alltoall性能的影响。  相似文献   

7.
通信信息并行传输效率是衡量移动通信网络系统性能的重要指标。为了提高移动网络信息通信速率,研究通信延迟对信息并行传输的影响。根据移动网络通信理论和IEEE802.11协议对移动网络信息并行通信过程进行分析,构建移动通信网络模型,得到串行延时、"数据包"的串行延时、路由延时、传播延时等参数,获取移动通信延迟与信息并行传输效率之间的约束关系,分析各个延迟参数对信息并行通信速率的影响。仿真结果表明,随着通信延迟的不断变化,信息并行传输速率也在发生变化,因此降低通信延迟能最大程度地提高信息并行传输速率。  相似文献   

8.
申威众核片上多级存储层次是缓解众核“访存墙”的重要结构.完全由软件管理的SPM结构和片上RMA通信机制给应用性能提升带来很多机会,但也给应用程序开发优化与移植提出了很大挑战.为充分挖掘片上存储层次特点提升应用程序性能,同时减轻用户编程优化负担,本文提出了一种多级存储层次访存与通信融合的编译优化方法.该方法首先设计了融合编译指示,将程序高层信息传递给编译器.其次构建了编译优化收益模型并设计了启发式循环优化方案迭代求解框架,并由编译器完成循环优化方案的求解和优化代码的变换.通过编译生成的DMA和RMA批量数据传输操作,将较低存储层次空间中高访问延迟的核心数据批量缓冲进低访问延迟的更高存储层次空间中.在三个典型测试用例上进行了优化实验测试与分析,结果表明本文所提出的优化在性能上与手工优化相当,较未优化版程序性能有显著提升.  相似文献   

9.
讨论了已有的TDMA算法在端到端延时上的弊端,在优化时隙数的基础上引入链路的使用顺序与数据流向的相关性,提出了分布式TDMA调度算法,利用反向平衡聚合树的生成过程分配时隙,通过控制链路染色顺序分布式优化延时与避免冲突。仿真结果验证了算法在端到端延迟和通信开销上的性能提升。  相似文献   

10.
合成孔径雷达SAR是一种主动式的对地观测系统.近年来SAR逐渐朝着多平台化发展,陆续出现了在无人机、探测车等小型移动平台上.SAR成像是运行在SAR上的成像程序,由于新的特殊运行环境的出现、其对低能耗和高算力有了更严格的要求.如何针对特定的平台,提供高性能、低功耗的应用支持,便成为其核心要点.对SAR成像计算和访存等特征进行了分析,针对性地进行了程序优化并测试了该程序在x86平台上的性能,以获得可靠的性能参考.在此基础上,面向DSP+FFT加速器的硬件结构,构建了一个算力配比数学模型,为硬件设计提供解决方案.  相似文献   

11.
王浩  张伟  谢旻  董勇 《计算机工程与科学》2020,42(11):1981-1987
MPI collective communication operation is widely used in parallel scientific application, which has an important influence impact on the scalabilityof the program. Tianhe interconnect network supports the trigger communication operations, which can offload the messaging and processing work and improve the performance between nodes. Allreduce and Reduce algorithms under different tree topological structures are designed by using thetriggered operations to lower the latency the reduction operation communication between nodes. Tests based on the actual system platform show that that, compared with the point to point implementation of these two types of operations in MPICH, the offload algorithm based on trigger can reduce the running time by up to 59.6% at different node scales.  相似文献   

12.
随着粒子模拟并行计算在相关领域应用的不断深入和并行节点计算能力的不断增强,粒子模拟并行程序中通信耗时对整体性能的影响越来越显著,甚至成为主要性能瓶颈.本文在分析影响并行程序通信性能多种因素的基础上,从进程划分方式选择、通信协议优化的角度,对1个典型粒子模拟并行程序——二维宏观拟颗粒并行模拟程序在千兆以太网环境下的通信性能的优化策略进行了测试研究,通过改进并行进程划分方式,采用用户级通信协议等方法,使测试程序通信性能获得明显提高,进而提出了粒子模拟并行程序通信性能优化的思路和建议.  相似文献   

13.
朱承元  杨涤  翟坤 《计算机仿真》2004,21(4):151-154
为了测试SAR星星载计算机软件及硬件接口实时性能,该文基于dSPACE实时系统设计了SAR星姿态控制实时仿真系统。介绍了该系统的硬件结构和Simulink模型。采用Simulink和Stateflow建立了该系统的RS232/RS422串行口通信接口模型。仿真结果表明了SAR星姿态控制实时仿真系统和串行口通信接口模型的正确性。  相似文献   

14.
Latency measures the delay caused by communication between processors and memory modules over the network in a parallel system. Using intensive measurements and simulation, we show that network latency forms a major obstacle to improving parallel computing performance and scalability. We present an experimental metric, using network latency to measure and evaluate the scalability of parallel programs and architectures. This latency metric is an extension to the isoefficiency function [Grama et al., IEEE Parallel Distrib. Technology 1, 3 (1993), 12-21] and iso-speed metric [Sun and Rover, IEEE Trans. Parallel Distrib. Systems 5, 6 (1994), 599-613]. We give a measurement method for using this latency metric, and report the experimental results of evaluating the scalabilities of several scientific computing algorithms on the KSR-1 shared-memory architecture. Our analysis and experiments show that the latency metric is a practical method to effectively predict and evaluate scalability based on measured latencies inherent in the program and the architecture.  相似文献   

15.
进行合成孔径雷达(SAR)成像仿真是研究成像雷达的一个重要手段。本文在分析SAR成像仿真机理的基础上,提出了一种利用视景仿真软件Vega进行SAR实时成像的仿真方法。利用软件平台VC++、Multigen Creator和Vega设计机载合成孔径雷达(SAR)成像仿真系统,分析了影响机载SAR成像质量的各种参数,论述了利用Vega的雷达仿真模块——RadarWorks开发机载SAR成像仿真软件的流程以及整体系统的实现等关键技术。  相似文献   

16.
针对SAR成像中图像模糊并伴有噪声的问题,结合噪声可见性函数,提出了一种SAR图像增强快速算法。该算法在图像分层的基础上,结合人眼视觉特性,引入噪声可见性函数,实现细节层图像的增益控制。根据GPU架构和存储结构特点,并行计算各个像素在基本层和细节层上的处理过程,完成该算法的并行优化设计与实现。实验结果表明,该算法能够有效提高图像质量,增强图像细节;同时,能够充分利用GPU的并行计算能力,有效提高SAR图像增强的实时性。  相似文献   

17.
并行处理仿真为并行系统的建模分析,并行算法的模拟执行以及并行环境的性能评价提供支持,本文利用任务相关仿真时钟和重叠时间片建立了一种支持完全并和用户并发方式的并行多任务模型,并结合对不同调度算法和互连结构的仿真实验,着重分析了任务调度对系统性能的影响以及互连网络技术与通信开销的关系。同时,仿真环境还提供模拟执行的并发度曲线和任务执行踪迹供和户分析调试并行程序。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号