首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 85 毫秒
1.
基于SMP机群的层次化并行编程技术的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
祝永志  张丹丹  曹宝香  禹继国 《电子学报》2012,40(11):2206-2210
 针对多核SMP机群的体系结构特点,讨论了MPI+OpenMP混合并行程序设计技术.提出了一种多层次化混合设计新方法.设计了N-body问题的多层次化并行算法,并在曙光5000A机群上与传统的混合算法作了性能方面的比较.结果表明,该层次化混合并行算法具有更好的扩展性和加速比.  相似文献   

2.
针对CFD程序中常见的自相关循环结构,文章分析了波前并行技术不能对其进行并行化的原因,针对其相关实质,提出了自相关循环的镜像分解技术,通过消除跨迭代的反相关,实现自相关循环结构的波前并行,完成自相关循环的并行化。  相似文献   

3.
三角形光栅化是将顶点插值转换为像素片段的图形处理过程,是图形处理的关键环节。当前,光栅化插值扫描主要依靠单扫描线方法,然而随着硬件技术的发展,当前单扫描线方法已无法充分利用高速并行的硬件资源,极大限制图形处理速度。因此,文章提出一种并行扫描的三角形光栅化方法,利用多线程并行扫描方式加快水平跨度的计算,缩短光栅化处理时间并提高图形处理效率。在算法仿真平台设计实现并进行验证,得到良好的性能和质量指标,满足准确实时的三角形光栅化要求。  相似文献   

4.
Turbo乘积码(TPC)作为一种高码率编码在带限通信系统中有着广泛的应用,但是大多数TPC译码器存在结构复杂、资源消耗高、处理时延大的问题.为此,提出了一种交错并行流水线处理结构的译码器,并通过译码过程中测试序列的合理排序以及使用相关运算代替最小欧式距离计算等算法优化设计,简化了译码器的实现复杂度,现场可编程门阵列(FPGA)资源消耗相比传统设计降低了35%,提高了译码速度.在Xilinx公司的FPGA芯片XC5VSX95T上完成了译码器的硬件实现,达到80 Mbit/s的译码速度,通过增加子译码器个数还可进一步提升译码吞吐率.  相似文献   

5.
6.
利用PVM建立PC机群环境,并在此环境中开展并行研究。分别采用串行与并行的计算方法实现了图像的平滑处理。在并行计算中。对大小不同的图像分别进行了并行计算,得出对应的处理时间以及所获得的加速比。最后采用了一种改进的算法实现了图像处理。针对所获得的实验数据,得出加速比较低,通过采用数据本地化的优化措施.有效地提高了并行加速比.达到了良好的性能效果。通过对实验结果的分析可知,当前的并行处理的实施对于处理数据传输量很小的求解问题上有一定的性能效果.只有网络性能达到一定程度的时候,并行处理就可以应用在普通问题规模上.并能够取得良好的处理速度。  相似文献   

7.
随着FTTH和三网融合项目建设,我国城市及乡村大量使用蝶形引入光缆。在空间有限的城区和住宅分布较广的郊区以及乡村,传统的蝶形引入光缆在施工中存在施工操作量大、施工困难等问题。因此如何解决施工问题,研制一款可靠性和适用性高的光缆,已成为光缆生产商首要解决的问题。本文介绍了一种对称并行蝶形引入光缆,避免了重复性施工,克服施工中存在的困难。  相似文献   

8.
双单片机系统中一种简单的并行数据传输模式   总被引:3,自引:1,他引:3  
在研究了74HC573特点的基础上,首先提出了一种双CPU之间数据交换的方法,然后结合开发实例,给出了实现该数据交换的时续图,该方法只需要增加很少的硬件成本,很适合在单片机系统中采用。  相似文献   

9.
本文提出了在集中式控制的多机系统中设计和使用的一种经济、简单和易控的并行通信总线,以及它的组成和通信控制方式。  相似文献   

10.
本文介绍了一种并行加速计算机的新概念、结构及应用。使用并行加速机可使现有的计算机系统在性能上更新换代,且方法简单,经济有效。  相似文献   

11.
构建了一种适用于多核集群的混合并行编程模型.该模型融合了共享内存的面向任务的TBB编程和基于消息传递的MPI编程两种模式.结合两者的优势,实现进程到处理节点和进程内线程到处理器核的两级并行.相对于单一编程方式下的程序性能,采用这种混合并行编程模型的算法不但可以减少程序执行时间,获得更好的加速比和执行效率,而且明显地提高了集群性能.  相似文献   

12.
自编离散客体照相模拟程序DORS在MPI下采用主从式编程模型实现了并行化,采用分段法把伪随机数的生成大致平均分给各个子进程独立计算,实现了并行计算所使用的伪随机数序列和串行的完全一致,保证了并行计算结果与串行的一致,提高了离散客体的MC模拟效率,从而有效地解决了计算量大、串行算法执行时间过长的问题.  相似文献   

13.
基于MPI的集群系统的研究   总被引:1,自引:0,他引:1  
MPI 是目前集群系统中最重要的并行编程工具, 它采用消息传递的方式实现并行程序间通信.本文研究如何实现一个基于MPI的集群计算系统,并利用一个并行程序实例设计了一个linux集群,对linux集群系统进行了性能评测  相似文献   

14.
小卫星分布式雷达仿真系统的集群技术实现   总被引:2,自引:0,他引:2  
提出了一种基于PC Linux集群的小卫星分布式雷达仿真系统体系结构,为此类仿真提供了一种具有良好可扩展性的解决途径;采用CVS服务器和邮件列表技术,在集群网络上实现了透明化的软件开发管理;应用基于MPI的集群并行运算技术提高了系统的计算能力。  相似文献   

15.
针对基于MPI的传统FDTD并行算法存在的缺点,提出了优化的FDTD两级化并行算法。结合MPI和OpenMP编程模型的特点,实现了基于SMP集群系统平台的MPI-OpenMP混合编程模型的两种并行FDTD算法。在实验室搭建的SMP集群系统平台上,通过对一金属长方体的散射问题分析,把混合编程算法同基于MPI的FDTD并行算法进行了比较。结果表明,混合并行算法具有更好的加速比和带宽利用率。  相似文献   

16.
以IBM BladeCenter高性能集群系统性能测试为背景,研究大规模集群的性能测试与优化方法.通过对基于区域分解大规模线性方程组中并行求解算法在4个测试方案下的测试和分析,得到了其加速性能随计算节点数的变化曲线.结果表明,该高性能计算机集群具有很好的加速性能、稳定性,达到了预期的测试目标,为基于该并行平台的进一步并行开发研究奠定了基础.  相似文献   

17.
针对网格划分的并行思想,以大型矩阵乘法为例,讨论了机群下并行子任务间分配策略的优化.描述了对矩阵实行网格划分的基本方法和并行算法的设计过程,并研究了在机群环境下的实现.分析了非理想状态下原有算法存在的不足,主要讨论了在网格阵列处理机上,如何对并行子任务进行优化分配,提出了一种合理的分配策略.通过实验结果分析,验证了该思想的正确性和实用性.  相似文献   

18.
布局问题理论上属于NPC问题,在工程实践中经常遇到复杂机电产品的布局问题.为了较好的解决这样的问题,文章以模拟退火算法为基础,针对其早熟和收敛速度慢的缺陷加以改进,给出了并行算法和模拟退火算法相结合的算法。该算法用MPI和VC混合编程,并且加入网格服务策略,可以在多台机器上联合运行,一方面可以为模拟退火算法选择更好的运行结果,另一方面可以加快算法的运算效率。  相似文献   

19.
董勇  翁代云 《现代电子技术》2007,30(4):146-149,152
当前,集群是流行的并行计算平台,既具有所有并行计算都具备的一般特性,又具有自己独有的特性———节点计算资源的异构性、节点计算资源的非独占性、对节点间通信的敏感性。针对基于集群环境的并行计算,对非独占、异构、同步LogGP模型NHBL(Nondedicated Heterogeneous Barrier Log GP model)进行改进,提出了一种更实用的计算模型,即考虑网络拥塞的非独占、异构、同步LogGP模型NHCBL(Nondedicated Heterogeneous Barrier Log GP model considering Conges-tion)。NHCBL模型既比较准确地描述了并行计算的一般特性,又比较准确地描述了基于集群的并行计算独有的节点计算资源的异构性、节点计算资源的非独占性、对节点间通信的敏感性,其描述比NHBL模型更全面也更准确。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号