共查询到18条相似文献,搜索用时 93 毫秒
1.
目前,时域有限差分方法(Finite Difference Time Domain,FDTD)在电磁数值计算中已获得了广泛应用。对许多复杂电磁问题,FDTD 算法需要耗费巨大的计算机计算时间和存储空间,这成为FDTD 方法亟待解决的难题。本文提出了应用基于消息传递(Message Passing)方式实现FDTD 的并行算法。并对基于MPI 不同通信方式的并行FDTD 进行了效
率比较。采用MPI2.0 单边通信方式中的put 操作和主动对象同步(PSCW)方式,在一套16 个节点的Beowulf 型网络并行计算机系统上,实现了三维FDTD 并行程序,获得了较高的加速比和并行效率。 相似文献
2.
3.
4.
5.
基于并行基因表达式编程的网格资源分配算法 总被引:2,自引:0,他引:2
网格下的资源分配属于NP-难问题.为了更好地解决这个问题,文中首先提出了网格资源分配模型,并对资源个数与任务个数的三种不同情况进行了详细的分析,最后提出基于并行基因表达式编程的网格资源分配算法(Grid Resource Allocation Algorithm based on Parallel GEP,GRA-PGEP).该算法采用了基于资源与任务相关的非线性的编码方式和反转操作,同时应用粗粒度模型设计了该算法.仿真实验表明,GRA-PGEP算法在优化成功率、平均收敛代数以及耗时方面都要优于传统的GEP和GA算法. 相似文献
6.
提出一种H.264线程级并行编码算法,使相互间具有编码独立性的帧并行编码。节省等待时间。实验表明,该并行算法能有效提高编码速度。Intel的OpenMP API以及HTT(超线程技术)提供了实现H.264软件编码器并行算法的有效工具和硬件平台。 相似文献
7.
在大规模并行计算系统中,并行检查点触发大量结点同时保存计算状态,造成巨大文件存储空间开销,以及对通信和存储系统的巨大访问压力.数据压缩可以缩小检查点文件尺寸,从而降低存储空间开销以及对通信和存储系统的访问压力.但是,它也带来额外的压缩计算开销.本文针对异构并行计算系统,提出流水线式并行压缩检查点技术,采用一系列优化技术来降低压缩引入的计算延时,包括:流水线式双重写缓存队列、文件写操作的合并、GPU加速的流水压缩算法和GPU资源的多进程调度,等等.本文介绍了该技术在天河一号系统中的实现,并对所实现的检查点系统进行综合评测.实验数据表明该方法在大规模异构并行计算系统中是可行、高效、实用的. 相似文献
8.
介绍了一种快速收敛空间映射算法,改进了隐式空间映射算法中粗糙模型到精细模型之间参数映射。通过增加限定参数提取的方式,减少粗糙模型的参数空间而实现粗糙模型响应高效准确逼近精细模型响应。通过设计一个交叉耦合滤波器,与之前的隐式空间算法进行比较,更容易达到优化目标,证明了限定参数提取算法具有更快的逼近速度和更高的优化效率的优点。 相似文献
9.
现实世界的行为是并行的,因此为了研究现实世界的并行行为并且将其抽象模拟到计算机世界中,对于面向对象的并行技术的研究变得非常有意义。本文主要讨论了什么是面向对象的并行技术,并行技术的主要方式是并行计算,并行计算的一些新的发展趋势,并行计算面临的新挑战等问题。 相似文献
10.
解非均匀区域油藏模拟问题的一种有效并行计算方法 总被引:1,自引:0,他引:1
运用区域分解方法求解油藏模拟问题,结合灵活的区域划分和负载平衡策略,可以提高解题速度.但一般区域分解方法在应用中存在算法收敛慢,计算量增加,虽有一定加速比,但提高不大.特别是对非均匀区域的应用问题,子区域收敛速度不同引起的负载不均衡进一步导致性能下降.本文基于分布式并行系统,运用整体预处理改进区域分解方法,降低了非均匀油藏模拟问题的计算复杂性,提高了模拟计算的速度,并根据全局和本地负载状态调整区域划分,结合有效的负载平衡策略,达到对一类黑油模型油藏模拟问题高效的并行求解.实验结果表明,模拟速度有较大提高,并取得较高加速比. 相似文献
11.
12.
虽然快速多极子算法FMM(Fast Multipole Method)和多层快速多极子算法MLFMA(Multi-Level Fast Multipole Algorithm)是解决复杂目标电磁散射问题比较有效的方法,但是当问题的规模较大时,传统的串行FMM 和MLFMA难以胜任.本文在工作站网络系统NOW(Network Of Workstation)上采用并行处理技术来解决电大尺寸复杂目标电磁散射问题.结果表明:本文提出的并行解决方案与国内外相关成果相比不仅更具实用性,并行效率达到54%以上,且解决了串行方法难以解决的电磁散射问题,本文在四台DEC工作站构成的NOW系统上用32小时完成了未知量为160,000的雷达散射截面的计算. 相似文献
13.
将微粒群算法与并行计算模型相结合,基于三种不同的并行计算模型(带中央控制器的并行计算模型、环形结构带缓存区的并行计算模型、BSP并行计算模型),设计出相应的并行微粒群算法,并对并行算法性能进行详细分析。大量实验表明:子种群之间的通讯周期是个重要的可变参数,当选取合适时,能提高解的质量以及算法的收敛性和最优性。 相似文献
14.
并联机构的发展及应用 总被引:2,自引:0,他引:2
绍了国内外并联机构的发展,通过与串联机构的比较,详细说明了并联机构的特点及其在各个领域中的应用.六杆并联机构是并联机构的一种特殊形式,文中具体阐述了其工作原理,并结合上海第三代同步辐射装置软X谱学显微光束线中使用的特殊六杆并联调节机构,对其特点做进一步说明. 相似文献
15.
一种并行CRC算法的实现方法 总被引:1,自引:1,他引:1
简要分析了CRC算法的基本原理.在传统串行CRC的实现基础上,介绍了一种快速的CRC并行算法,导出了32位并行CRC码的逻辑关系,推导过程简单.与查表法比较,此并行算法不需要存储大量的余数表,可以减少延迟.同时,这种并行处理方法也适合于其他位宽并行CRC码.最后,利用ISE开发平台和Verilog HDL硬件描述语言进行设计,实现了基于此并行算法的32位并行CRC-32码的编码器,并给出了仿真和综合结果.设计出来的CRC编码器,已经成功应用于以太网的接入系统中. 相似文献
16.
计算机并口主要用来连接打印机,由于数据并行传输,所以传输速度相对较快。文中介绍了如何在VC .NET下,通过动态链接库W inIo对并口进行操作来模拟典型的总线时序。ATMEL的AT89S52单片机具有8 kB的Flash程序存储器,支持ISP(在系统下载),可以方便地升级程序。 相似文献
17.
18.
提出了基于故障映射的4值并行故障仿真方法.这一方法首先把电路划分成无扇出区域和扇出茎区域,然后将非扇出茎故障映射为扇出茎故障,减少了需要显式并行仿真的故障数目,提高了仿真器的性能.实验结果验证了文中方法的有效性. 相似文献