共查询到20条相似文献,搜索用时 125 毫秒
1.
2.
提出了在由微机互连构成的机群(COW)并行计算系统上应用信息传递的方式实现粗糙地面散射并行FDTD算法.综合考虑了区域分割和负载平衡因素,并详细分析了子区域在普通网格和吸收边界处与相邻子区域的场值的数据传递,提高了二维粗糙地面FDTD并行计算效率.解决了在计算电大尺寸粗糙地面散射时产生的内存不足和计算耗时长等瓶颈问题.理论分析和数值计算结果验证了该算法的正确性;当计算电大尺寸的粗糙地面散射时,并行效率提升明显,即当参与计算的处理器数量达到6个时,并行效率仍然可以保持在90%以上. 相似文献
3.
三维电磁散射的网络并行FDTD计算和加速比分析 总被引:10,自引:5,他引:5
应用计算机局域网,采用基于消息传递PVM平台和区域分解技术,实现了三维电磁散射的并行FDTD计算.给出了在FDTD两个相邻子区域交界面上所需要传递数据量的估算和分析.在一个实际的计算机局域网环境下,测试了网络并行FDTD计算三维机翼目标散射时的并行加速比和并行效率.实际上,并行加速比和效率不仅与局域网的硬件性能有关,而且与子区域的划分和PVM通信原语的使用等软件设计有关.最后,讨论并行计算中的附加通信量、网络通信性能和负载平衡对FDTD并行计算的影响. 相似文献
4.
5.
利用基于图形处理器(Graphics Processing Unit, GPU)的并行时域有限差分(Finite Difference Time Domain, FDTD)法计算一维粗糙海面及其上方二维漂浮目标的复合电磁散射.采用各向异性完全匹配层(Uniaxial Perfectly Matched Layer, UPML)吸收边界作为截断边界, 为了便于并行程序的设计, 在整个计算区域使用UPML吸收边界差分公式进行迭代.利用异步通信技术来隐藏主机和设备之间的通信时间, 同时使用片上的共享存储器提高读取速度, 进一步对程序进行优化, 得到很好的加速比, 证明了该方法的计算高效性.通过与串行FDTD法以及串行矩量法获得的数值结果进行比较, 验证了该并行方法的正确性, 进而研究了海面上方类似舰船漂浮目标的电磁散射特性, 讨论了入射角、海面风速以及目标吃水深度对双站散射系数的影响. 相似文献
6.
利用显卡(Graphics Processing Unit, GPU)加速时域有限差分(Finite-Difference Time Domain, FDTD)法计算二维粗糙面的双站散射系数, 介绍了FDTD的理论公式以及计算模型.采用各向异性完全匹配层(Uniaxial Perfectly Matched Layer, UPML)截断FDTD计算区域.重点讨论了基于GPU的并行FDTD计算粗糙面双站散射系数的并行设计方案计算流程.在NVIDIA GeForce GTX 570显卡上获得了50.7×的加速比.结果表明:通过对FDTD计算粗糙面散射问题的加速, 极大地提高了计算效率. 相似文献
7.
探讨了基于OpenMP的电磁场FDTD多核并行程序设计的方法,以期实现该方法在更复杂的算法中应用具有更理想的性能提升。针对一个一维电磁场FDTD算法问题,对其计算方法与过程做了简单描述。在Fortran语言环境中,采用OpenMP+~粒度并行的方式实现了并行化,即只对循环部分进行并行计算,并将该并行方法在一个三维瞬态场电偶极子辐射FDTD程序中进行了验证。该并行算法取得了较其他并行FDTD算法更快的加速比和更高的效率。结果表明基于OpenMP的电磁场FDTD并行算法具有非常好的加速比和效率。 相似文献
8.
9.
10.
11.
从互联网上挖掘大量双语平行句对,可以快速有效地构建大规模双语资源,服务于统计机器翻译。从挖掘对象的不同,将网络数据源分成对照网页和平行网页两类,提出一种抽取双语句对的方法。首先,从上述两类网页中分别抽取平行文本段,对照网页文本段抽取的主要方法为页面过滤和模板匹配,而平行网页依赖于网页结构的相似,采用对应节点匹配方法;其次,采用Gale-Church算法进行句对齐,得到平行句对;最后统一进行后处理。实验结果表明,从对照网页获取平行句对的准确率达到93.3%,平行网页为93.5%。 相似文献
12.
13.
并联均流技术在高频开关电源中的应用研究 总被引:6,自引:0,他引:6
郑耀添 《微电子学与计算机》2006,23(6):169-171
随着分布式电源系统的发展。开关电源并联技术的重要性日益增加。研制大功率、高性能的开关电源是人们不断努力和追求的目标。文章介绍了电源模块并联供电的优势,并论述了几种并联均流电路的工作过程及优缺点,还探讨了UC3907在开关电源并联均流系统中的应用。 相似文献
14.
帧同步扰码器的并行化技术 总被引:6,自引:0,他引:6
在同步数字系列(SDH)的集成系统中,需要用到并行扰码技术。本文提出了一种扩展矩阵的方法,使传统的矩阵法可以用来实现任意路数的并行扰码器。本文还提出了一种新的实现并行扰码的方法──延时因子法。由此实现的SDH8路并行扰码器已被用于专用集成电路中。 相似文献
15.
16.
17.
This paper proposes an object oriented model scheduling for parallel computing in media MultiProcessors System on Chip (MPSoC). Firstly, the Coarse Grain Data Flow Graph (CGDFG) parallel programming model is used in this approach. Secondly, this approach has the feature of unified abstraction for software objects implementing in processor and hardware objects implementing in ASICs, easy for mapping CGDFG programming on MPSoC. This approach cuts down the kernel overhead and reduces the code size effectively. The principle of the oriented object model, the method of scheduling, and how to map a parallel programming through CGDFG to the MPSoC are analyzed in this approach. This approach also compares the code size and execution cycles with conventional control flow scheduling, and presents respective management overhead for one application in media-SoC. 相似文献
18.
高码率LDPC码译码器的优化设计与实现 总被引:1,自引:0,他引:1
本文以CCSDS推荐的7/8码率LDPC码为例,提出了一种适于高码率LDPC码译码器的硬件结构优化方法。高码率的LDPC码通常也伴随着行重与列重的比例较高的问题。本方法是在拆分校验矩阵的基础上,优化常用的部分并行译码结构,降低了高码率LDPC码译码时存在的校验节点运算单元(CNU)与变量节点运算单元(VNU)之间的复杂度不平衡,并由此提高了译码器的时钟性能。实验证明,本文方案提供的结构与常用的部分并行译码结构相比,节省硬件资源为41%;采用与本文方案相同的硬件资源而未经矩阵拆分的部分并行译码方案的码速率为本文方案的75%。 相似文献
19.
20.
A parallel FDTD algorithm using the MPI library 总被引:10,自引:0,他引:10
In this paper, we describe the essential elements of a parallel algorithm for the FDTD method using the MPI (message passing interface) library. To simplify and accelerate the algorithm, an MPI Cartesian 2D topology is used. The inter-process communications are optimized by the use of derived data types. A general approach is also explained for parallelizing the auxiliary tools, such as far-field computation, thin-wire treatment, etc. For PMLs, we have used a new method that makes it unnecessary to split the field components. This considerably simplifies the computer programming, and is compatible with the parallel algorithm 相似文献