共查询到19条相似文献,搜索用时 211 毫秒
1.
矩量法是广泛使用的高精度电磁数值算法之一。在仿真复杂电磁问题时,该算法需要处理大型复数稠密矩阵方程,这导致其面临内存需求高、计算时间长的问题。与传统基函数相比,本文采用的高阶多项式基函数能够在保证计算精度的前提下大幅度降低未知量,进而降低矩阵阶数。在此基础上,本文设计了基于分块矩阵的高效并行策略,在国内超级计算机平台开展了并行高阶矩量法的超级电磁计算研究,大幅度提升了矩量法的仿真能力。在国产神威蓝光超级计算机上,以机载天线阵列的辐射特性计算为例,对并行规模高达30720 CPU核时的算法性能进行了评估,测试结果表明算法在并行规模扩大20倍以上时仍可获得50%以上的并行效率。在当前排名世界第一的天河2号超级计算机上,以飞机散射特性计算为例,对并行规模高达201600 CPU核时的算法性能进行了评估,测试结果表明算法在并行规模扩大约8倍时可获得50%以上的并行效率。数值仿真结果表明并行高阶矩量法可以在不同架构的超级计算机上高效完成复杂电大目标的精确电磁计算。 相似文献
2.
3.
4.
5.
多线程并行运行的软件在提高性能的同时,其交互的组合随着程序规模增大变得更为复杂,给软件的设计与验证带来了挑战.本文从常见的并行缺陷入手,提出使用模型检测的方法对其进行检测和分析,实践表明,使用该方法可有效检测此类并行缺陷. 相似文献
6.
并行计算水下大尺度弹性壳体的低频声散射 总被引:2,自引:0,他引:2
有限元与边界元耦合模型是研究水下弹性壳体目标低频声散射常用的数值方法。应用该模型计算大尺度弹性目标的声散射时需要大量的计算时间与存储空间,采用并行数值的方式可以解决这一问题。首先并行计算生成有限元矩阵和边界元矩阵,然后应用并行化的广义极小残差(GMRES)迭代算法求解大型非对称线性方程组。详细叙述了并行GMRES(m)迭代算法的执行过程,并以球壳的声散射计算为例分析了迭代步数对算法收敛情况的影响。最后计算了Benchmark目标模型的低频散射声场,分析了其收发分置散射目标强度以及表面声场的分布。 相似文献
7.
基于散射中心的雷达目标SVM识别方法 总被引:1,自引:0,他引:1
为减少经典目标识别算法中的计算量与模板存储量,本文将雷达目标散射中心作为目标识别的特征,通过支持向量机(SVM)方法分类目标.首先,采用基于传播算子的多重信号特征法(PM-MUSIC)提取雷达目标散射中心参数;其次,计算散射中心的中心矩以建立统一标准的识别特征,并采用SVM方法对目标进行分类.最后,通过仿真实验比较了该... 相似文献
8.
本文基于二维频域有限差分(FDFD)法的基本原理,利用Huygens原理,将边界上节点的FDFD方程式中的相关节点加上或减去入射场,将平面入射波引入总场区.计算分析了金属柱阵列的双站RCS,数值结果表明本文方法的正确性和分析复杂目标电磁散射特性的有效性. 相似文献
9.
10.
结合0-1整数规划的隐式枚举法对目标排序法进行分析.引入PSRS(并行正则采样排序)算法对目标排序法的核心运算进行并行化,并改进PSRS算法的数据收集策略以适应0-1整数规划的并行隐式枚举.最后给出了基于改进的PSRS的并行0-1整数规划的求解算法,并对算法的时间复杂度进行了分析. 相似文献
11.
为了解决粒子滤波多说话人跟踪过程中粒子易发散导致多目标跟踪精度低的问题,提出了并行粒子滤波和基于GPU的K-均值聚类的多声源定位方法。该方法首先分析了粒子滤波在实现多目标跟踪时,进行数据关联的过程产生较大的计算量,并且出现多个目标时,粒子会逐渐发散。针对计算量大和粒子发散的问题,提出了一种并行粒子滤波和K-均值聚类的方法。实验表明,随着粒子数和目标数的增加,计算量以指数增加,并且粒子发散严重,采用基于GPU的K-均值聚类方法的粒子滤波多说话人跟踪方法,相比传统粒子滤波跟踪方法具有更收敛的粒子集并且跟踪精度较高。 相似文献
12.
13.
Li Luo Qian Zhang Xiao-Ping Wang Xiao-Chuan Cai 《Journal of scientific computing》2017,72(3):1119-1145
Moving contact line problem plays an important role in fluid-fluid interface motion on solid surfaces. The problem can be described by a phase-field model consisting of the coupled Cahn–Hilliard and Navier–Stokes equations with the generalized Navier boundary condition (GNBC). Accurate simulation of the interface and contact line motion requires very fine meshes, and the computation in 3D is even more challenging. Thus, the use of high performance computers and scalable parallel algorithms are indispensable. In this paper, we generalize the GNBC to surfaces with complex geometry and introduce a finite element method on unstructured 3D meshes with a semi-implicit time integration scheme. A highly parallel solution strategy using different solvers for different components of the discretization is presented. More precisely, we apply a restricted additive Schwarz preconditioned GMRES method to solve the systems arising from implicit discretization of the Cahn–Hilliard equation and the velocity equation, and an algebraic multigrid preconditioned CG method to solve the pressure Poisson system. Numerical experiments show that the strategy is efficient and scalable for 3D problems with complex geometry and on a supercomputer with a large number of processors. 相似文献
14.
为有效解决粒子群算法在求解路网问题时易陷入局部最优的缺点,根据高校地理数据和多核系统并行处理方式,将自平衡策略和变异思想结合且并行化,提出一种并行求解高校路网问题的正序变异的混合PSO算法。该算法引入适合此问题的自平衡正序变异策略且采用并行处理方式,使其生成相互独立子群体且并行求解,来提高算法求解精度,保证算法多样性及收敛,降低计算时间。实验以Visual Studio 2005中C++编程实现仿真,结果表明此算法不但能有效求解高校路网问题,而且比离散PSO算法、并行自平衡PSO算法的解更优。 相似文献
15.
:传统的航天器目标自动识别方法识别精准度差,为了解决这一问题,基于改进区域分割遥感图像研究了一种新的航天器目标自动识别方法,通过人工排查的方式来追踪航天器所提供的位置信息,并建立三角形立体体系,提取出航天器所追踪的目标和航天器之间的位置关系,实现航天器目标检测,分别针对复杂场景和运动场景对目标进行识别,引用击穿识别方法,基于遗传算法以及变换算法,实现了在复杂的自然遥感图像中能够识别多种目标,但是对于残缺和不完整的目标识别性差,因此又在方法中引入了自动学习智能识别算法,解决了在遥感图像中残缺不完整的目标识别效果差的问题。设定对比实验,结果表明,相较于传统方法,基于改进区域分割遥感图像的航天器目标自动识别方法识别准确率提高了15.23%。 相似文献
16.
Algorithms for solving multiple criteria nonlinear programming problems are frequently based on the use of the generalized reduced gradient (GRG) metod. Since the GRG method gives complex and large size processing for computation, it takes much time to solve large-scale multiple criteria nonlinear programming problems. Therefore, parallel processing dealing with the GRG method is required to solve the problems. We propose a parallel processing algorithm for the GRG method under multiple processors systems. 相似文献
17.
18.
三次B样条函数拟合小形变需要大量控制点,且非刚性配准的迭代算法和归一化互信息计算量巨大,使得非刚性配准缓慢.为了提高配准速度,提出基于B样条函数的二级并行算法,其中对归一化互信息使用数据并行算法;对梯度下降流使用任务并行算法,并将数据并行算法嵌入到任务并行算法中.为减少计算量,提出图像多层次局部熵提取自由形变场活动控制点的算法,使活动控制点仅分布于待配准的目标之上,并使用B样条系数的快速算法进一步减少计算量;对由于控制点分布优化造成的各线程块并行计算量不平衡的问题,使用类似于Greedy算法的计算平衡算法使各线程块的计算量均衡.实验结果表明,使用B样条系数快速算法可以减少约50%的B样条系数计算量;与串行算法相比,使用二级并行算法以及控制点分布优化算法可以达到60~80倍的加速效果;比现有的数据并行配准算法可提速约6倍. 相似文献
19.
头脑风暴优化BSO算法是一种新型的群体智能优化算法,启发于众人集思广益求解问题的模式,适合求解复杂多峰函数优化问题。但是,BSO求解多峰极值时需进行重复的迭代运算,面对大规模数据集时会出现计算效率与求解精度过低的现象。为解决上述问题,设计并实现了一种基于Spark的并行化头脑风暴优化算法,通过将BSO算法中计算复杂度最高的聚类与新解产生过程并行化,以提高算法的加速比与计算效率。特别地,基于并行化思想,将种群划分为多个子群进行协同演化,每个子群独立产生新解来保持种群多样性,提高算法的收敛速度。最后,利用并行化BSO算法求解多峰函数。实验表明,在并行节点的总核心数为10的情况下,并行化BSO算法计算时间节省一半,计算精度和串行BSO算法基本持平,收敛速度明显提高,实验结果说明了并行化BSO的有效性。 相似文献