共查询到18条相似文献,搜索用时 203 毫秒
1.
2.
采用自适应多层快速多极子算法分析电大尺寸组合体的雷达散射截面。推导了组合体表面的积分方程,通过将基函数和权函数分别用不同空间位置上的点源函数展开,自适应多层快速多极子算法实现了阻抗积分的快速计算,通过采用射线传播法,远场近似和对称性计算法则使转移因子的计算效率大大提高,所有转移过程可由快速傅里叶变换计算完成。这种算法计算组合体散射时所需的计算时间和内存显著降低,且数值计算结果和实际测试结果吻合良好。 相似文献
3.
4.
5.
针对曲面共形阵列结构电磁散射特性的高效、精确仿真分析需求,提出了一种并行综合函数矩量法处理方案.该方法是传统电磁经典数值算法——矩量法的一种改进形式,通过几何区域分解处理和综合基函数的方式极大降低了算法的内存消耗,使得单机分析电大尺寸问题和大规模阵列问题成为可能.更为重要的是,针对周期阵列结构,该方法具备综合函数复用特性和多区域并行处理特性,能够大大提高算法的综合处理效率.一个6×11的柱面共形贴片阵列被用于验证所提方法的性能,仿真结果表明,对于周期阵列结构,该方法的计算精度与多层快速多极子算法相当,虽然计算效率略低于多层快速多极子方法,但内存消耗比多层快速多极子方法低一个数量级. 相似文献
6.
7.
利用散射体表面上与外侧共形面上差分网格点的场关系,导出了快速求解二维电磁散射问题的迭代格式,并进一步用光滑窗函数压缩导致原迭代发散的阴影区尖刺状误差电流分布,提出了超快速加窗迭代法.数值结果表明,新方法的迭代次数与散射体电尺寸以及离散点数无关,能够快速求得具有足够精度的离散解.若结合快速Fourier变换或多层快速多极子算法,该算法的总体计算复杂度可降低为O(NlogN),几乎可比其它快速数值方法降低一阶. 相似文献
8.
虽然快速多极子算法FMM(Fast Multipole Method)和多层快速多极子算法MLFMA(Multi-Level Fast Multipole Algorithm)是解决复杂目标电磁散射问题比较有效的方法,但是当问题的规模较大时,传统的串行FMM 和MLFMA难以胜任.本文在工作站网络系统NOW(Network Of Workstation)上采用并行处理技术来解决电大尺寸复杂目标电磁散射问题.结果表明:本文提出的并行解决方案与国内外相关成果相比不仅更具实用性,并行效率达到54%以上,且解决了串行方法难以解决的电磁散射问题,本文在四台DEC工作站构成的NOW系统上用32小时完成了未知量为160,000的雷达散射截面的计算. 相似文献
9.
10.
用快速多极算法分析具有任意线、面、体组合的电大尺寸理想导体目标的电磁散射和辐射特性.统一采用RWG基函数对线、面、体导体上的电流进行展开;使用了新的设置基函数和未知量的方法来处理任意的线-面,面-面连接问题;并使用多层快速多极算法结合ILUT预处理算法加速求解过程.数值结果验证了本文方法的准确性和高效性. 相似文献
11.
12.
复杂轨迹合成孔径雷达后向投影算法图像流GPU成像 总被引:1,自引:0,他引:1
相对于基于傅里叶变换的频域成像算法,后向投影( BP)算法因采用时域逐点相干积累,更适合于复杂轨迹合成孔径雷达( SAR)高精度成像。但BP算法计算量巨大,限制了其应用于SAR大场景大数据量快速成像。图形处理器( GPU)具有强大浮点运算和并行处理能力,为大场景BP算法快速成像实现提供了途径。结合GPU并行处理,提出了一种基于图像流的复杂运动SAR大场景BP快速成像处理方法。该方法借助BP算法中图像像素点相互独立处理的特性,采用图像像素点并行及图像流程处理,设计了孔径与图像缓存调度方案,提高SAR大场景大数据BP算法成像效率。仿真和机载实测数据结果验证了方法的有效性,在有限GPU显存条件下实现了8192×8192大场景快速成像,并且成像加速比相对于传统CPU单线程处理可达300倍以上。 相似文献
13.
14.
在行星探测任务中,针对尺度不变特征变换(SIFT)算法计算量大,无法同时满足对导航算法准确性和实时性要求的问题,提出了一种基于快速高斯模糊的并行化SIFT算法,即FG-SIFT算法。首先,将算法中构建高斯金字塔的二维高斯核函数分离成两个一维高斯函数,降低算法的计算复杂度。然后,对于每一维高斯函数,使用两个无限脉冲响应滤波器串联进行逼近,进一步减少计算量。最后,利用并行化处理的优势,设计算法各部分的并行化计算方案。仿真结果表明,FG-SIFT算法的计算效率相较于原SIFT算法平均提高了15倍,相较于没有使用快速高斯模糊的SIFT算法,在图形处理器上的运行效率也有近2倍的提高,很大程度上减少了特征点提取的计算时长,提高了算法的实时性。 相似文献
15.
Iterative coordinate ascent algorithms have been shown to be useful for image recovery, but are poorly suited to parallel computing due to their sequential nature. This paper presents a new fast converging parallelizable algorithm for image recovery that can be applied to a very broad class of objective functions. This method is based on paraboloidal surrogate functions and a concavity technique. The paraboloidal surrogates simplify the optimization problem. The idea of the concavity technique is to partition pixels into subsets that can be updated in parallel to reduce the computation time. For fast convergence, pixels within each subset are updated sequentially using a coordinate ascent algorithm. The proposed algorithm is guaranteed to monotonically increase the objective function and intrinsically accommodates nonnegativity constraints. A global convergence proof is summarized. Simulation results show that the proposed algorithm requires less elapsed time for convergence than iterative coordinate ascent algorithms. With four parallel processors, the proposed algorithm yields a speedup factor of 3.77 relative to single processor coordinate ascent algorithms for a three-dimensional (3-D) confocal image restoration problem. 相似文献
16.
开发了一种基于积分方程的模拟均匀介质中二维电磁成像的反演算法。在反演中采用了Born 迭代方法,该算法具有抗噪声能力强、迭代稳定的优点。在正演计算中采用了计算积分方程的稳定型双共轭梯度快速Fourier 变换(BCGS-FFT)算法,将插值函数作为基函数和试探函数对积分方程进行弱化离散,离散后的积分方程采用稳定型双共轭梯度迭代方法进行求解,从而得到异常体内电场的分布,迭代过程中采用快速傅里叶变换(FFT)技术进行加速。反演算例说明了所开发算法的精确性和有效性。 相似文献
17.
为提高脉冲相位热像法(PPT)温度序列相位的计算速度和检测效率,对传统的傅里叶变换(FFT)进行优化,提出了适用于PPT的相位快速计算方法,使运算速度提高了1.9~12.4倍。为确定相位算法中温度序列的最佳采样长度和频率分量,结合热扩散深度公式提出了最佳采样长度估算公式。对铝合金试件和钢材料试件进行了脉冲相位热波检测,当缺陷检测效果最佳时,热图序列最佳采样长度分别为1.1 s和3.9 s,基频相位差有最佳的缺陷分辨能力。结果表明:该算法显著提高了相位计算速度,量化的最佳采样长度估算公式能直接确定热图采样长度,减少了操作的主观性和参数设置的随机性,有效提高了脉冲相位热像检测效率。 相似文献
18.
为减少卷积神经网络(CNN)的计算量,该文将2维快速滤波算法引入到卷积神经网络,并提出一种在FPGA上实现CNN逐层加速的硬件架构。首先,采用循环变换方法设计行缓存循环控制单元,用于有效地管理不同卷积窗口以及不同层之间的输入特征图数据,并通过标志信号启动卷积计算加速单元来实现逐层加速;其次,设计了基于4并行快速滤波算法的卷积计算加速单元,该单元采用若干小滤波器组成的复杂度较低的并行滤波结构来实现。利用手写数字集MNIST对所设计的CNN加速器电路进行测试,结果表明:在xilinx kintex7平台上,输入时钟为100 MHz时,电路的计算性能达到了20.49 GOPS,识别率为98.68%。可见通过减少CNN的计算量,能够提高电路的计算性能。 相似文献