共查询到19条相似文献,搜索用时 109 毫秒
1.
本文研究六边形区域上快速傅里叶变换(FFTH)的CUDA-MPI算法及其实现.首先,我们通过充分利用CUDA的层次化并行机制及其库函数,设计了FFTH的高效率的CUDA算法.对于规模为3×2048~2的双精度复数类型数据,我们设计的CUDA程序与CPU串行程序相比可以达到12倍加速比,如果不计内存和显存之间的数据传输,则加速比可达40倍;其计算效率与CUFFT所提供的二维方形区域FFT程序的效率基本一致.在此基础上,我们通过研究GPU上分布式并行数据的转置与排序算法,优化设计了FFTH的CUDA-MPI算法.在3×8192~2的数据规模、10节点×6GPU的计算环境下,我们的CUDA-MPI程序与CPU串行程序相比达到了55倍的加速;其效率比MPI并行版FFTW以及基于CUFFT本地计算和FFTW并行转置的方形区域并行FFT的效率都要高出很多.FFTH的CUDA-MPI算法研究和测试为大规模CPU+GPU异构计算机系统的可扩展新型算法的探索提供了参考. 相似文献
2.
为了透彻地理解傅立叶变换的进行过程,通过手工运算模拟,逐步展示了一个8点序列的离散傅立叶变换。在认识到其变换方法的瓶颈之后,为了提升变换效率,基于快速傅立叶变换的理论,详细分析了基本的快速傅立叶变换的实现过程。把快速傅立叶变换用三个循环进行解析,按照蝶形算法,最终用C#代码表达并且实现完整的变换功能。 相似文献
3.
一种基于非均匀离散傅立叶变换的鲁棒音频水印算法 总被引:7,自引:0,他引:7
基于离散傅立叶变换(DFT)的音频水印算法对常规信号处理操作具有较高的鲁棒性,然而,在DFT域的固定频率点嵌入水印信息易受频域攻击,导致此类水印算法存在安全隐患.为进一步说明这种安全隐患,本文描述了一种新颖的频域攻击方法,仿真结果表明采用该方法可以在不影响含水印音频信号听觉感知质量的条件下有效去除水印信息.针对上述问题,本文提出了一种基于非均匀离散傅立叶变换(NDFT)的鲁棒音频水印算法.该算法基于NDFT可以任意选择频率点的特性,利用混沌映射随机选取NDFT域的水印嵌入频率点,以实现水印嵌入位置的随机性.此外,引入另一个混沌映射置乱加密待嵌入的水印信息以提高算法抵抗拷贝攻击的能力.理论分析和实验结果表明该算法不仅具有抗常规信号处理操作高的鲁棒性,而且能够抵抗频域的恶意攻击,大的密钥空间保证了系统高安全性. 相似文献
4.
本文介绍一种用快速傅立叶变换设计FIR滤波器的新算法。这个算法在每一次迭代中进行一次快速傅立叶正变换和一次快速傅立叶反变换,交替满足频域约束条件和时域约束条件,使所设计的滤波器在频域中H(e^jw)逼近所需要的频率响应Hid(e^jw),在时域中h(n)逼近理想单位冲激响应序列hid(n)。此算法直观和简单。 相似文献
5.
本文给出了一类基于六边形非张量积区域上的广义离散快速傅立叶变换算法(HFFT)以及它在国产百万亿次超级计算机(曙光5000A)上的测试运行情况.文章介绍了该算法在曙光5000A上的大规模集群测试加速比和可扩展性特性,并通过分析,说明HFFT在国产超级计算机的大规模并行环境下拥有良好的可扩展性.在使用8192个处理器核的情况下,HFFT加速比达到了277倍.我们同样对FFTw软件包进行了测试.本文的分析为解决其他科学计算程序在国产百万亿次规模集群上的可扩展性问题,提供了一些先行的参考和建议. 相似文献
6.
7.
傅立叶变换在数字信号处理中有着极其重要的作用。傅立叶变换的类型包括傅立叶级数、傅立叶变换、序列的傅立叶变换、离散傅立叶变换(及离散傅立叶变换的快速算法一快速傅立叶变换FFT)、傅立叶变换在谱分析、抽样、通信中的频谱搬移技术中的应用.及与其它几种变换的关系等几个方面进行了阐述。 相似文献
8.
距离徙动算法(RMA)由于需要进行精确的插值,限制了它在SAR成像中的应用。将非均匀快速傅立叶变换(NUFFT)应用到RMA成像算法中,将Stolt插值和距离向的IFFT用NUFFT来替换,在保证成像质量的情况下,提高了成像的效率,仿真结果证明了该算法的有效性。 相似文献
9.
10.
VC图像处理--快速傅立叶变换 总被引:1,自引:0,他引:1
耿迅 《电脑编程技巧与维护》2006,(1):9-14
本文介绍了快速傅立叶变换(FET)中蝶形算法的基本原理,并对DFT与FFT的效率进行了比较。 相似文献
11.
基于星形互连网络的并行快速傅立叶变换算法 总被引:6,自引:0,他引:6
星形互连网络是一种易于实现大规模并行计算的互连网络拓扑结构。利用星形互连网络的递归可分解性的多样性,提出了一种基于星形互连网络的并行快速傅立叶变换算法的实现方法。该方法能够有效地减少计算过程中处理器结点之间的通信开销。提出的星图结点和数据的映射应运 及实现并行FFT的思想可推广到线性方程组求解、矩阵乘法等其它并行算法在星形互连网络上的实现。 相似文献
12.
快速傅立叶变换是离散傅立叶变换(DFT)的一种快速算法,它的出现使DFT的计算大大简化,运算时间可缩短一、二个数量级,从而使得离散傅立叶变换在信号分析与处理领域中得到了广泛的应用。在应用软件和硬件程序设计中要实现快速傅立叶变换算法,均涉及到序列的倒位序排列问题。针对该问题提出倒位序生成法,直接计算各自然顺序位置的倒位序数值,然后通过变址运算完成原数列的倒位序的排列。该方法对任何满足N=2M点的快速傅立叶变换,能很快实现其变换中序列的倒位序排列。该方法只涉及倒位序十进制数和顺序十进制数,不用对二进制数进行转换,简单易行,仿真实验结果证明算法可靠有效。 相似文献
13.
傅立叶变换在粘连文字图像切分中的应用 总被引:3,自引:0,他引:3
对于已具有相当识别率的手写体文字识别系统来说切分算法已成为一个关键技术之一,它的正确率对系统性能有着极大影响。该文主要对文字图像的傅立叶变换的性质进行了讨论,提出了消除交换中笔画宽度影响的算法。在此基础上建立了基于傅立叶变换的单/多字图像的判定的基本准则以及基于此准则的粘连文字判别算法。实验表明该算法的粘连文字判断正确率达到96%。为粘连文字的正确切分开辟了新的途径。 相似文献
14.
傅氏去卷积和小波理论用于谱图分峰的对比研究 总被引:9,自引:0,他引:9
徐晓峰 《计算机与应用化学》1998,15(3):153-157
对小波理论和傅里叶变换去卷积数学方法在谱图分峰中的应用做了对比研究,对于完全重叠的谱峰用傅里叶变换去卷积方法效果较好,而对于不完全重叠的谱用小波方法处理效果较好。 相似文献
15.
两个快速的完全的并行细化算法 总被引:4,自引:0,他引:4
本文提出了两个并行细化算法FPTA1和FPTA2,并对算法的正确性给出了证明。通过一些典型图像模式的处理,对这两处算法和目前几个流行的并行累化算法进行了比较。结果表明,本文提出的算法,在细化质量和执行速度等方面,都具有明显的优点。 相似文献
16.
传统的计算机产生全息图方法由于在标量衍射的光场描述中没有统一的数值计算方法从而计算复杂度高,而且重构的3D图像的体积和视场都比较小,离市场化的要求较远.提出一种基于图像(而又不同于体视全息)频谱的计算全息图方法,实现了一种基于图像生成全息图的计算及其计算机显示,模拟实验结果验证了算法的正确性. 相似文献
17.
稀疏网格是一种具有特殊分层插值性质的非均匀网格形式,稀疏网格上的离散傅立叶变换算法称为Hyperbolic Cross FFT算法.这一算法能够有效降低采样点数量,并将指数时间复杂度的d维DFT算法降低到O(NlogdN)[10].六边形网格是另一种具有特殊性质的网格,具有在采样点数量较少和采样效率较高等优势.本文的研究工作主要集中在将六边形网格和稀疏网格相结合,构造六边形稀疏网格上的FFT算法.通过定义六边形和方形网格下标之间的转换,实现了六边形稀疏网格上的FFT算法,并通过数值实验证明了这一算法的有效性. 相似文献
18.
19.