首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 468 毫秒
1.
在无线电频谱监测中,随着数据采集能力和采样频率的不断提高,对算法的时效性提出了更高要求。对于宽带信号测向系统,提出基于稀疏快速傅里叶变换的互谱法相位测量算法,该算法利用信号频域的稀疏特性,通过频谱重排、滤波、降采样和估值,能快速计算出频谱中K(信号稀疏度)个拥有最大值的傅里叶系数。利用这K个大值点计算平均时延,在保证与传统快速傅里叶变换有相同精度的同时,降低算法的时间复杂度。分析表明,该算法的时间复杂度与信号稀疏度K呈亚线性关系。该方法提高了算法效率。仿真分析对比了基于稀疏快速傅里叶变换的互谱法和基于快速傅里叶变换的互谱法的误差,表明了该算法的有效性。  相似文献   

2.
快速Hadamard变换被广泛应用于信号与图像处理、通信系统、数字逻辑等领域中.当问题规模非常大时,快速Hadamard变换有可能不能满足计算时间的要求;这种情况下,算法并行化是一种行之有效的手段.本文以单像素相机的压缩感知图像复原为应用背景,利用基二快速Hadamard变换与快速傅里叶变换的结构相似性,提出一种通用的基二快速Hadamard变换的任务级并行算法,并用构造方式证明了该并行算法与串行算法计算结果之间的等价性.仿真表明对于小于220向量长度的问题规模以及并行子任务数少于210的情况,该并行算法对比串行算法的数值计算结果的欧氏距离平方误差小于10-18,佐证了并行算法的正确性.在PC平台通过多核CPU上POSIX线程实现的实验表明:在该特定平台和特定配置上对于220至225向量长度的问题规模并行计算加速比为1.33~1.42,证明了文中提出方法的可行性和有效性.  相似文献   

3.
采取 CPU 分发图像滤波任务和回收滤波结果、将多个图像数据划分分配给多个 GPU 及其线程块、GPU 调用核函数库对图像进行傅里叶变换和反傅里叶变换的方法,设计实现了 CPU 和 GPU 协同计算的多图像同态滤波并行算法。实验结果表明,给出的多图像同态滤波并行算法高效,与单 GPU 计算的并行算法相比,多 GPU 协同计算的并行算法显著缩短了多个图像同态滤波处理所需的时间。  相似文献   

4.
严天峰  张宇  魏楠  杨志飞 《测控技术》2018,37(7):101-105
稀疏傅里叶变换时延估计具有较低的运算时间复杂度,但在低信噪比时无法准确估计出时延.针对稀疏傅里叶变换时延估计在噪声干扰下时延估计精度下降的缺点,提出了基于小波降噪的稀疏傅里叶变换时延估计算法.算法利用小波降噪方法处理接收到的信号,再对降噪后的信号进行稀疏傅里叶变换广义相关,通过检测相关函数的谱峰得到估算的时延值.实验仿真以及对实测数据的验证均表明,在低信噪比条件下,基于小波降噪的稀疏傅里叶变换时延估计算法在保证数据高处理速度的同时,具有较好的抗噪性以及较高的时延估值精确度.  相似文献   

5.
针对现有滚动轴承故障诊断方法过度依赖于有监督学习算法的问题,提出一种基于堆栈稀疏自编码和支持向量机(SSAE-SVM)的滚动轴承故障诊断方法.利用堆栈稀疏自编码(SSAE)的频域深层特征学习能力,对轴承故障特征进行快速傅里叶变换和批归一化处理,再输入到SSAE网络.所构建的SSAE网络通过贪婪算法逐层训练,使用梯度下降...  相似文献   

6.
《计算机工程》2018,(2):141-146
稀疏快速傅里叶变换需要信号以傅氏域的稀疏度为先验信息,但稀疏度通常是未知的,在一定程度上限制了算法的应用。为此,提出一种新的稀疏傅里叶变换算法。在下采样域进行能量检测,得到稀疏度的初始值,通过增大下采样维度提高稀疏度估计的准确性,从而近似估计稀疏度,设定阈值剔除冗余信息从而得到较好效果。实验结果表明,当信号长度大于219或稀疏度小于900时,该算法性能优于西方快速傅里叶变换,且具有较强的鲁棒性。  相似文献   

7.
传统的计算全息图大多采用菲涅耳衍射积分得到,但菲涅耳衍射积分在描述整个衍射光场中,没有一个统一的采样方法对积分进行数值计算,从而给计算带来不便。为了更好地研究计算全息图问题,文章引入了分数傅里叶变换,通过利用分数傅里叶变换的一种快速数值模拟算法,提出了一种基于分数傅里叶变换的合成空间三维物体全息图的新方法,并用计算机模拟了合成的全息图及其数字重构的结果。实验结果表明:由于分数阶的引入,得到一种处理光场衍射问题的统一算法,因此用分数傅里叶变换来处理光场衍射问题是十分理想的。  相似文献   

8.
为了解决三维芯片设计中的发热问题,针对三维芯片物理模型提出一种快速、准确的热仿真方法.该方法基于三维有限差分法,利用嵌套的两重快速傅里叶变换对有限差分方程进行求解,从而得到芯片温度分布;通过矩阵的特征值分解与快速傅里叶变换,使得只需求解一系列小规模的三对角线性方程组,即可在不损失精度的前提下有效地提升计算速度.数值实验结果表明,文中方法比稀疏矩阵直接求解算法快几十倍,并且由于占用内存少,能有效地求解变量数多达6×107的三维芯片热仿真问题;该方法具有O(nlogn)的时间复杂度与O(n)的空间复杂度,其中n为离散变量数.  相似文献   

9.
传统的局域化联合算法使用傅里叶变换从脉冲数变换到多普勒域,由于脉冲数的限制,导致了变换后的傅里叶系数采样出现偏差,导致对某些目标速度不易检测,使得检测性能降低。通过改变传统局域化联合算法中的分块模式,把一个多普勒通道划分在两个以上的局域块中,解决傅里叶变换系数采样不准的问题,从而能够改善检测性能,对于某些目标速度,改进的JDL算法可以在信干噪比下降3dB左右时,依然达到和传统JDL算法相同的检测概率。  相似文献   

10.
多核计算机上的快速傅里叶变换并行算法   总被引:1,自引:0,他引:1       下载免费PDF全文
王刚强  钟诚  柯琦 《计算机工程》2011,37(16):57-59
针对现有多核结构上快速傅里叶变换(FFT)并行算法没有利用多级缓存和线程级并行等多核特性问题,通过运用多核多级存储特性合理划分数据,采取子序列FFT计算和多线程并行逐对计算FFT相结合的方法,给出一个N点、一维、有序和基数为2的多核多线程并行计算FFT非递归算法。理论分析和实验结果表明,该算法实用、高效,能获得较好的加速比和可扩展性。  相似文献   

11.
This paper addresses the problem of monodimensional (1D) FFT parallel computation on constant-valence multicomputers, i.e. on parallel systems made up of processing elements (PEs) which do not share memory and are connected to a bounded number of neighbours. After a qualitative analysis of several possible partitionings of the DIT FFT algorithm, a decomposition is introduced that has good scalability properties and makes it possible to use sections of sequential code based on the most common 1D-FFT algorithms. If a computing architecture with indirect binary n-cube interconnection network is used, the proposed decomposition guarantees strictly local communications and therefore requires no through-routing support. These characteristics have a positive impact on software development and also on overall performance. Furthermore, thanks to a pipelined organization of the PEs, the resulting architecture has high potentialities for real-time signal processing. As these useful features are obtained at the ‘expense’ of an uneven workload distribution, computing efficiency is relatively low but does not significantly change in a wide range of the number of processors. An implementation on a Transputer-based system is presented along with the performance results obtained. Finally a simple analytical model of the architecture is shown, that allows the values of the main performance parameters to be obtained as a function of the number of processors used and of the elementary response times of the first stage of PEs.  相似文献   

12.
近年来很多学者开展了模糊积分的相关研究,并将模糊积分应用于各种分类问题,而模糊测度的确定则是模糊积分计算的重点和难点。本文将并行计算和稀疏存储应用在模糊积分求解上,分别解决模糊积分计算中的时间复杂度和空间复杂度问题,并提出一种高效率模糊积分算法—基于并行和稀疏框架的模糊积分(Parallel and Sparse Frame Based Fuzzy Integral,简称PSFI)。实验表明,随着计算资源的增加,PSFI算法的加速比和效率下降较低。在变量存储上,PSFI算法在较多特征的数据集上对存储空间减少数千倍。最后,本文提出的PSFI算法相比之前提出的多重模糊积分(Multiple Nonlinear Integral, MNI)算法,有较高的分类准确率。  相似文献   

13.
稀疏矩阵乘以一个向量(SpM×V)的问题是许多大型应用问题的核心计算问题,文中提出了一种在并行计算机上并行计算SpMXV的负载平衡算法,计算复杂性为O(N)(N为稀疏矩阵的阶),而目前计算此类问题的最优负载平衡算法的计算复杂性为O(N·P)(P为处理机台数)。文章最后给出了并行数值实验。  相似文献   

14.
高光谱图像分类是遥感信息处理领域的热点问题,在核稀疏表示分类框架下,联合光谱信息和像元空间信息,空谱联合核稀疏表示高光谱图像分类能够取得较好的分类效果,但较高的计算复杂度及高光谱图像较大的数据量限制了其在实时性要求较高情况下的应用。基于GPU/CUDA架构,提出了一种空谱联合核稀疏表示高光谱分类的并行优化方法,设计访存优化策略对主机和设备端数据交互进行优化;充分利用GPU并行计算能力,加速分类过程中核矩阵的计算;采用依据GPU并行特性实现的矩阵运算,优化基于交替方向乘子法的分类模型求解过程。利用实际高光谱图像数据进行的实验,验证了该方法的有效性和高效性。  相似文献   

15.
以IEEE检验系统为例,通过数值试验将多波前算法与电力系统分析中常用的稀疏三角分解技术进行对比分析。数值试验结果表明,在串行计算平台上,多波前算法相对于稀疏三角分解技术具有更好的计算效率,因而更适合于现代大规模电力系统的分析计算。此外,多波前算法更易于并行化,而且是一种适合于可重构计算系统的新方法。  相似文献   

16.
OilCL:一个面向油藏数值模拟并行计算的通信库   总被引:2,自引:0,他引:2  
OilCL是一个用于油藏数值模拟计算的可移植的通信库,虽然目前存在很多的通信库,如MPI,PVM等,但由于它们的通用性,而且其界面较低级而不适合油藏模拟数值计算,OilCL为油藏数值模拟计算程序员提供一个方便、自然的界面,它支持动态地建立和释放通信上下文/逻辑进程网格;支持基于源的消息选择;逻辑拓扑作为群通信子程序的参数并提供开发和运行模式,这些机制便于油藏数值模拟计算程序的设计,使程序可读性更强  相似文献   

17.
分子动力学作为一种重要的计算手段在许多领域有着广泛的应用,由于它的计算量比较庞大,因此并行计算方法被越来越多地引入到分子动力学的模拟中。本文在目前常见的SMP集群系统上,根据系统的结构特点,针对分子动力学的三种并行算法:区域分解法、原子分解法和力分解法,利用MPI Pthread的混合编程模型,采用节点间消息传递模式以及节点内部共享存储的编程模式,实现了近程作用分子动力学的两级并行计算。计算结果表明,不同的算法采用了两级并行的方式和原来只有消息传递的并行方式相比,具有不同的计算效率,但是从总体来说采用两级并行的计算方式可以利用更多的计算资源,从而有助于提高计算能力。  相似文献   

18.
稀疏矩阵与向量相乘SpMV是求解稀疏线性系统中的一个重要问题,但是由于非零元素的稀疏性,计算密度较低,造成计算效率不高。针对稀疏矩阵存在的一些不规则性,利用混合存储格式来进行SpMV计算,能够提高对稀疏矩阵的压缩效率,并扩大其适应范围。HYB是一种广泛使用的混合压缩格式,其性能较为稳定。而随着GPU并行计算得到普遍应用以及CPU日趋多核化,因此利用GPU和多核CPU构建异构并行计算系统得到了普遍的认可。针对稀疏矩阵的HYB存储格式中的ELL和COO存储特征,把两部分数据分别分割到CPU和GPU进行协同并行计算,既能充分利用CPU和GPU的计算资源,又能够发挥CPU和GPU的计算特性,从而提高了计算资源的利用效能。在分析CPU+GPU异构计算模式的特征的基础上,对混合格式的数据分割和共享方面进行优化,能够较好地发挥在异构计算环境的优势,提高计算性能。  相似文献   

19.
20.
In this paper we describe and compare two different methods for solving general sparse triangular systems in distributed memory multiprocessor architectures. The two methods involve some preprocessing overheads so they are primarily of interest in solving many systems with the same coefficient matrix. Both algorithms start off from the idea of the classical substitution method. The first algorithm we present introduces a concept of data driven flow and makes use of non-blocking communications in order to dynamically extract the inherent parallelism of sparse systems. The second algorithm uses a reordering technique for the unknowns, so the final system can be grouped in variable blocksizes where the rows are independent and can be solved in parallel. This latter technique is called level scheduling because of the way it is represented in the adjacency graph. These methods have been tested in the Fujitsu AP1000 and the Cray T3D and T3E multicomputers. The performance has been analysed using matrices from the Harwell-Boeing collection.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号