首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
多核计算机上的快速傅里叶变换并行算法   总被引:1,自引:0,他引:1       下载免费PDF全文
王刚强  钟诚  柯琦 《计算机工程》2011,37(16):57-59
针对现有多核结构上快速傅里叶变换(FFT)并行算法没有利用多级缓存和线程级并行等多核特性问题,通过运用多核多级存储特性合理划分数据,采取子序列FFT计算和多线程并行逐对计算FFT相结合的方法,给出一个N点、一维、有序和基数为2的多核多线程并行计算FFT非递归算法。理论分析和实验结果表明,该算法实用、高效,能获得较好的加速比和可扩展性。  相似文献   

2.
本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个OpenMP线程,计算结点内针对能群进行多线程并行计算。数值测试结果表明,非结构网格上的粒子输运问题的混合并行计算能较好地匹配多核机群系统的硬件结构,具有良好的可扩展性,可以扩展到1024个CPU核。  相似文献   

3.
为了达到提高颗粒流体动力学方法 GHM计算效率的目标,分析了GHM模型的主要计算模块,抽取其中的可并行计算模块,基于多核计算机的硬件环境,应用OpenMP多线程并行计算模型,对采用数值积分方法求解颗粒运动方程的部分,实现求解过程的并行计算。最后通过多次实验验证程序的正确性及算法性能。实验结果表明,在Windows 7系统4核8线程处理器的计算机上,并行程序的并行加速比最高达到了2.5,说明OpenMP多核并行技术能较显著地提高GHM方法的计算性能。  相似文献   

4.
基于多核微机的微粒群并行算法   总被引:4,自引:1,他引:3       下载免费PDF全文
提出了一种基于Logistic模型的惯性权重非线性调整策略,采用OpenMP多线程编程,在微机上实现了微粒群算法的多核并行计算。通过对BenchMark测试函数集中的5个函数进行测试,试验结果表明,采用基于Logistic模型的惯性权重非线性调整策略在算法成功率和收敛代数都优于线性调整策略,而基于OpenMP的微粒群多核并行计算使得计算速度得到提高。  相似文献   

5.
针对多核处理器在调度多个任务时效率不高的问题,提出了一种基于粒子群优化算法的嵌入式多核多线程系统任务调度算法,用来找寻任务调度过程中的最优解,以求取任务的最短完成时间。在算法中通过针对多核多线程任务模型而选择粒子群算法的适应度函数,综合利用局部最优极值和全局最优极值的优势,优化了粒子群算法中存在的过早收敛问题,使算法具有较高的收敛效率。实验结果表明,与基于遗传算法的多核多线程任务调度算法相比,该算法能更快的找到最优解。  相似文献   

6.
基于并行PLS算法的化学计量学软件研究   总被引:1,自引:0,他引:1  
现有化学计量学软件普遍采用的偏最小二乘(PLS)算法均以单线程方式计算,建模速度缓慢,给应用带来较大的不便。随着多核处理器的普及,采用多线程并行计算技术可显著提高算法执行速度。本文将多线程并行计算技术引入化学计量学软件开发,提出并实现了PLS算法的并行化计算。利用标准数据集进行了性能对比实验,结果表明在四核计算机中多线程并行计算比单线程计算有大约3.1倍的速度提升。  相似文献   

7.
蔡云波  孙琳 《福建电脑》2005,(10):71-71,43
介绍了Java多线程技术及cyclicbarrier类的用法,以矩阵乘法为例提出一个可行的Java多线程实现并行计算的算法。该算法使用了破分思想,为Java多线程实现大规模计算提供了新思路。  相似文献   

8.
数据流驱动相比控制流驱动计算模式,更容易发掘应用程序的并行性,多线程是其必然结果.在嵌入式多核系统中,采用分布和并行的多个处理核来提供高计算能力.数据流驱动的多线程计算模式抽象其中的并行计算、通信、存储和资源限制等模式.适合用来描述多核系统的行为,对性能进行分析和预测.并指导系统设计和开发.  相似文献   

9.
多核处理器中,各个处理器核之间可以并发地进行外部存储访问,提供不同于单处理器的存储级并行(memory level parallelism)能力.不规则应用中的循环,传统的并行方法难以识别其并行性,不能充分利用多核处理器存储级并行能力和并行计算能力.对基于软件开发多核处理器存储级并行进行了讨论,提出一种前瞻并行多线程算法LLSM(loop level speculative mssultithreading).LLSM对不规则应用中的循环进行并行化,在多核处理器上的测试数据表明:该算法能够有效地挖掘多核处理器的存储级并行能力和计算能力,同时指出多核环境下存储级并行计算公式需要考虑线程同步开销.  相似文献   

10.
迫零线性预编码可以获得接近最优的系统容量,不同于传统MIMO系统,大规模MIMO将会配置成百根天线,随着天线数量增加,使得迫零线性预编码矩阵求逆计算复杂,不利于在应用中实现。为了减小线性预编码计算复杂度,提出基于低复杂度的雅克比迭代算法,该算法通过线性迭代,避免了矩阵求逆运算,减少了计算量。为了更进一步的减少计算时间,提出基于统一计算架构的异构多核并行算法,该方法利用GPU具有多核多线程结构特点,实现了异构多核并行计算。仿真结果表明,基于低复杂度雅克比预编码算法可以达到迫零预编码算法性能,同时与传统的线性预编码相比,该算法的计算量更少、时间更短。  相似文献   

11.
多线程技术的研究与应用   总被引:36,自引:1,他引:35  
现代主流操作系统已经广泛采用了多线程技术.首先论述了多线程的基本概念,然后着重分析了3种主要的多线程实现方案:内核绵线程、用户级线程和混合策略,然后介绍了多线程技术的应用.还结合面向对象数据库管理系统NODBMS的实现,介绍了如何应用多线程技术实现多事务处理,并提出了一个基于多线程技术实现的对象式数据库查询优化算法、该算法取得了较好的效果。  相似文献   

12.
粒子滤波(PF)算法存在的主要问题是粒子退化现象,利用重抽样过程可以有效减轻退化现象,但带来了采样枯竭问题,导致滤波精度下降.本文提出一种多样性引导的进化粒子滤波(DEPF),把粒子群优化(PSO)算法引入到传统PF中,通过PSO搜索寻优重新分配粒子,使粒子的表示更加接近真实后验.并在PSO的搜索寻优过程中使用多样性引导机制来保证所得粒子集的多样性,以提高PF的精度.仿真实验结果表明了该算法的有效性.  相似文献   

13.
基于二阶插值滤波的粒子滤波改进算法研究   总被引:2,自引:0,他引:2  
粒子退化等问题严重制约了粒子滤波的工程应用,通过对粒子滤波的分析与总结,提出一种基于二阶插值滤波的粒子滤波改进算法,利用二阶插值滤波器计算出更优的重要性函数,从而有效抑制粒子滤波的退化,降低了计算量,通过对导弹再入时的非线性导航参数估计问题进行实例仿真分析,所得结果验证了该算法的有效性.  相似文献   

14.
基于辅助粒子滤波的红外小目标检测前跟踪算法   总被引:11,自引:0,他引:11  
胡洪涛  敬忠良  胡士强 《控制与决策》2005,20(11):1208-1211
研究低信噪比复杂环境下的红外小目标检测和跟踪问题,提出了基于辅助粒子滤波的检测前跟踪算法.首先使用形态学滤波算法对图像进行白化预处理;然后在跟踪阶段采用辅助粒子滤波算法估计目标运动状态,在检测阶段利用跟踪滤波器的输出构造似然比,并进行似然比检验.对真实红外图像序列的实验表明,该算法可成功跟踪和检测信噪比为2的小目标,且其性能优于传统的检测前跟踪算法.  相似文献   

15.
基于DSP的彩色图像三基色重建算法及实现   总被引:4,自引:0,他引:4  
分析一种由CCD像感器和数字信号处理器DSP所组成的视频信号帧存储方式,数据采集系统的彩色图像三基色重建算法及实现。该算法针对Bayer滤色器的色信号特性,采用邻边点色彩补偿法去重建图像三基色。用该算法重建的彩色图像清晰、平滑,且利用DSP来实现上述算法,提高了彩色图像重建的运算速度。  相似文献   

16.
粒子滤波(PF)是动态贝叶斯网络(DBN)的一种近似推理算法,虽然重抽样过程的引入能有效减轻PF的退化现象,却带来了采样枯竭问题,导致推理精度下降.提出一种进化粒子滤波(EPF)推理算法,把离散粒子群优化(DPSO)技术引入到传统PF中,利用DPSO的迭代寻优能力重新分配粒子,使粒子的表示更加接近真实后验概率密度,以提高PF的推理精度.在离散DBN上的概率推理实验结果表明了EPF算法的有效性.  相似文献   

17.
在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技术,提出了一种并行邻近粒子搜索算法。实验结果表明,基于CUDA的并行邻近粒子搜索算法,加快了邻近粒子搜索过程,显著地减少了计算时间,成功实现了硬件加速,可获取290以上的加速比,对大规模粒子系统呈现出高效的处理能力。  相似文献   

18.
针对多线程程序数据竞争分析与检测困难的问题,提出一种基于隐Markov 模型的多线程程序时序分析方法.用随机变量不确定性刻画不同线程之间时序上的交互关系,分析数据竞争条件下程序不确定结果的概率分布情况;建立多线程程序时序分析的隐Markov 模型,使用Baum-Welch 和前向算法仿真上下文对程序实际运行状态的影响.实验结果表明,该模型能够快速有效反映多线程执行时序,用于指导多线程程序时序竞争检测过程.  相似文献   

19.
Windows中的多线程编程技术和实现   总被引:7,自引:0,他引:7  
本文简要介绍了 Windows环境下进行多线程编程的意义 ,重点讨论了 DEL PHI下开发多线程应用程序这一问题 ,通过多线程示例程序说明了多线程编程可明显提高程序的执行效率 ,反映了在 Windows环境下进行多线程编程的作用和效果。  相似文献   

20.
基于CUDA的高速FFT计算*   总被引:1,自引:0,他引:1  
针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模式及FFT算法并行性特征的基础上,采用多线程并行的映射方法实现算法,并从存储层次优化算法。实验结果表明该算法的高效性,优化后的FFT加速比能达到CUFFT库加速比的2-6倍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号