首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
根据GPU和CPU在硬件组成以及数据处理的区别引入了通用GPU计算的概念.通过计算流体粒子模拟的实际数学模型来详细介绍了通用GPU计算的实现方式,并且给出了具体程序的设计算法,最终使用计算数据测试验证通用GPU计算对与离散型大规模数据计算的高效性.  相似文献   

2.
依据GPU计算特点和任务划分的特点,提出一种类似主从模型的GPU-CPU协作计算的处理模式,通过把问题或算法划分成多子任务,并对划分的子任务给出合理的调度算法,使GPU和CPU各自发挥特点,从而发挥较高效率的GPU通用计算能力,通过测试验证该协作模式是有效的.  相似文献   

3.
利用时间空间折中思想的彩虹表是针对无盐口令加密算法的强大工具,然而为了生成有一定成功率的彩虹表,链长与链数必须足够大,因而在生成时需要消耗相当长的时间。针对这一问题,提出利用GPU加速彩虹表的生成,即将彩虹链的生成,主要是Hash以及Reduct函数的计算移植到GPU上进行。实验表明该方案能将彩虹表生成的时间缩短至原先的36.9~52.8分之一。  相似文献   

4.
通过计算机仿真海平面场景SAR回波间接得到SAR图像是当前SAR领域的研究热点。传统的基于CPU的仿真算法难以满足大场景,高实时性的海面回波生成需求,针对于此,提出了一种基于GPU的高性能海面场景SAR回波仿真方法。该方法采用基于时序的海面场景回波仿真模型,并且结合GPU通用计算平台,将算法的核心部分移植到GPU上进行并行计算。实验结果表明,该方法与传统算法相比在效率上有显著的提升,而且仿真得到的回波可以为后续的研究提供准确的仿真数据。  相似文献   

5.
随着当前计算机性能的不断提高,应用范围非常的广泛,各种计算任务及计算的要求都在迅速的上升,这对处理器往通用及专用的两个方向迅速地发展有着非常重要的作用.以CPU为首的通用处理器是近几年的计算机的主要的构成部分,这样不但提高了集成度,性能及功能也得到了完善.处理器在特定领域应用的专用化程度也越来越高,分析GPU用于通用计算的发展优势,说明今后对于GPU的研究领域与建议.  相似文献   

6.
本文首先对CPU与GPU的硬件架构进行简单介绍,其次采用CPU串行计算地球物理中反射点旅行时,再次采用GPU与CPU协同异构的方式,CUDA编程语言同样计算相同反射点旅行时,对比分析两种核处理器的计算速度,得出在计算10000个反射点旅行时时,GPU的计算效率比CPU高14倍。  相似文献   

7.
袁友伟 《电子学报》2008,36(Z1):144-146
 利用GPU的强大浮点数计算能力和并行处理能力,提出一种完全基于GPU的具有真实感三维实体模型快速绘制方法.本文利用现代图形加速卡中GPU的可编程管线,实现了快速的网格生成及简化.在保证不改变网格的拓扑结构的前提下,调整网格,使能量方程的数值尽量降低,从而大大降低线性曲面中三角形的数量.实验结果表明,该方法能够实现实时的三维实体模型快速绘制,具有重要的应用价值.  相似文献   

8.
基于GPU的星图配准算法并行程序设计   总被引:1,自引:1,他引:1       下载免费PDF全文
星图配准是星图处理应用中的一个重要步骤,因此星图配准的速度直接影响了星图处理的整体速度.近几年来,图形处理器(GPU)在通用计算领域得到快速的发展.结合GPU在通用计算领域的优势与星图配准面临的处理速度的问题,研究了基于GPU加速处理星图配准的算法.在已有配准算法的基础上,根据算法特点提出了相应的GPU并行设计模型,利用CUDA编程语言进行仿真实验.实验结果表明:相较于传统基于CPU的配准算法,基于GPU的并行设计模型同样达到了配准要求,且配准速度的加速比达到29.043倍.  相似文献   

9.
基于GPU的图形电磁计算加速算法   总被引:2,自引:0,他引:2       下载免费PDF全文
杨正龙  金林  李蔚清 《电子学报》2007,35(6):1056-1060
本文利用现代图形加速卡中GPU(Graphics Process Unit)的可编程管线,实现了图形电磁计算(GRECO)方法.与原有的方法相比,在利用物理光学和物理绕射理论的基础上,计算速度提高了20倍左右.并且利用GPU实现了射线追踪算法,用于目标上多次散射的计算,使得GRECO方法可以快速计算具有凹腔结构目标的电磁散射.本方法对于目标识别和逆合成孔径成像等方面的研究具有重要的应用价值.  相似文献   

10.
11.
对视频或图像中的行人进行检测使用HOG特征与支持向量机SVM相结合的方法,取得了良好的效果,但是由于HOG特征的计算量非常大,难以满足实时检测的需要,文章针对这一情况提出并实现一种在GPU环境下使用并行加速策略的高效行人检测方法。实验证明这种方法快速有效,大大地提高了行人检测的效率。  相似文献   

12.
冯颖  袁庆华  沈健炜 《通信技术》2011,44(2):141-143
基于CPU+GPU的异构计算系统是在传统计算机系统中加入GPU作为加速部件并配合CPU共同承担计算任务的新型系统,相比于传统的单纯以CPU作为计算部件的同构计算系统,异构系统优势明显。分析了基于CPU+GPU异构计算模式程序开发面临的主要困难,重点研究了当前可用的主要解决途径和研究方向,并总结了当前各种编程方法的适用场合和各自的优缺点。  相似文献   

13.
针对GPU并行计算特征,对Viterbi解码自身做了并行处理探索,并提出使用Zero-Termination卷积码来实现基于GPU的Viterbi解码分块并行处理.设计的实现结果表明:Zero-Termination卷积码的简单而适用于GPU分块并行;误码率降低,特别是在信噪比低的情况下,Zero-Termination卷积码误码率比不损失码率的卷积码要低.同时,还实现了基于GPU的7,9,15三种不同约束长度的Viterbi解码,获得了良好的误码性能曲线及高吞吐率表现.  相似文献   

14.
随着计算机硬件技术的高速发展,图形处理器(Graphic processing unit,GPU)通用计算已经发展到颇为成熟阶段,其并行运算速度已远远超过多核CPU。文章简介CUDA架构并验证其在图形处理中的加速能力,对比线性代数运算在CPU与GPU架构下的效率,将CUDA技术应用于智能视频监控人体检测系统中,实验验证其高效性及可行性。最后对CUDA的发展方向进行了展望。  相似文献   

15.
一种基于短时平均幅度差的语音检测算法   总被引:1,自引:0,他引:1  
提出了一种利用语音信号的短时平均幅度差特征并结合短时平均幅度的语音检测算法。该算法在专用通信系统中,用以对接收到的电台信号进行分析,判断其中是否有语音信号,从而控制半双工电台的发射开关,使其处于接收或发射状态。实验表明,该算法能在较低的信噪比情况下准确地检测出语音信号,而且计算方法简单,硬件处理容易,可靠性高,能够满足实时系统的需要。  相似文献   

16.
语音端点检测中能零比方法的改进   总被引:1,自引:0,他引:1  
传统的基于语音信号短时能量与短时过零率之比的单参数双门限端点检测方法对高信噪比的语音信号能实现较好的检测,而在低信噪比的情况下检测正确率却很低。本文在研究了语音信号的非线性分析方法后,提出了一种改进的端点检测方法。首先,对分帧加窗后的每一帧带噪语音信号进行经验模态分解求其短时Teager能量;然后,求每一帧的短时过零率,平滑处理之后进行归一化;最后,求出短时Teager能量与归一化短时过零率之比用于端点检测。经过仿真实验证明,本文提出的改进方法能够在低信噪比的带噪环境下实现比传统能零比方法更好的端点检测效果。  相似文献   

17.
基于GPU的人脸检测和特征点定位研究   总被引:1,自引:0,他引:1  
人脸分析相关应用越来越广泛,但随着高清视频影像的广泛使用,传统的基于CPU设计实现的程序已难以满足时效性要求。本文基于GPU平台实现了人脸检测和特征点定位的并行化。首先为了加速人脸检测过程,使用Nvidia的CUDA计算范式,通过"窗口级并行"和"分类器级并行"两步实现基于Haar特征的Adaboost算法;然后在人脸检测的基础上,提出一种在常量时间内获得初始模型的方法,并行实现ASM算法。与OpenCV中基于CPU的方法相比,基于GPU的本方法有一定速率提升。  相似文献   

18.
一种基于检测元音的孤立词端点检测算法   总被引:2,自引:0,他引:2  
邝航宇  张军  韦岗 《电声技术》2005,(3):40-43,48
提出了基于检测元音的端点检测算法。首先检测到语音中的元音的端点。然后利用元音的端点作为参考端点检测出语音真实的端点。将新方法应用在T146数据包在NoiseX-92的5种噪声下的端点检测和识别实验。并和基于能量的端点检测算法比较。2种不同的实验表明,提出的基于检测元音的孤立词端点检测算法可以在不同信噪比下提高端点检测的准确率,并在低信噪比的环境下能明显提高语音识别系统的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号