首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 63 毫秒
1.
分析了KNN算法在GPU上实现并行计算的可能性,提出了通过使用CUDA实现KNN算法的方案,在研究了GPU对存储访问的机制后,通过设计合理的数据以及对算法的改进,避免存储体冲突的产生,提高了算法的健壮性。研究结果证明该方法在GPU上的并行运算速度明显要快于CPU,有着很好的加速比。  相似文献   

2.
张凌洁  赵英 《电子设计工程》2012,20(17):15-18,22
Floyd-Warshall算法是图论中APSP(All-Pair Shortest Paths)问题的经典算法,为了加快计算速度,提出使用GPU通用计算来实现。文章先从算法的原理入手,层层深入,提出了可以在GPU上运行的并行F-W算法。之后,又根据矩阵分块的原理和GPU共享存储器的使用,实现了改进的GPU并行F-W算法。通过大量测试实验,得到了该GPU并行程序相对于传统CPU并行程序产生超过百倍的加速比的结论。  相似文献   

3.
商凯  胡艳 《电子技术》2011,38(5):9-11
近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU开发方式的束缚,把GPU巨大的通用计算能力解放了出来.本文利用GPU来加速AES算法,即利用GPU作为CPU的协处理器,将AES算法在GPU上实现,以提高计算的吞吐量.最后在GPU和CPU...  相似文献   

4.
该文提出一种基于图形处理器(GPU)的距离多普勒成像算法(RDA),为合成孔径声呐(SAS)的实时成像提供了新的途径。通过GPU平台上的并行方法进行距离向脉冲压缩、固定相位补偿和方位向脉冲压缩,显著提升了距离多普勒成像算法效率。仿真和实验结果表明:在满足成像分辨率的前提下,该文设计的基于GPU的并行RDA和CPU串行算法相比,加速比可达到22,满足实时SAS成像需求。  相似文献   

5.
随着计算机GPU硬件的快速发展,GPU编程环境变得友好,CPU/GPU异构体系结构也被广泛的应用。文章为了有效利用CPU/GPU异构体系结构的优点,并提出了基于该体系结构的两种并行编程模型,使得并行程序设计研究人员使用CPU/GPU异构体系结构的并行编程模型来对大量的程序进行设计,从而最大程度地提高程序的性能。  相似文献   

6.
实现的人脸检测跟踪与特征点定位系统,基于VC++6.0开发平台,使用opencv作为开发工具,有效缩短了系统的开发时间。首先,本系统采用adaboost算法进行人脸检测,通过合理的特征模板的选择实现了人脸的实时检测;其次,人脸跟踪模块选用camshift算法,利用人脸检测模块生成的人脸坐标传递给跟踪模块,实现人脸的自动实时跟踪,同时建立多个camshift跟踪器对多人脸进行跟踪,并有效地解决了人脸遮挡的问题;最后,通过ASM(active shapemodel)算法实现了实时人脸特征点定位。实验结果表明该系统实现的人脸实时检测跟踪及特征点定位,效果明显,可以作为表情分析和情感计算、视频人脸识别开发的基础。  相似文献   

7.
提出了基于GPU-CPU流水线的雷达回波快速聚类方法.该方法利用GPU与CPU异步执行的特征,将聚类的各步骤组织成流水线,大大的挖掘了聚类全过程的的并行性.实验表明,引入这种GPU-CPU流水线机制后,该方法比一般策略的基于GPU的并行聚类算法性能有38%的提升,而相对于传统的CPU上的串行程序,获得了47x的加速比,满足了气象实时分析应用中的实时性要求.  相似文献   

8.
针对采用基于肤色特征的人脸检测方法和基于Ada Boost算法的人脸检测,单一方法的人脸检测系统在检测率和误检率方面不能同时达到比较好的效果。因此结合上述两种算法各自的优点,将两种方法相结合并加以改进,主要思想是基于肤色特征的人脸检测作为预人脸检测,得到含有人脸的肤色区域,运用级联分类器检测这些肤色区域。利用matlab仿真软件进行了大量的仿真探析并进行了统计与分析,探析表明改进算法在误检率和检测率方面明显优于两种单独算法,同时对于人脸姿势方面,也能够达到很好的检测效果。  相似文献   

9.
基于GPU的快速二维沃尔什变换研究   总被引:2,自引:1,他引:1  
提出了一种基于GPU(Graphics Processing Unit,图形处理器)CUDA(Compute Unified Device Architecture,计算统一设备架构)平台的快速二维沃尔什变换(Walsh Transform)实现方法.该方法利用GPU的并行结构和硬件特点,从算法实现、存储类型、逻辑构架设置等方面提高了沃尔什变换的运算速度.实验结果表明,随着图像分辨率的增加,沃尔什变换在GPU上运行时间远低于CPU,GPU比CPU具有更明显的加速效果.  相似文献   

10.
刘昊 《电子质量》2010,(12):1-4
随着GPU的发展,其计算能力和访存带宽都超过了CPU,在GPU上进行通用计算具有成本低、性能高的特点。细胞神经网络由于其特有的性质,非常适合利用GPU进行并行计算,因此,该文提出了利用CU-DA实现的基于GPU的细胞神经网络异构算法,并应用在图像边缘检测上。实验结果证明,与传统的利用CPU实现的边缘检测方法相比,在速度上,基于GPU实现的图像边缘检测方法提高了数十倍,为细胞神经网络在实时图像、视频处理上的应用提供了新的方法。  相似文献   

11.
马歌  肖汉 《现代电子技术》2014,(20):103-106
Prewitt算法是数字图像分割中最常用的边缘检测算法。采用传统CPU上的串行方法实现该算法需要较大的计算量、耗时较长,因此,通过GPU对其进行性能加速有着重要的意义。然而由于GPU硬件体系结构的差异性,跨平台移植是一件非常困难的工作。针对上述问题,提出了一种基于OpenCL异构框架的Prewitt图像边缘检测并行算法。实验结果表明,该并行算法比CPU上的串行算法运行速度快,加速比可达30倍,有效地提高了大规模数据处理的效率,可移植性好,具有较高的应用价值。  相似文献   

12.
韩秉君  黄诗铭  杜滢 《电信科学》2015,31(10):82-88
提出了一种在 Kepler 架构 GPU(graphics processing unit,图形处理器)上利用 CUDA(compute unified device architecture,统一计算设备架构)技术加速通信仿真中DFT(discrete Fourier transform,离散傅里叶变换)处理过程的方法。该方法的核心思想是利用线程级并行技术实现单条收发链路内部DFT运算的并行加速,并利用动态并行和Hyper-Q技术实现不同收发用户对之间链路处理过程的并行加速,从而最终达到加速仿真中DFT处理过程的目的。实验结果表明,相对单核单线程CPU程序和上一代Fermi架构GPU程序,该方法分别能够将DFT处理速度提升300倍和3倍,具有较好的加速效果。  相似文献   

13.
协议特征识别技术中用到了一种重要的LCS算法,它是一种字符串比对算法,提取出字符串中的最长连续公共子串。然而,通过理论分析和实验表明:这个查找过程是一个时间复杂度较高的运算过程,如果输入的数据分组比较大,那么运行的时间将会非常长,为此不得不控制输入数据分组的大小和数量,这严重限制了所采用样本集的大小。提出了基于GPU对LCS运算实现加速的方法。在此基础上搭建和配置了CUDA平台,在此平台下研究并实现了LCS算法的并行性。通过对LCS算法在CUDA下并行性的研究,有效地加快了LCS算法的运行速度。实验结果表明,GPU下LCS算法的运行效率比CPU有了显著的提高。  相似文献   

14.
GPU计算液晶自适应光学波前重构的并行性研究   总被引:1,自引:2,他引:1  
研究了图形处理器(GPU)计算液晶自适应波前重构的并行性。介绍了液晶自适应光学的Zernike模式波前重构算法,论述了GPU的通用架构和GPU实现波前重构的方法。在此基础上提出了利用GPU拥有的RGBA4个颜色通道进行并行计算,进一步加快计算速度,最后给出了实验结果。结果表明:在GPU计算波前重构时,利用RGBA颜色通道的并行计算,将计算速度提高了3倍多。  相似文献   

15.
为了提高人脸识别实时处理速度,并充分利用当前多核处理器资源,文章实现了一种在Python环境下基于并行算法的快速人脸识别系统。人脸特征与数据库的储存实时交互,利用各子程序安全通信实现同步处理,并行处理实时人脸检测和人脸特征编码提取,同时进行最相似人脸匹配。实验结果表明,程序并行后有着速度快、准确度高、实时性强等优点。为大数据人脸识别处理提供了方法,也有利于实际的使用。  相似文献   

16.
复杂轨迹合成孔径雷达后向投影算法图像流GPU成像   总被引:1,自引:0,他引:1  
韦顺军  蒲羚  张晓玲  师君 《电讯技术》2016,56(8):879-886
相对于基于傅里叶变换的频域成像算法,后向投影( BP)算法因采用时域逐点相干积累,更适合于复杂轨迹合成孔径雷达( SAR)高精度成像。但BP算法计算量巨大,限制了其应用于SAR大场景大数据量快速成像。图形处理器( GPU)具有强大浮点运算和并行处理能力,为大场景BP算法快速成像实现提供了途径。结合GPU并行处理,提出了一种基于图像流的复杂运动SAR大场景BP快速成像处理方法。该方法借助BP算法中图像像素点相互独立处理的特性,采用图像像素点并行及图像流程处理,设计了孔径与图像缓存调度方案,提高SAR大场景大数据BP算法成像效率。仿真和机载实测数据结果验证了方法的有效性,在有限GPU显存条件下实现了8192×8192大场景快速成像,并且成像加速比相对于传统CPU单线程处理可达300倍以上。  相似文献   

17.
侯明辉 《电子科技》2013,26(10):29-32,35
由于在传统的CPU 平台上进行计算耗时量大,一方面由于SAR回波数据量大,另一方面成像算法复杂。而处理核心众多则是GPU一大优势,适合独立并行结构算法的加速。文中借助GPU 强大的浮点运算和高度的并行处理能力,将SAR成像中ECSA算法在GPU上进行了验证,并得出较好的效果,综合(计算时间+IO时间)加速比有了一定提高。在高分辨率星载SAR成像领域中,CUDA-GPU的运用将是未来发展方向,文中给出了利用GPU处理星载SAR数据可行的初步结论,为进一步优化程序奠定了基础。  相似文献   

18.
基于Boosting算法的实时人脸监控系统设计   总被引:1,自引:0,他引:1  
设计实现了基于Boosting算法的实时人脸监控系统,以AdaBoost算法为人脸检测基础,以粒子滤波器算法为人脸跟踪基础,通过两者的结合提高了检测的速度.通过分析AdaBoost训练和检测的过程,指出影响AdaBoost检测速度的要素,并提出了通过区域生长等预处理方式对待检测图像进行区域合并,降低背景的复杂度,从而提高检测的速度;并增加了侧面人脸级联分类器,采用串并联结构将正面人脸和侧面人脸的检测综合起来,扩大了系统对人脸的检测范围.同时将跟踪结果作为人脸检测模块的反馈信号,增强了检测系统的目标捕获和目标校正能力.  相似文献   

19.
为了提高复杂背景下多人脸检测率以及人脸检测速度,提出了一种基于改进AdaBoost、肤色检测和二维主成分分析法(Two-dimensional Principal Component Analysis,2DPCA)的人脸检测方法.该方法首先利用金字塔结构快速检测人脸,得到人脸检测区域,然后利用肤色检测对待判人脸区域进行过滤,过滤误检的非人脸区域,最后根据人脸的几何位置进行人脸关键部位的2DPCA检测.仿真结果表明,该方法实现了复杂背景下多人脸图像快速检测和精确定位,有效降低了误检率,使检测结果更加精确.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号