共查询到20条相似文献,搜索用时 125 毫秒
1.
2.
3.
采用基于CUDA(compute unified device architecture,统一计算设备架构)的GPU(graphic pro-cessing unit,图形处理器)与CPU协作处理方法,实现了基于时差最小测量误差的任意站定位算法的实时处理。本方法的处理速度相较于单CPU平台可以提高一至两个数量级,相较于同等处理速度的多CPU平台则体现了开发周期短、费用低、工作量小和可靠性高等众多优势。 相似文献
4.
LK(Lukas-Kanade)光流法在运动目标检测和跟踪领域具有广泛应用,但其计算复杂、速度慢,难以适应异构硬件平台。为实现LK光流法在不同平台上的高效运行,设计了一种基于开放式计算语言(OpenCL)的LK光流法并行算法。该算法通过将二维图像上像素点上的稠密计算映射到多线程上实现数据并行,并基于OpenCL平台的共享内存等优化方法减小了主机内存与设备内存数据传输。实验测试表明,该算法相比于多核CPU下的基础OpenCV函数库中的LK算法获得了最高31倍的加速比,同时在速度上与统一计算设备体系结构(CUDA)加速的LK光流法相近。此外,还在多种不同设备下验证了加速算法的平台通用性。 相似文献
5.
近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU开发方式的束缚,把GPU巨大的通用计算能力解放了出来.本文利用GPU来加速AES算法,即利用GPU作为CPU的协处理器,将AES算法在GPU上实现,以提高计算的吞吐量.最后在GPU和CPU... 相似文献
6.
针对数字全息重建算法计算速度慢、实时应用能力弱以及现有GPU加速策略跨平台移植性差等问题,该文提出一种利用开放运算语言(OpenCL)架构提高数字全息重建算法执行效率的方案。该方案充分利用OpenCL架构的异构协同计算能力,对数字全息卷积重建算法进行CPU+GPU的异构运行设计,并采用数据并行模式编程实现。针对不同分辨率数字全息图、不同GPU加速平台的测试结果表明,该加速策略的平均执行时间均比CPU低1个数量级,最高总加速比达到54.2,并行运算加速比甚至高达94.7,且具有规模增长性及良好的跨平台特性,加速效率显著,更加适用于数字全息技术的工程化实现及实时性应用场合。 相似文献
7.
基于GPU的快速二维沃尔什变换研究 总被引:1,自引:1,他引:1
提出了一种基于GPU(Graphics Processing Unit,图形处理器)CUDA(Compute Unified Device Architecture,计算统一设备架构)平台的快速二维沃尔什变换(Walsh Transform)实现方法.该方法利用GPU的并行结构和硬件特点,从算法实现、存储类型、逻辑构架设置等方面提高了沃尔什变换的运算速度.实验结果表明,随着图像分辨率的增加,沃尔什变换在GPU上运行时间远低于CPU,GPU比CPU具有更明显的加速效果. 相似文献
8.
利用NVIDA公司开发的CUDA技术对线性调频信号脉冲压缩算法进行了研究。用CUDA C和C语言分别在GPU、CPU平台对该算法进行仿真,并对程序执行时间做出了比较。实验结果表明,在GPU平台上实现脉冲压缩算法的运算效率明显优于在CPU上。 相似文献
9.
为了改善人工蜂群算法对于大规模数据、高复杂度问题的执行效率,采用开放计算语言(OpenCL )并行编程模型,提出一种基于图形处理器(GPU )加速的并行人工蜂群算法.将每只采蜜蜂映射到 OpenCL 的一个工作组,跟随蜂采用局部轮盘赌选择,使得人工蜂群算法在 GPU 中加速执行.实验结果表明,并行人工蜂群算法取得了较好的优化效果,提高了算法的运算速度. 相似文献
10.
Prewitt算法是数字图像分割中最常用的边缘检测算法。采用传统CPU上的串行方法实现该算法需要较大的计算量、耗时较长,因此,通过GPU对其进行性能加速有着重要的意义。然而由于GPU硬件体系结构的差异性,跨平台移植是一件非常困难的工作。针对上述问题,提出了一种基于OpenCL异构框架的Prewitt图像边缘检测并行算法。实验结果表明,该并行算法比CPU上的串行算法运行速度快,加速比可达30倍,有效地提高了大规模数据处理的效率,可移植性好,具有较高的应用价值。 相似文献
11.
基于相关区域约束的SURF特征点匹配 总被引:1,自引:0,他引:1
针对特征向量匹配计算量较大的问题,提出了一种改进的基于区域相关约束的快速鲁棒局部特征(SURF,Speeded-Up Robust Feature)的视频帧间的特征匹配算法。相比于最近邻与次近邻之比,增加随机抽样一致性估计来去除误匹配,再结合连续帧间的像素相关性,进一步降低误匹配和加速匹配过程。在PETS数据库的仿真结果表明,该算法能够在凌乱和存在遮挡的背景下完成目标识别,去除误匹配更加有效,适用于对实时性要求较高的场合。 相似文献
12.
13.
14.
针对使用移动终端检测运动目标时出现的背景偏 移,实时性不足等问题,本文提出一种基于 Speeded-Up Robust Features(SURF)和Fast Retina Keypoint(FREAK)算法的动态背景 补偿方法。首 先利用SURF算法检测特征点,接着利用FREAK算法对特征点进行描述,然后对特征点进行汉 明距离匹配, 最后使用随机抽样一致算法(Random Sample Consensus,RANSAC)剔除误匹配点。设计基于 移动终端的背景 补偿实验,结果表明,在旋转角度,光照条件和尺寸不同的情况下,该算法都表现出良好的 匹配效果以及实时性。 相似文献
15.
16.
由于基于特征的目标跟踪需要对前后两帧图像中的目标进行特征匹配,而传统的基于SURF(speeded up robust features)特征的匹配算法存在匹配时间较长,无法满足目标跟踪条件下实时性要求的情况。本文针对此缺点对SURF特征提取提出了具体的分块并行的解决方案,其中包括自适应地设置分块重叠区域,去除冗余特征点和距离门限法去除离散点的处理;同时通过模板的实时更新以及自适应的抗遮挡处理,保证了短时抗遮挡性能。并通过实验,将传统的基于SURF特征的跟踪算法与本文算法在相同条件下进行跟踪误差和运行时间对比;实验表明针对视频中的待跟踪目标,本文算法较基于传统SURF的图像跟踪算法在降低跟踪运行时间的同时保证了跟踪准确度。并通过遮挡实验,说明抗遮挡处理在本文算法中的实用性和必要性。 相似文献
17.
针对加速鲁棒性特征算法,在没有后续去误匹配等处理的情况下,对存在较大旋转角度的两幅待匹配图像,匹配精度较低的问题,提出了一种基于傅里叶梅林变换的SURF算法。该算法通过对待匹配图像和参考图像实施傅里叶变换和梅林变换,利用能量谱求出两幅图像发生的旋转角度,并利用SURF算法找出图像间发生的平移和尺度变化,实现了图像间的匹配。实验结果表明,该算法可有效地实现图像间存在较大旋转角度时的几何匹配,且相比已有的SIFT和SURF算法,具有更好的匹配效果。 相似文献
18.
基于边缘图像和SURF特征的可见光与红外图像的匹配算法 总被引:3,自引:1,他引:2
利用灰度信息对可见光与红外图像进行匹配时,其效果受两类图像间灰度分布差异的影响。结合这两类图像的特征,提出了一种基于边缘图像和SURF(Speed-Up Robust Feature)特征的图像匹配方法。首先采用改进的三次B样条分别对两幅源图像进行边缘提取;然后利用SURF算法在边缘图像上进行特征点检测;再通过最近邻次近邻比值法对特征点进行粗匹配,最后利用对极几何约束的RANSAC算法剔除误匹配点对,从而实现图像的匹配。实验结果表明,在正确匹配率方面本文算法明显优于Canny边缘提取和SURF的匹配方法,具有一定的有效性。 相似文献
19.
蒋子贤 《太赫兹科学与电子信息学报》2022,20(5):479-485
针对基于特征点的图像匹配方式在复杂纹理场景中匹配效果不理想的问题,提出一种将加速稳健特征算法(SURF)与一致性敏感哈希匹配结合的图像匹配算法(CSH)。使用SURF算法对图像进行特征点提取,再以特征点为圆心构建特征区域,最后对特征区域使用CSH进行匹配,从而实现高精确匹配。为了进一步加快算法运行速度,对现有的SURF算法进行修改,在提取SURF特征点时去除了对于特征点方向的计算。仿真实验证明,算法较一般的特征算法在复杂纹理图像匹配中效果更佳,且较CSH算法效率提升了10%~15%。 相似文献
20.
针对红外与微光图像配准的特殊性,
为了减少配准计算量,提出了一种从主方向确定和特征点描述
两方面加以改进的加速鲁棒特征(Speeded Up Robust Feature, SURF)配
准算法。首先检测微光图像和红外图
像的边缘,然后用改进型SURF算法提取两种图像边缘上的特征
点,并采用最近邻距离法对原始特征点进行筛选。在得到较高精
度的特征点后进行粗匹配。接着用随机抽样一致
性(RANdom SAmple Consensus, RANSAC)算法对一次筛选后的
特征点进行精匹配。最后利用精确的特征点建立变换模型,并
将重采样后的待配准图像与参考图像实现配准。实验结果表明,
该算法不仅可以解决红外与微光图像的配准问题,而且在匹配精度和
算法运算时间等方面的表现均优于原始SURF算法。 相似文献