首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
一种双目立体视觉算法的GPU实现   总被引:1,自引:0,他引:1  
李亚峰  秦开怀 《计算机工程》2006,32(10):210-211,236
利用可编程图形硬件GPU实现了非参数局域变换双目立体视觉算法。该算法使用局部非参数统计的结果而不是像素灰度值作为匹配代价,相对于其它基于区域的立体匹配算法,具有物体边界区域处理稳定和适于硬件实现等优点。该文利用GPU的最新特性实现了算法的全部运算都在GPU上执行。由于GPU的并行流水特性,算法在GPU上的运算速度较在CPU上得到提高。  相似文献   

2.
为提高图像处理领域协方差矩阵的计算效率,满足其在实时要求下的应用,借助GPU通用计算技术,结合CUDA编程模型,对协方差矩阵的计算进行有针对性的并行化优化,设计并实现一种高效的并行图像协方差矩阵算法。为在通用PC平台上使用协方差矩阵并满足实时性需求的各种图像处理应用提供了一个可行的解决方法,对其它领域涉及到协方差矩阵的实时计算也有良好的借鉴作用。与原有的CPU实现方法相比,GPU的效率有了平均数千倍的提升。  相似文献   

3.
双目立体视觉求取三维坐标的方法研究   总被引:4,自引:0,他引:4  
双目立体视觉一般通过最优化方法求取点的三维坐标,若采用不同的目标函数,将会存在其它形式的最优化解,在另外一种目标函数下导出了一种新的计算三维坐标的方法,与传统的最小二乘法和归一化最小二乘法相比,新方法通过矩阵的奇异值分解(SVD)计算坐标值,可以避免矩阵求逆.通过实验分析得出,新方法求取三维坐标的误差与传统的最小二乘法及归一化最小二乘法计算三维坐标的误差比较接近,进而验证了新方法求取三维坐标的可行性和正确性.  相似文献   

4.
随着GPU功能越来越强大,特别是CUDA的推出,在全世界范围内掀起了一场对GPU通用计算的研究热潮,本文在研究国内最新文献的基础上,从GPU通用计算的发展历程、架构优势、发展方向等方面对其进行了深入解读,提出了GPU通用计算发展普及的一些有效建议。  相似文献   

5.
随着图形硬件的快速发展,GPU的通用计算已经成为了一个新的研究领域。本文分析GPU编程模型,介绍使用图形硬件进行通用计算的方法,并把一些常用的算法映射到了GPU上。通过这些算法与CPU上对应的算法进行比较,分析使用GPU进行通用计算的优势和劣势。  相似文献   

6.
胡晓鹏 《微计算机信息》2007,23(15):293-294
立体视觉计算过程中的匹配值计算极其耗时,整幅图的匹配值由各个参考像点的匹配值计算构成,因此,如果能够将前后两次参考像点的匹配值计算中重复的部分提取出来,那么就可以节约部分计算时间。将前后两次匹配值计算所涉及的领域像素分布情况分析清楚,结合所选取的计算步骤,将各个子步骤的中间输出结果缓存起来,以便下一次计算时直接使用而不需重新计算。如果匹配所用的邻域子图与整幅图相比非常小,则这种类似于流水作业的时间重叠计算方式可以获得很好的加速性能,同时该加速性能也会随着邻域尺寸的加大而提高,这得益于所省略的中间计算步骤较多的原因。  相似文献   

7.
GPU的通用计算应用研究   总被引:9,自引:0,他引:9  
由于图形处理器(GPU)最近几年迅速发展,国内外学者已经将基于GPU的通用计算作为一个新的研究领域。本文在研究国外最新文献的基础上,分析了GPU本身的特性,阐明了基于GPU的应用程序的结构,研究了GPU在编程方法上与普通CPU的差别,并以高斯滤波为实例详细描述了GPU编程的方法和过程。  相似文献   

8.
设计和研究了一种基于S3C2440硬件平台和嵌入式Linux双目立体视觉测距系统.该系统通过使用两个USB摄像头同步采集图像数据,并利用OpenCV对采集的两幅图像的数据进行处理,计算目标物在两幅图像中的像素偏差,进而算出目标物到摄像头平面的距离,在论文中以车牌作为目标物.同时该系统用Qt/Embedded实现LED实时显示图像和数据.整个系统建立在嵌入式架构上,能独立完成图像采集,数据处理,实时显示等功能.只要改变定位算法,则能测出任意目标物的距离.  相似文献   

9.
《微型机与应用》2015,(19):40-42
户外视觉系统采集图像时,容易受到低照度等因素的影响,导致捕获的图像退化,视见度降低。本文提出了一种基于双目立体视觉的图像增强算法。该算法首先通过立体匹配处理求解场景视差图像,然后构建广义双边滤波估计图像照度分量,根据Retinex原理求解图像反射分量,实现图像的增强。实验证明,该算法能够有效地改善图像质量,提高双目视觉系统工作的鲁棒性和可靠性。  相似文献   

10.
为了提高立体视觉系统中的精度,本文提出了一种基于显隐的畸变校正模型。首先在世界坐标中对双目摄像头进行立体标定,然后采用基于显隐的畸变校正模型对双目摄像头采集的图像进行处理,实验结果表明,本文提出的一种基于显隐的畸变校正模型切实有效,且效果良好。  相似文献   

11.
袁良  张云泉  龙国平  王可  张先轶 《软件学报》2010,21(Z1):251-262
近年来在生物计算,科学计算等领域成功地应用了GPU 加速计算并获得了较高加速比.然而在GPU 上编程和调优过程非常繁琐,为此,研究人员提出了许多提高编程效率的编程模型和编译器,以及指导程序优化的计算模型,在一定程度上简化了GPU上的算法设计和优化,但是已有工作都存在一些不足.针对GPU低延迟高带宽的特性,提出了基于延迟隐藏因子的GPU 计算模型,模型提取算法隐藏延迟的能力,以指导算法优化.利用3 种矩阵乘算法进行实测与模型预测,实验结果表明,在简化模型的情况下,平均误差率为0.19.  相似文献   

12.
为克服mean shift算法计算复杂度高、运行速度慢的缺点,提出一种基于GPU的快速mean shift算法.首先使用k-means算法对图像像素进行预分类,之后在预分类、下采样后缩小的数据集上进行mean shift聚类,以有效地降低算法复杂度.此外,借助GPU的通用计算功能对k-means和mean shift分别进行并行了处理.实验结果表明,通过对图像进行预处理,有效地提高了几何模板查找在强噪声、低信噪比图像中的识别率;同时,改进后的mean shift算法的运行速度提高了近40倍,满足了高速机器视觉检测的实时性要求.  相似文献   

13.
This paper introduces how to optimize a practical prestack Kirchhoff time migration program by the Compute Unified Device Architecture (CUDA) on a general purpose GPU (GPGPU). A few useful optimization methods on GPGPU are demonstrated, such as how to increase the kernel thread numbers on GPU cores, and how to utilize the memory streams to overlap GPU kernel execution time, etc. The floating-point errors on CUDA and NVidia's GPUs are discussed in detail. Some effective methods that can be used to reduce the floating-point errors are introduced. The images generated by the practical prestack Kirchhoff time migration programs for the same real-world seismic data inputs on CPU and GPU are demonstrated. The final GPGPU approach on NVidia GTX 260 is more than 17 times faster than its original CPU version on Intel's P4 3.0G.  相似文献   

14.
目的 在微小飞行器系统中,如何实时获取场景信息是实现自主避障及导航的关键问题。本文提出了一种融合中心平均Census特征与绝对误差(AD)特征、基于纹理优化的半全局立体匹配算法(ADCC-TSGM),并利用统一计算设备架构 (CUDA)进行并行加速。方法 使用沿极线方向的一维差分计算纹理信息,使用中心平均Census特征及AD特征进行代价计算,通过纹理优化的SGM算法聚合代价并获得初始视差图;然后,通过左右一致性检验检查剔除粗略视差图中的不稳定点和遮挡点,使用线性插值和中值滤波对视差图中的空洞进行填充;最后,利用GPU特性,对立体匹配中的代价计算、半全局匹配 (SGM)计算、视差计算等步骤使用共享内存、单指令多数据流 (SIMD)及混合流水线进行优化以提高运行速度。结果 在Quarter Video Graphics Array (QVGA)分辨率的middlebury双目图像测试集中,本文提出的ADCC-TSGM算法总坏点率较Semi-Global Block Matching (SGBM)算法降低36.1%,较SGM算法降低28.3%;平均错误率较SGBM算法降低44.5%,较SGM算法降低49.9%。GPU加速实验基于NVIDIA Jetson TK1嵌入式计算平台,在双目匹配性能不变的情况下,通过使用CUDA并行加速,可获得117倍以上加速比,即使相较于已进行SIMD及多核并行优化的SGBM,运行时间也减少了85%。在QVGA分辨率下,GPU加速后的运行帧率可达31.8 帧/s。结论 本文算法及其CUDA加速可为嵌入式平台提供一种实时获取高质量深度信息的有效途径,可作为微小飞行器、小型机器人等设备进行环境感知、视觉定位、地图构建的基础步骤。  相似文献   

15.
利用GPU的强大浮点数计算能力和并行处理能力,提出一种完全基于GPU的视点相关自适应细分内核进行快速细分计算的方法.在GPU中,依次实现视点相关的面片细分深度值计算、基于基函数表的细分表面顶点求值、细分表面绘制等核心步骤,无须与CPU端系统内存进行几何数据交换.视点相关的自适应细分准则在表面绘制精度保持不变的情况下,有效地降低了细分表面的细分深度和细分的计算量,在此基础上完全基于GPU的细分框架使得曲面细分具有快速高效的特点.该方法还可以在局部重要细节用较大深度值进行实时自适应细分,以逼近极限曲面.  相似文献   

16.
应用GPU通用高性能编程技术实现一种加速地震叠前时间偏移的新方法.该技术是地震勘探处理的常规流程,其核心算法具有计算密集、数据独立性强、并行性高等特点.通过性能剖析获得其计算热点,通过CUDA技术对其进行并行化改造,并利用CUDA的流技术实现CPU到GPU的异步传输.通过集群环境下的性能测试,应用GPU并行化的PSTM程序可明显缩短运行时间.  相似文献   

17.
18.
针对GPU图形处理的特点,分析其应用于通用计算的并行处理机制和数据映射,提出了一种GPU通用计算模式的映射机制和一般性设计方法,并针对GPU的吞吐量、数据流处理能力和基本数学运算能力等进行性能测试,为GPU通用计算的算法设计、实现和性能优化提供参考依据。  相似文献   

19.
讨论了区域匹配代价和全局置信度传播算法之间的相互作用,提出一种基于全局置信度传播和区域边缘构建的立体匹配算法。首先,在每个像素的固定邻域内利用二阶微分边缘算子搜索并构建一条虚拟的封闭边缘,形成相应的区域自适应窗口;然后使用自适应窗口内的支持像素计算中心像素之间的匹配代价;最后利用具备加速消息更新机制的置信度传播算法获取视差。实验结果表明,基于区域边缘构建的匹配代价可以较好地适用于全局置信度传播优化算法,提出的立体匹配算法可以在Middlebury标准下获得良好的匹配结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号