首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 61 毫秒
1.
空间插值是地理信息系统(GIS)空间分析中计算复杂且耗时的操作,因此无法满足实时性的要求。随着图形处理器(GPU)浮点计算能力的大幅提高,GPU通用计算已成为处理GIS领域内复杂计算的研究热点。为实时化一些传统低效的算法提供了良好的契机。利用GPU在并行计算上的优势,将反距离加权法插值算法映射到了统一计算设备架构(CUDA)并行编程架构。首先在GPU中建立二级索引使计算层次得到了合理的划分,然后利用多线程分块策略执行并行插值计算。最后通过实验表明,该方法的插值误差与CPU方法相比能控制在10-6数量级,并且在插值半径较大插值数据较多的情况下,该算法可达到40倍以上的加速比。充分证明了该方法的正确性及高效性。  相似文献   

2.
基于图形处理器的边缘检测算法   总被引:1,自引:0,他引:1  
边缘检测是一种高度并行的算法,计算量较大,传统的CPU处理难以满足实时要求。针对图像边缘检测问题的计算密集性,在分析常用边缘检测算法的基础上,利用CUDA(Compute Unified Device Architecture,计算统一设备架构)软硬件体系架构,提出了图像边缘检测的GPU(Graphics Processing Unit,图形处理器)实现方案。首先介绍GPU高强度并行运算的体系结构基础,并将Roberts和Sobel这两个具有代表性的图像边缘检测算法移植到GPU,然后利用当前同等价格的CPU和GPU进行对比实验,利用多幅不同分辨率图像作为测试数据,对比CPU和GPU方案的计算效率。实验结果表明,与相同算法的CPU实现相比,其GPU实现获得了相同的处理效果,并将计算效率最高提升到了17倍以上,以此证明GPU在数字图像处理的实际应用中大有潜力。  相似文献   

3.
野外采集的地震勘探原始记录中通常包含多种噪声。噪声的存在降低了地震资料的信噪比,影响地震资料处理成果品质,因此,去噪方法研究和应用是处理工作的重要环节之一。"加权中值滤波自动检测并压制强能量干扰方法"是一种在准噶尔盆地油气勘探中非常有效的噪声压制方法。该方法在地震数据原始记录频率域剖面上采用加权中值滤波的方法自动检测可能存在的强能量干扰,并针对性地对相应频段上的噪声信号进行压制,去噪效果较为理想。但该方法的算法运行过程中涉及大量的数据计算,开发的程序需要花费大量时间才能完成一次去噪过程。提高计算效率成为该噪声压制方法推广应用的关键。高质量图像处理用途的高端图形处理器(GPU)在大规模高带宽计算方面表现出色,近年来更多地应用于高性能计算工作。CUDA并行计算开发平台帮助应用人员开发高效率计算程序,使GPU能更容易应用于高性能计算。通过分析"加权中值滤波自动检测并压制强能量干扰方法"算法实现方式,发现该算法适宜利用GPU进行并行化改造。利用CUDA并行编程技术将该算法中部分串行执行的数据计算过程改造成适合GPU计算的并行计算过程,使整个去噪方法工作效率提升3倍。GPU并行计算技术能使油气勘探数据处理过程中类似应用有效并行化,利用较小成本实现高效计算效率。  相似文献   

4.
针对现代优化算法在处理相对复杂问题中所面临的求解时间复杂度较高的问题,引入基于GPU的并行处理解决方法。首先从宏观角度阐释了基于计算统一设备架构CUDA的并行编程模型,然后在GPU环境下给出了基于CUDA架构的5种典型现代优化算法(模拟退火算法、禁忌搜索算法、遗传算法、粒子群算法以及人工神经网络)的并行实现过程。通过对比分析在不同环境下测试的实验案例统计结果,指出基于GPU的单指令多线程并行优化策略的优势及其未来发展趋势。  相似文献   

5.
基于GPU的实时图像拼接   总被引:1,自引:1,他引:0  
大视野、高质量的图像信息对地面移动机器人的遥控操作具有非常重要的意义。提出了一种基于先验信息的自适应图像拼接方法。该方法在图像大致重叠区域中均匀选取待匹配点,利用改进的具有旋转不变性的NCC(Normalized Cross Correlation,归一化互相关)匹配方法进行区域相似性度量,通过RANSAC(Random Sample Con-sensus,随机采样一致性)算法估计图像射影变换模型,采用线性淡入淡出法进行图像融合。利用GPU强大的并行处理能力对算法进行了并行化实现,使图像拼接效率比单独采用CPU提高了60倍以上,稳定的拼接速度可达21.3fps。  相似文献   

6.
基于图形处理器(GPU)的通用计算   总被引:122,自引:20,他引:102  
伴随着PC级微机的崛起和普及,多年来计算机图形的大部分应用发生了从工作站向微机的大转移,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时(中、小规模)应用中.这一切的发生从很大程度上源自于图形处理硬件的发展和革新.近年来,随着图形处理器(GPU)性能的大幅度提高以及可编程特性的发展,人们首先开始将图形流水线的某些处理阶段以及某些图形算法从CPU向GPU转移.除了计算机图形学本身的应用,涉及到其他领域的计算,以至于通用计算近2~3年来成为GPU的应用之一.并成为研究热点.文中从若干图形硬件发展的历史开始,介绍和分析最新GPU在通用计算方面的应用及其技术原理和发展状况,并结合作者自身的实践讨论和探索其发展前景。  相似文献   

7.
字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经在很多应用上取得了卓越成效。gAC作为一种基于GPU的并行AC算法,针对GPU的SIMT(Single-Instruction Multiple-Thread)以及合并存储器访问的技术特点,采取了减少条件分支、合并访问全局存储器等优化方法,使得在C1060GPU上的字符串扫描速度达到51Gb/s,比基于CPU的串行算法提升了28倍。  相似文献   

8.
针对SIFT变型算法描述向量维数过高实、时性差的问题,分别在建立高斯尺度金字塔、关键点的亚像素定位等方面进行改进与并行化。利用CUDA设备构架在GPU硬件上实现多线程,一方面避免了PCA方法造成的关键点信息流失,另一方面使得配准速度达到了工程中的实时性要求。在VS2005平台上通过C语言实现混合CUDA编程,结果表明该方法使得配准速度和点对匹配正确率都有较大提升。  相似文献   

9.
基于CUDA的并行布谷鸟搜索算法设计与实现   总被引:1,自引:0,他引:1  
布谷鸟搜索(cuckoo search,CS)算法是近几年发展起来的智能元启发式算法,已经被成功应用于多种优化问题中。针对CS算法在求解大数据、大规模复杂问题时,计算时间过长的问题,提出了一种基于统一计算设备架构(compute unified device architecture,CUDA)的并行布谷鸟搜索算法。该算法的并行实现采用任务并行与数据并行相结合的方式,利用图形处理器(graphic processing unit,GPU)线程块与线程分别映射布谷鸟个体与个体的每一维数据,并行实现CS算法中的鸟巢位置更新、个体适应度评估、鸟巢重建、寻找最优个体操作。整个CS算法的寻优迭代过程完全通过GPU实现,降低了算法计算过程中CPU与GPU的通信开销。对4个经典基准测试函数进行了仿真实验,结果表明,相比标准CS算法,基于CUDA架构的并行CS算法在求解收敛性一致的前提下,在求解速度上获得了高达110倍的计算加速比。  相似文献   

10.
图形处理器CUDA编程模型的应用研究   总被引:5,自引:0,他引:5  
由于图形处理器(GPU)最近几年的快速发展,基于 GPU 的通用计算已经成为一个新的研究领域.通过对nVIDIA 公司最新的通用计算 GPU 编程模型-CUDA 的研究,阐明了 CUDA 应用程序的结构和它本身特征,讨论和分析了 CUDA 编程方法与普通 CPU 编程的差别,并以 H.264 数字视频编解码中,以消除宏块边界锯齿为主要目的的去块滤波模块为实例.详细描述了 CUDA 编程的方法和特点,最后通过与 CPU 编程实现的去块滤波模块的性能比较,揭示了 CUDA 在计算能力上的优势,为进一步优化编解码器性能和 GPU 通用计算提供了新的方法和思路.  相似文献   

11.
基于网络处理器开发的网络设备能够很好地解决灵活性和高性能之间的矛盾.基于网络处理器IXP2400自身的特点,设计了多维异常检测系统.该系统可以有效地检测和防御DDOS攻击.根据TCP/IP协议簇,对数据包进行多维解析,统计以及异常标记.仿真和硬件实验的验证数据表明,该系统能准确无误地按照设计目标一一分解数据包,并标记出异常值,从而为后续的网络安全的研究和防御工作提供可靠的数据保证.  相似文献   

12.
传统的传感器在移动机器人障碍物检测领域都有其各自的局限性。文章提出基于Kinect的障碍物检测方法:利用Kinect传感器获取环境深度图像;通过Kinect标定配准之后获取校准参数;通过该参数获得图像像素点与空间三维坐标的对应关系;通过空间三维坐标确定地平面与障碍物区域,并将障碍物区域作为感兴趣区域;通过三维坐标在x轴和z轴的连续性对感兴趣区域进行处理,分割出各个障碍物。实验结果表明,文中算法可以有效且实时地检测到障碍物信息。  相似文献   

13.
针对堆栈处理器特殊架构,为提高实时性,引入多任务堆栈技术,采用Forth自生成器技术,提出一种基于堆栈处理器的抢占式与时间片轮转调度方法,实现了在Forth堆栈处理器中实时多任务的运行,弥补了Forth堆栈处理器在实时多任务操作系统方面的的不足.实验表明,与当前基于寄存器处理器的嵌入式Forth实时系统相比,本文方法在最大关中断时间、任务上下文切换时间和任务响应时间三项重要的实时任务性能指标方面,实时性能有明显提升,从而保证了Forth系统应用的高效性和安全性,满足人们对Forth堆栈处理器实时多任务操作系统方面的应用需求.  相似文献   

14.
In this paper, we use wireless sensor network in motion analysis and computer vision processing. We mainly monitor and analyze various kinds of motion through wireless sensor network. When dealing with computer vision, we use wireless sensor networks to capture moving objects and analyze their detailed motion parameters. We mainly use two types of sensors to receive information, and then fuse the data they receive. These data can be applied in various fields, such as robot field. In this study, we also proposed the predictive data analysis technology, which can be used to determine the health status of the body by monitoring the robot's movement under certain conditions. At the same time, this technology can also be applied to the rehabilitation training of the injured patients. This technique can not only be used in exercise analysis, but also provide some useful suggestions and optimal exercise time for patients' rehabilitation training, which is very helpful for patients' rehabilitation and strength training. In this paper, the pilot's work is simulated by different actions, and a large number of visual motion data are generated in the experiment. In addition, we also explored some elderly patients with dyskinesia, and carried out disease monitoring and exercise monitoring on them.  相似文献   

15.
Two novel methods of clustering of a collection of collinear line segments are presented. Both the methods are of merging type, global in nature and take into account both gap and line segment lengths. The methods are also useful for clustering collinear dot patterns. The efficacy of the algorithms is brought out by successfully applying them on different types of data sets. A comparative study is made by comparing the results of the proposed procedures with that of another procedure already existing.  相似文献   

16.
高可靠性的系统都要求具备实时错误检测。针对内建错误检测,提出了三种在线模型的自我实时检测方法。错误检测模型利用了现场可编程门阵列(FPGA)中的两个管道,通过比较当前配置信息与FPGA外配置内存中的原始信息是否一致,可以实时地检测错误,而且可以通过比较它们的配置数据来定位那些具有单粒子翻转(SEU)错误的逻辑块。仿真测试结果表明所提出的方法比在线BIST有着更好的性能。  相似文献   

17.
In this paper, we proposed a method for accelerating brain extraction computations from cerebral MRI volume using compute unified device architecture (CUDA) based on multi-core graphic processing units (GPU). This algorithm is based on the well-known brain extraction method—Brain Extraction Tool (BET). In order to significantly reduce the computational time for real-time processing, the algorithm was performed in a parallel way by assigning one thread in GPU to calculate the new position of one vertex on the brain surface and all the vertices on the brain surface on one slice are processed in the same thread block, thus all the positions of the vertices on the brain’s surface can be updated in the same time. Experiments showed the computational time of this parallel method was less than one second and much less than that of normal BET. A slice-by-slice way was also used to improve the accuracy of our algorithm, and both the result and consuming time are desirable.  相似文献   

18.
基于自适应背景的实时运动物体检测   总被引:8,自引:0,他引:8  
为了能够在监控系统中实时的检测出运动物体,提出了一种能够自适应获取并更新背景的运动检测方法。它是利用连续帧差分,当前帧与背景图像差分来获取运动信息,同时选择性的更新背景。实验证明该算法运算量小,鲁棒性好,算法中通过直方图分析来获取合适的阈值,提高了系统的自动化程度。  相似文献   

19.
针对嵌入式越界检测系统的实时性问题,提出了基于感兴趣区域(ROI)的码书背景建模算法,并通过对ROI进行下采样和二值化处理,进一步提高算法的实时性和准确性。对D1格式的视频在TI DM648平台上进行测试,本文算法速度可以达到26 f/s,准确率可以达到92.65%,满足工程应用的需要。  相似文献   

20.
于乃功  柏德国 《控制与决策》2020,35(11):2761-2766
为了快速、准确地检测老年人跌倒事件的发生,给出一种基于姿态估计的实时跌倒检测算法.首先利用基于深度学习的人体姿态估计算法得到人体关节点的坐标;然后,通过计算人体质心点的下降速度、跌倒后颈部关节点的纵坐标值是否大于阈值、以及肩部和腰部关节点的相对位置关系来判断跌倒是否发生.所给出的跌倒检测算法利用单目相机进行检测,便于以嵌入式方式应用于机器人.实验结果表明,所提出算法与当前先进方法相比取得了较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号