共查询到20条相似文献,搜索用时 515 毫秒
1.
一种双目立体视觉算法的GPU实现 总被引:1,自引:0,他引:1
利用可编程图形硬件GPU实现了非参数局域变换双目立体视觉算法。该算法使用局部非参数统计的结果而不是像素灰度值作为匹配代价,相对于其它基于区域的立体匹配算法,具有物体边界区域处理稳定和适于硬件实现等优点。该文利用GPU的最新特性实现了算法的全部运算都在GPU上执行。由于GPU的并行流水特性,算法在GPU上的运算速度较在CPU上得到提高。 相似文献
2.
近年来,容器由于具有轻量级以及高可扩展性,逐渐替代了虚拟机,被广泛应用于深度学习云平台中。但目前深度学习云平台在GPU资源管理上依然存在着不足,主要表现为由于容器编排技术的限制,多个容器无法共享使用GPU资源,而对于一些小规模模型的训练任务和推理任务,单个任务并不能充分利用整张GPU卡的计算资源。当前的独占模式会导致昂贵的GPU资源的浪费,降低资源效率和服务可用性。针对这一问题,提出了一种GPU共享调度系统。一方面,基于Kubernetes的Operator机制对现有集群功能进行扩展,实现了多个Pod共享使用GPU资源,同时设计了一种代理机制保证了与原生Kubernetes的兼容性。另一方面,基于GPU时间片与抢占机制,实现了GPU资源的动态管理与调度,在多个任务之间进行细粒度的协调,并减少了任务干扰。实验结果表明,与原生Kubernetes调度系统相比,该系统能够将一组深度学习训练任务的完成时间平均减少约20%,使得集群GPU资源利用率平均提升约10%。在共享使用GPU时高优先级任务性能相较于独占GPU损耗不到5%,同时能够使得低优先级任务以20%的性能运行在同一张GPU上。 相似文献
3.
为提高模板匹配的速度和精度,提出了一种基于GPU实现的改进的实时互信息配准方法。为了算法不至于太复杂而不能在GPU下运行,使GPU临时变量减少到4个,然后利用GPU逐像素计算模板和焊缝图像的互信息。将所提算法应用到焊缝跟踪系统中,通过GPU来执行简化后的互信息计算,实验表明,所提出的算法可以完成每秒约30帧的图像焊缝跟踪。 相似文献
4.
针对移动终端上GPU的高功耗问题,提出一种基于Android系统的GPU动态调频方案。方案根据各种应用对GPU的性能需求,引入了GPU的频率-性能模型,包括选择工作频率和测量相对性能的方法。动态调频算法通过历史负载计算出预测负载,将其代入频率-性能模型后预测出下一周期GPU的频率。实验结果表明,方案在典型场景下可以快速跟踪GPU负载的变化,预测GPU频率的准确率达到95%以上。 相似文献
5.
图形处理器在通用计算中的应用 总被引:1,自引:1,他引:0
基于图形处理器(GPU)的计算统一设备体系结构(compute unified device architecture,CUDA)构架,阐述了GPU用于通用计算的原理和方法.在Geforce8800GT下,完成了矩阵乘法运算实验.实验结果表明,随着矩阵阶数的递增,无论是GPU还是CPU处理,速度都在减慢.数据增加100倍后,GPU上的运算时间仅增加了3.95倍,而CPU的运算时间增加了216.66倍. 相似文献
6.
7.
8.
《电脑编程技巧与维护》2010,(13):96-96
GPU精粹3
本书是GPU精粹系列畅销书的第三卷,展示了前沿的图形处理单元(GPU)编程技术。现代GPU的可编程性让开发者不仅可以在自己的岗位上迅速脱颖而出.更使得他们可以在非图形应用中运用GPU的卓越处理能力,例如,物理仿真、金融分析, 相似文献
9.
PC显卡支持IE9的GPU加速功能,且驱动安装正常,不过在Windows 7系统下启动IE9浏览器,依次打开"Internet选项/高级"的时候却找不到"加速的图形-使用软件呈现而不使用GPU呈现"这个选项。 相似文献
10.
随着GPU通用计算能力的不断发展,一些新的更高效的处理技术应用到图像处理领域.目前已有一些图像处理算法移植到GPU中且取得了不错的加速效果,但这些算法没有充分利用CPU/GPU组成的异构系统中各处理单元的计算能力.文章在研究GPU编程模型和并行算法设计的基础上,提出了CPU/GPU异构环境下图像协同并行处理模型.该模型充分考虑异构系统中各处理单元的计算能力,通过图像中值滤波算法,验证了CPU/GPU环境下协同并行处理模型在高分辨率灰度图像处理中的有效性.实验结果表明,该模型在CPU/GPU异构环境下通用性较好,容易扩展到其他图像处理算法. 相似文献
11.
12.
为加强人脸识别系统的隐私保护,本文引入基于灰度图像改变的加密解密算法对重要识别对象进行保护。为提高人脸识别与加密解密速度,运用OpenCL技术在异构平台下实现单设备与多设备的并行加速。测试结果表明,在使用单GPU时人脸识别局部加速达到1.9x,图像加密加速达到6.65x,而双GPU加速时,前者加速比可达4.11x,后者加速比与单GPU近似。
相似文献
13.
14.
15.
16.
最近一段时间,关于“在PC机中,是CPU重要还是GPU重要”,“是CPU要融合GPU,还是GPU要取代CPU”是业界比较热闹的话题之一。 相似文献
17.
Fermi的出台意味着通用计算成为GPU未来的关键,利用GPU来执行高并行浮点运算的话题为业界津津乐道,几乎所有的超级计算机厂商都对此兴奋异常,希望借助GPU的力量制造出更强大、更廉价的超级电脑。这股风潮几乎令业界漠视了GPU本源的使命,那就是更快地渲染出更真实的3D场景。 相似文献
18.
《计算机应用与软件》2017,(11)
针对分布式多节点多GPU的系统环境,实现一种基于CUDA框架的多GPU通用计算虚拟化平台。应用程序可以如同使用本地GPU一样方便地使用多个远程GPU,原来的CUDA应用程序可以不经过修改或者只进行少量的修改就可以运行在该虚拟化GPU平台上,从而实现单机多GPU和多机多GPU在编程模式上的统一,并通过一个基于高斯混合模型的数据聚类程序来进行实验验证。实验结果表明,在不影响程序正确性的前提下,相对于原来使用CPU的程序,使用两个远程GPU可以获得十倍左右的加速比。 相似文献
19.
随着GPU(graphics processing unit,图像处理单元)的快速发展,其强大的计算能力使得GPU由最初仅用于加速图形计算,越来越多地应用到非图形领域的计算。在CPU-GPU体系中,CPU负责进行复杂的逻辑运算和事务管理等不适合并行处理的数据计算,GPU负责进行计算密集度高、逻辑分支简单的适合并行处理的大规模数据计算。CPU-GPU体系的不断完善,使得利用GPU来加速大规模科学计算成为了一种必然趋势。着眼GPU的应用开发,介绍在windows环境下CUDA+VS2008开发平台的构架,并对该构架下GPU与CPU的科学计算性能进行比对。 相似文献
20.
很多人在谈论NVIDIA Tegra K1这款芯片的时候,都会被它192核GPU的光环所吸引,都为其PC级的图形性能而惊叹。但是,作为一颗SoC芯片,NVIDIA Tegra K1的改变绝不仅仅局限于GPU,在此之外,还有更多的秘密值得我们进一步发掘,这些秘密也将带来全新的平台体验。 相似文献