期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李亚峰秦开怀《计算机工程》2006,32(10):210-211,236

利用可编程图形硬件GPU实现了非参数局域变换双目立体视觉算法。该算法使用局部非参数统计的结果而不是像素灰度值作为匹配代价，相对于其它基于区域的立体匹配算法，具有物体边界区域处理稳定和适于硬件实现等优点。该文利用GPU的最新特性实现了算法的全部运算都在GPU上执行。由于GPU的并行流水特性，算法在GPU上的运算速度较在CPU上得到提高。相似文献

2.

深度学习容器云平台下的GPU共享调度系统

王壮王平辉王彬丞武文博王斌丛鹏宇《计算机科学》2023,(6):86-91

近年来，容器由于具有轻量级以及高可扩展性，逐渐替代了虚拟机，被广泛应用于深度学习云平台中。但目前深度学习云平台在GPU资源管理上依然存在着不足，主要表现为由于容器编排技术的限制，多个容器无法共享使用GPU资源，而对于一些小规模模型的训练任务和推理任务，单个任务并不能充分利用整张GPU卡的计算资源。当前的独占模式会导致昂贵的GPU资源的浪费，降低资源效率和服务可用性。针对这一问题，提出了一种GPU共享调度系统。一方面，基于Kubernetes的Operator机制对现有集群功能进行扩展，实现了多个Pod共享使用GPU资源，同时设计了一种代理机制保证了与原生Kubernetes的兼容性。另一方面，基于GPU时间片与抢占机制，实现了GPU资源的动态管理与调度，在多个任务之间进行细粒度的协调，并减少了任务干扰。实验结果表明，与原生Kubernetes调度系统相比，该系统能够将一组深度学习训练任务的完成时间平均减少约20%,使得集群GPU资源利用率平均提升约10%。在共享使用GPU时高优先级任务性能相较于独占GPU损耗不到5%,同时能够使得低优先级任务以20%的性能运行在同一张GPU上。相似文献

3.

实时的改进互信息匹配及其GPU实现 总被引：1，自引：1，他引：1

下载免费PDF全文

崔世林田斐《计算机工程与应用》2009,45(10):160-162

为提高模板匹配的速度和精度,提出了一种基于GPU实现的改进的实时互信息配准方法。为了算法不至于太复杂而不能在GPU下运行,使GPU临时变量减少到4个,然后利用GPU逐像素计算模板和焊缝图像的互信息。将所提算法应用到焊缝跟踪系统中,通过GPU来执行简化后的互信息计算,实验表明,所提出的算法可以完成每秒约30帧的图像焊缝跟踪。相似文献

4.

基于Android系统的GPU动态调频方案

陈屴《电子技术应用》2013,39(9):28-30

针对移动终端上GPU的高功耗问题,提出一种基于Android系统的GPU动态调频方案。方案根据各种应用对GPU的性能需求,引入了GPU的频率-性能模型,包括选择工作频率和测量相对性能的方法。动态调频算法通过历史负载计算出预测负载,将其代入频率-性能模型后预测出下一周期GPU的频率。实验结果表明,方案在典型场景下可以快速跟踪GPU负载的变化,预测GPU频率的准确率达到95%以上。相似文献

5.

图形处理器在通用计算中的应用 总被引：1，自引：1，他引：0

张健陈瑞《计算机工程与设计》2009,30(14)

基于图形处理器(GPU)的计算统一设备体系结构(compute unified device architecture,CUDA)构架,阐述了GPU用于通用计算的原理和方法.在Geforce8800GT下,完成了矩阵乘法运算实验.实验结果表明,随着矩阵阶数的递增,无论是GPU还是CPU处理,速度都在减慢.数据增加100倍后,GPU上的运算时间仅增加了3.95倍,而CPU的运算时间增加了216.66倍. 相似文献

6.

基于GPU的串匹配算法研究 总被引：7，自引：0，他引：7

张庆丹戴正华冯圣中孙凝晖《计算机应用》2006,26(7):1735-1737

BF算法是串匹配算法中最基础的算法，但它是串行算法，不适合图形处理器（Graphic Processing Unit, GPU）的体系结构。结合GPU的特殊体系结构，通过数据存取方式和计算策略的改进，充分利用了GPU的并行处理能力，从而基于GPU实现了BF算法。实验结果表明基于GPU的并行算法能够取得较好的加速比，同时也给出了在现有GPU架构上有效实现通用计算的瓶颈。相似文献

7.

GPU乎？CPU乎？协处理器乎？

《电脑时空》2008,(7):65-65

从去年下半年开始，NVIDIA开始大力推广视觉计算的概念，并且大胆的提出了“GPU和CPU，哪个对系统性能影响更大的问题”，而深感受到威胁的英特尔，则针锋相对地提出了通用处理器的概念，宣称衍生自CPU结构的通用处理器必将取代传统的GPU。相似文献

8.

新书点评

《电脑编程技巧与维护》2010,(13):96-96

GPU精粹3 本书是GPU精粹系列畅销书的第三卷，展示了前沿的图形处理单元（GPU）编程技术。现代GPU的可编程性让开发者不仅可以在自己的岗位上迅速脱颖而出．更使得他们可以在非图形应用中运用GPU的卓越处理能力，例如，物理仿真、金融分析，相似文献

9.

IE9找回“加速的图形”选项

Dying 《电脑迷》2012,(7):53

PC显卡支持IE9的GPU加速功能,且驱动安装正常,不过在Windows 7系统下启动IE9浏览器,依次打开"Internet选项/高级"的时候却找不到"加速的图形-使用软件呈现而不使用GPU呈现"这个选项。相似文献

10.

CPU/GPU 异构环境下图像协同并行处理模型

杨洪余李成明王小平姜青山《集成技术》2017,6(5):8-18

随着GPU通用计算能力的不断发展,一些新的更高效的处理技术应用到图像处理领域.目前已有一些图像处理算法移植到GPU中且取得了不错的加速效果,但这些算法没有充分利用CPU/GPU组成的异构系统中各处理单元的计算能力.文章在研究GPU编程模型和并行算法设计的基础上,提出了CPU/GPU异构环境下图像协同并行处理模型.该模型充分考虑异构系统中各处理单元的计算能力,通过图像中值滤波算法,验证了CPU/GPU环境下协同并行处理模型在高分辨率灰度图像处理中的有效性.实验结果表明,该模型在CPU/GPU异构环境下通用性较好,容易扩展到其他图像处理算法. 相似文献

11.

GPU架构下基于经验模态分解的地震瞬时属性并行提取算法的研究

曹晓初金弟王宗仁王启迪《计算机科学》2013,40(Z11):409-411,414

从地震勘探资料中提取地震瞬时属性具有十分重要的意义,而基于信号局部特征的经验模态分解为非线性非稳定信号提供了一种全新的瞬时属性提取方法。对经验模态分解算法在GPU架构上的并行处理实现进行了分析和研究。通过实验对比测试表明,GPU架构下的算法运行效率较CPU具有明显优势。在测试数据中,GPU加速比最高达到了8.66倍。相似文献

12.

基于OpenCL的人脸识别与隐藏系统

汪方良施慧彬 《计算机与现代化》2016,(1):16

为加强人脸识别系统的隐私保护,本文引入基于灰度图像改变的加密解密算法对重要识别对象进行保护。为提高人脸识别与加密解密速度,运用OpenCL技术在异构平台下实现单设备与多设备的并行加速。测试结果表明,在使用单GPU时人脸识别局部加速达到1.9x,图像加密加速达到6.65x,而双GPU加速时,前者加速比可达4.11x,后者加速比与单GPU近似。  相似文献

13.

GPU支持下基于粒子系统编辑器的特效技术研究

李心颖湛永松陈显军《图学学报》2011,(6):77-81

针对粒子系统在计算机游戏特效设计过程中所存在的控制精度不高、运算量大等问题,提出了一种通过粒子系统编辑器生成粒子并基于GPU进行实时渲染的方法.使用粒子系统编辑器能有利于提高粒子系统制作的可控性,而基于GPU的仿真绘制则能够提高大规模粒子系统渲染的实时性.实验证明,GPU支持下的可编辑粒子系统能有效提升计算机游戏开发中... 相似文献

14.

基于GPU栅格化的任意多边形布尔运算

《计算机工程》2018,(3)

任意多边形布尔运算大多基于CPU栅格化方法,而CPU的串行性会增加栅格化过程的耗时。为此,提出一种基于图形处理器(GPU)栅格化思想的多边形布尔运算算法。用GPU实现CPU中较耗时的二维图形栅格化过程并提取内外轮廓片元,构造GPU环境下的栅格数据结构及与之空间映射相对应的CPU环境下的顶点数据结构,采用CPU与GPU相协调的方式交替访问内外轮廓进行顶点跟踪及轮廓片元压缩,最终得到正确的布尔运算结果多边形。实验结果表明,与现有多边形布尔运算算法相比,该算法能有效控制精度,且具有更高的执行效率。相似文献

15.

基于OpenCL的双GPU基数排序算法

赵成龙施慧彬俞忻峰《计算机与现代化》2015,(1):27

为提高基数排序算法在异构并行平台下的资源利用率和算法加速比,提出基于OpenCL的双GPU基数排序算法。通过研究并行基数排序思想,以Y485P作为实验平台,使用OpenCL技术首先实现单GPU的基数排序算法,之后实现负载平衡的双GPU基数排序。测试结果表明,在使用单GPU时加速比为1.3x,使用双GPU时加速比为2.32x。相似文献

16.

GPU和CPU哪个更重要

赵军《现代计算机》2008,(6):122-122

最近一段时间，关于“在PC机中，是CPU重要还是GPU重要”，“是CPU要融合GPU，还是GPU要取代CPU”是业界比较热闹的话题之一。相似文献

17.

3D技术的皇冠光线追踪与物理加速

张健浪《微型计算机》2010,(9):124-130

Fermi的出台意味着通用计算成为GPU未来的关键，利用GPU来执行高并行浮点运算的话题为业界津津乐道，几乎所有的超级计算机厂商都对此兴奋异常，希望借助GPU的力量制造出更强大、更廉价的超级电脑。这股风潮几乎令业界漠视了GPU本源的使命，那就是更快地渲染出更真实的3D场景。相似文献

18.

基于虚拟化环境的多GPU并行通用计算平台研究

《计算机应用与软件》2017,(11)

针对分布式多节点多GPU的系统环境,实现一种基于CUDA框架的多GPU通用计算虚拟化平台。应用程序可以如同使用本地GPU一样方便地使用多个远程GPU,原来的CUDA应用程序可以不经过修改或者只进行少量的修改就可以运行在该虚拟化GPU平台上,从而实现单机多GPU和多机多GPU在编程模式上的统一,并通过一个基于高斯混合模型的数据聚类程序来进行实验验证。实验结果表明,在不影响程序正确性的前提下,相对于原来使用CPU的程序,使用两个远程GPU可以获得十倍左右的加速比。相似文献

19.

基于GPU的CUDA应用开发环境构架

邓力陈晓翔林嘉宇《微处理机》2013,34(1):1-3

随着GPU(graphics processing unit,图像处理单元)的快速发展,其强大的计算能力使得GPU由最初仅用于加速图形计算,越来越多地应用到非图形领域的计算。在CPU-GPU体系中,CPU负责进行复杂的逻辑运算和事务管理等不适合并行处理的数据计算,GPU负责进行计算密集度高、逻辑分支简单的适合并行处理的大规模数据计算。CPU-GPU体系的不断完善,使得利用GPU来加速大规模科学计算成为了一种必然趋势。着眼GPU的应用开发,介绍在windows环境下CUDA+VS2008开发平台的构架,并对该构架下GPU与CPU的科学计算性能进行比对。相似文献

20.

改变的不只是GPU NVIDIA Tegra K1光环外的秘密

张平《微型计算机》2014,(10):46-49

很多人在谈论NVIDIA Tegra K1这款芯片的时候，都会被它192核GPU的光环所吸引，都为其PC级的图形性能而惊叹。但是，作为一颗SoC芯片，NVIDIA Tegra K1的改变绝不仅仅局限于GPU，在此之外，还有更多的秘密值得我们进一步发掘，这些秘密也将带来全新的平台体验。相似文献