期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

马城城田泽黎小玉《微机发展》2013,(7):84-86,91

为满足日益复杂的应用需求、减轻CPU日益繁重的图形处理任务,促使图形处理器GPU产生、应用和不断发展。驱动软件作为GPU的重要组成部分,与GPU硬件的契合程度直接影响整个图形系统性能的发挥,出于各种原因高端GPU配套的图形驱动软件对外不公开或价格昂贵,对图形应用系统的开发带来不便。文中基于自研GPU芯片FPGA原型图形系统,讲述了VxWorks下GPU驱动软件的设计与实现,该驱动软件为用户提供3D处理和2D处理接口。其中3D处理实现完整的OpenGL1.3基本库及GLU、GLUT辅助库;2D处理使用VxWorks操作系统的WindML组件实现。较好实现了图形处理软件与硬件的配合,对自主GPU芯片应用开发意义重大。相似文献

2.

基于GPU FPGA芯片原型的VxWorks下驱动软件开发

马城城田泽黎小玉《计算机技术与发展》2013,23(7)

为满足日益复杂的应用需求、减轻CPU日益繁重的图形处理任务,促使图形处理器GPU产生、应用和不断发展.驱动软件作为GPU的重要组成部分,与GPU硬件的契合程度直接影响整个图形系统性能的发挥,出于各种原因高端GPU配套的图形驱动软件对外不公开或价格昂贵,对图形应用系统的开发带来不便.文中基于自研GPU芯片FPGA原型图形系统,讲述了VxWorks下GPU驱动软件的设计与实现,该驱动软件为用户提供3D处理和2D处理接口.其中3D处理实现完整的OpenGL1.3基本库及GLU、GLUT辅助库;2D处理使用VxWorks操作系统的WindML组件实现.较好实现了图形处理软件与硬件的配合,对自主GPU芯片应用开发意义重大. 相似文献

3.

Jacobi和Laplace算法在GPU平台上的设计与实现 总被引：1，自引：1，他引：0

唐滔林一松《计算机工程与科学》2009,31(Z1)

随着半导体工艺的发展,GPU的浮点计算能力迅速提高。如何把GPU处理技术应用到非图形计算领域成为体系结构以及高性能计算领域的热点研究问题。Jacobi和Laplace是科学计算领域常用的计算核心。本文基于AMD的流处理GPU平台设计并实现了这两个算法,相对于CPU平台取得了很好的加速效果。相似文献

4.

OpenCL计算软件栈评估

朱浩周博洋卢雪山杜溢墨《计算机工程与科学》2021,43(12):2105-2114

随着智能计算和大数据应用的发展,人们对GPU等加速部件的需求不断增长.计算软件栈比如CUDA、OpenCL软件栈是能充分发挥GPU硬件性能的关键.考虑计算软件栈未来在国产基础软硬件平台(比如飞腾CPU和麒麟操作系统)上的可移植性和适配性,重点研究OpenCL开源计算软件栈.测试分析OpenCL应用在不同平台上的表现,评估应用在不同OpenCL软件栈上(比如Mesa、ROCm等)进行GPU计算的表现,评估软件栈中驱动、内核等对GPU计算的影响,并且整个测试涵盖了编译、数据传输和内核执行等OpenCL计算各个阶段的时间开销.经过测试评估发现,国产平台更迫切也更适合使用GPU进行加速计算,ROCm是比较理想的OpenCL开源软件栈,有较好的性能和稳定性,并且与闭源软件栈相比存在一定的优化空间. 相似文献

5.

动态模式识别算法的GPU平台实现

林文愉王聪《计算技术与自动化》2013,(1):68-72

研究动态模式识别算法在GPU并行计算平台的实现。随着GPGPU(通用计算图形处理器)硬件的发展,基于GPU的大规模并行计算技术将有效地处理动态模式识别算法带来的海量计算问题。文中通过介绍动态模式识别算法,对算法中涉及的巨大计算量进行分析,并针对性地对其中密集计算部分进行并行化分解,移除原算法中在执行中存在的依赖关系,最终得到算法在特定的GPU平台———Jacket上的并行计算实现。实例验证表明,相比于原CPU串行程序,在GPU上运行的并行化程序能实现明显加速,因而具有很好的工程应用价值。相似文献

6.

GPU在复杂场景的阴影绘制中的应用 总被引：4，自引：0，他引：4

下载免费PDF全文

杨兵李凤霞战守义胡敏勇《计算机工程》2006,32(2):220-222

通过有效利用图形硬件的图形处理单元（GPU）的运算能力和可编程性，将人量计算从CPU分离出来。在GPU上采用顶点和片元程序进行阴影计算，从而加速复杂场景阴影绘制。选择图像空间阴影算法进行GPU加速绘制。用Cg图形编程语言和OpenGL实现了算法的绘制过程，能够满足通用的复杂3D场景应用的需要，达到满意的实时绘制效果。相似文献

7.

PXA300平台2D图形加速器性能测试与分析

蒋永刚戚正伟彭娟春张泉《计算机应用与软件》2010,27(5):86-88

简要介绍了嵌入式图形领域中2D图形加速器的基本情况,并结合Monahans的应用平台的开发,实现了基于Bootloader上的M arvell PXA300集成2D图形加速器的驱动,通过随机生成参数,测试了该图形加速器的绘图速度,并与软件加速的渲染速度进行了比较。相似文献

8.

并行时空处理模型下的快速N-body算法

下载免费PDF全文

王伟曾栩鸿王福焕傅丽丽曾国荪《计算机科学与探索》2011,5(11):1006-1013

图形处理器(graphic processing unit,GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU的CUDA(compute unified device architecture)和OpenCL(open computing language)编程模型为程序员提供了充足的类似于C语言的应用程序接口(application programming interface,API),便于程序员发挥GPU的并行计算能力。采用图形硬件进行加速计算,通过一种新的GPU处理模型——并行时间空间模型,对现有GPU上的N-body实现进行了分析,从而提出了一种新的GPU上快速仿真N-body问题的算法,并在AMD的HD Radeon 5850上进行了实现。实验结果表明,相对于CPU上的实现,获得了400倍左右的加速;相对于已有GPU上的实现,也获得了2至5倍的加速。相似文献

9.

异构多核SoC可编程图形系统硬件设计

周建伟韩俊刚李涛杜慧敏焦继业《电子技术应用》2014,(7):40-43

采用开源LEON3(basic version)处理器,运行Linux操作系统,并驱动西安邮电大学自主设计研发的基于传统GPU架构的可编程图形处理器,实现了包含可编程图形系统的SoC平台。将系统集成到Dini Group最新的DNV6_F2PCIE开发板上,采取OpenGL编程,通过鼠标、键盘、显示器运行2D、3D程序,进行图形的绘制,从而比较充分地验证了图形系统硬件设计。相似文献

10.

3D非均匀直线网格GPU体绘制方法研究

下载免费PDF全文

袁斌《图学学报》2010,31(3):76

计算机图形硬件技术的快速发展可以用来加速可视化过程,为此针对非均匀直线网格,给出了基于均匀辅助网格的CPU光线投射算法、基于辅助纹理的GPU光线投射算法,以及基于切片的3D纹理体绘制算法,并在Nvidia Geforce 6800GT图形卡上对这些算法进行了测试。结果表明,GPU算法远远快于CPU算法,而基于切片的3D纹理体绘制算法则快于GPU光线投射算法。相似文献

11.

基于可编程GPU的骨骼动画

季卓尔张景峤《计算机工程与应用》2008,44(22):77-80

骨骼动画与以前的动画方法相比,具有占用空间小等优点。但是其代价是计算量的增加,从而导致绘制效率的降低。另一方面,近年来可编程GPU技术在三维图形处理领域已得到广泛研究。因此,提出了一种基于GPU实现骨骼动画的方法。该方法借助GPU强大的计算能力,分担了骨骼动画中的顶点更新的计算任务,从而大大提升了骨骼动画的绘制效率。相似文献

12.

基于 GPU 加速技术的 C 形臂 Cone Beam CT 三维图像快速重建方法

陈垦王澄梁晓坤熊璟谢耀钦《集成技术》2017,6(6):47-58

平板探测器技术的发展使得锥形束计算机断层扫描技术(Cone Beam Computerized Tomography,CBCT)成为一种重要的成像技术,有着十分广泛的应用.基于C形臂的CBCT,除了具有CBCT的技术优势外,还特别适合在影像引导介入手术中应用.然而,如何在满足手术实时性要求的同时获得高分辨率高质量的三维断层图像,仍是个十分具有挑战性的课题.文章提出一种基于GPU加速技术的C形臂CBCT三维图像快速重建方法:在算法层面应用GPU并行加速技术对重建算法进行优化,在系统层面通过设计分布式系统和延迟隐藏机制,大大提升了由二维投影图像重建三维体数据的效率.在保持重建精度的前提下,优化后的GPU加速的FDK算法极大地提升了重建过程的计算效率.延迟隐藏机制进一步提升了系统的运行效率.在使用90帧投影时,系统效率提升了26%,重建延迟加速了2.1倍;当使用120帧投影时,系统效率提升39%,重建延迟加速达到3.3倍. 相似文献

13.

GPU的通用计算应用研究 总被引：9，自引：0，他引：9

张浩李利军林岚《计算机与数字工程》2005,33(12):60-62,98

由于图形处理器（GPU）最近几年迅速发展，国内外学者已经将基于GPU的通用计算作为一个新的研究领域。本文在研究国外最新文献的基础上，分析了GPU本身的特性，阐明了基于GPU的应用程序的结构，研究了GPU在编程方法上与普通CPU的差别，并以高斯滤波为实例详细描述了GPU编程的方法和过程。相似文献

14.

一种基于GPU的粒子系统 总被引：2，自引：0，他引：2

许楠郝爱民王莉莉《计算机工程与应用》2006,42(19):77-79,139

粒子系统在当今不定形物体仿真中已经得到广泛的应用,但是普通的粒子系统在实时仿真中,粒子总数最多只能达到10000个左右,其中瓶颈在于粒子数据从主处理器到图形硬件的传输和CPU的并行处理能力。文章研究并实现了一种完全基于图形硬件(GPU)的粒子系统,利用GPU的多通道并行处理功能,提高处理速度,可以很大程度地增加粒子系统实时仿真应用中的粒子数量,从而可以提高虚拟环境的逼真程度。实验证明基于GPU的粒子系统的实时性能远远高于普通粒子系统。相似文献

15.

区域填充扫描线算法的硬件设计与实现

李平韩俊刚李自迪杨婷婷《微计算机信息》2011,(6)

在图形处理器(GPU)的研究中,提高图形加速器的描绘速度,特别是提高区域填充的效率是一个关键技术。采用软件实现区域填充,速度慢,限制了图形加速器效率的提高。本文采用一种改进的区域填充扫描线算法,设计了具体的硬件实现方法,并将其应用于一个完整的2D图形加速器系统,提高了加速器的效率,最终在Altera的cycloneII系列开发板上进行了验证。相似文献

16.

基于GPU带有复杂边界的三维实时流体模拟 总被引：27，自引：0，他引：27

下载免费PDF全文

柳有权刘学慧吴恩华《软件学报》2006,17(3):568-576

在GPU(graphics processing unit)上求解了复杂场景中的三维流动问题,充分利用了GPU并行能力以加速计算.与前人的方法不同,该方法对于边界条件的处理更为通用.首先,通过在图像空间生成实心的剖切截面构成整个障碍物信息图,算法使得流体计算与整个几何场景的复杂度无关,通过对各体素进行分类并结合边界条件,根据障碍物形成修正因子来修改对应的值;另外,采用更为紧凑的数据格式,以充分利用硬件的并行性.通过将所有标量的运算压缩到纹元的4个颜色通道并结合平铺三维纹理,减少了三维流场计算所需要的绘制次数.实验结果显示出算法的有效性和高效率.该算法可以实时计算并显示一个采用中等规模离散的复杂场景. 相似文献

17.

GPU辅助的希尔伯特变换轮廓术

下载免费PDF全文

周波赵小敏王东平《中国图象图形学报》2012,17(4):459-464

在希尔伯特变换轮廓术中,相位计算速度的快慢直接影响光学3维测量速度。由于相位计算是在每幅图像的每个像素上分别进行的,每个待处理的像素和已计算的像素之间不存在依赖性,因此具有极高的计算密度,可以通过多线程运行相同的程序进行并行计算。统一架构的图形处理器(GPU)具有强大的数值并行计算能力,可以在GPU上实现并行计算。在分析相位计算的特点后,在GPU上进行相位的并行计算,实现了CPU与GPU的协同工作,解决了在CPU上相位计算方法速度较慢的问题。实验结果表明,经GPU加速后,在相位计算的质量相同的情况下,计算速度有了较大的提高。相似文献

18.

地震资料逆时偏移中的图形处理器加速算法

柯璇石颖刘诗竹《计算机系统应用》2013,22(11):115-118

叠前逆时偏移（RTM）方法是目前地震勘探领域最为精确的一种地震数据成像方法,其运用双程声波方程进行波场延拓,可实现对复杂构造介质的准确成像．文中采用互相关成像条件对震源波场与检波点波场在同时刻相关成像．针对RTM方法计算量大的问题,将图形处理器（GPU）引入到RTM计算中,充分挖掘GPU的众核结构优势,利用基于CUDA架构的并行加速算法取代传统CPU的串行运算,对逆时偏移算法中较为耗时的波场延拓和相关成像过程进行加速．复杂模型测试结果表明,在确保RTM成像精度的前提下,相比于传统CPU计算,GPU并行加速算法可大幅度地提高计算效率,进而实现基于GPU加速的叠前逆时偏移算法对复杂介质的高效率、高精度成像．相似文献

19.

Particle filtering on GPU architectures for manufacturing applications

《Computers in Industry》2015

Particle filters are nonlinear estimators that can be used to detect anomalies in manufacturing processes. Although promising, their high computational cost often prevents their implementation in real-time applications. Recently, the introduction of graphics processing units (GPUs) has enabled the acceleration of computationally intensive processes with their massive parallel capabilities. This article presents the acceleration of the particle filter and the auxiliary particle filter, two of the most important particle methods, on a GPU using NVIDIA CUDA technology. This is illustrated via simulation for a remelting process where the accelerated algorithms return accurate estimates while still being two orders of magnitude faster than the physical process even for calculations that involve millions of particles. 相似文献