首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
田泽  张骏  许宏杰  郭亮  黎小玉 《计算机科学》2013,40(Z6):210-216
图形处理器(GPU)以其强大的图形加速性能以及在通用计算领域的出色表现正在被越来越广泛地应用。但随着芯片规模和集成度的不断提升,单个GPU芯片的功耗已经高达376W,是高端通用处理器的2~3倍。高功耗带来的可靠性、稳定性以及芯片成本问题使“功耗墙”已经成为未来GPU设计过程中需要突破的关键问题之一。立足于体系结构层次,结合图形处理器的渲染流水线的结构特点,从深度测试和消隐、染色器数据通路、纹理映射和压缩、渲染策略、寄存器文件和片上Cache等角度描述了图形处理器的低功耗设计技术,并指出了GPU低功耗设计技术的进一步研究方向。  相似文献   

2.
3D图形绘制技术已经渗透到各种移动设备中.相对于桌面PC,移动设备图形处理需要以更低的功耗、更有限的内存带宽和较低的运算能力实现高性能、高质量的图形显示效果.文中介绍了移动图形处理器发展现状,从硬件设计方面分析了这一领域未来面临的挑战;分析了当前移动图形处理器中区块式和立即式渲染的架构特点,总结了渲染过程中加速数据流计算方法和芯片低功耗设计方法.最后展望了移动图形处理器的发展趋势.  相似文献   

3.
针对GPU图形处理的特点,分析其应用于通用计算的并行处理机制和数据映射,提出了一种GPU通用计算模式的映射机制和一般性设计方法,并针对GPU的吞吐量、数据流处理能力和基本数学运算能力等进行性能测试,为GPU通用计算的算法设计、实现和性能优化提供参考依据。  相似文献   

4.
5.
图形处理器通用计算关键技术研究综述   总被引:4,自引:0,他引:4  
当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依据,介绍学术和工业领域中流处理器及图形处理器体系变化趋势.从软件编程环境、硬件计算与通信等方面展开讨论,阐述通用计算中图形处理器的关键问题,包括编程模型及语言的发展和方向,存储模型的量化研究、访存模式和行为的优化以及分布式存储管理的热点问题,典型通信原型系统的对比及通信难点的分析,GPU片内和片间的负载均衡,可靠性和容错计算,GPU功耗评测及低功耗优化的研究进展.综述在海量数据处理、智能计算、复杂网络、集群应用领域中图形处理器的研究进展及成果.总结在通用计算发展中存在的技术问题和未来挑战.  相似文献   

6.
文章根据图形处理器芯片的功能结构,提出了电路设计要求,给出了仿真波形图,基于芯片的电路仿真结果,结合93000测试系统给出了测试图形转换方法,转换生成测试图形,完成超大规模复杂芯片的功能测试,并给出了图形处理器的测试波形和数据结果.  相似文献   

7.
提出一种应用于可重构处理器中的流水线配置技术,能够有效减低配置时间,提高应用程序的执行速度。可重构处理器包括通用处理器和一个粗颗粒度的可重构阵列。可重构阵列将处理应用中占据大量执行时间的循环,这些循环将被分解为不同的行在阵列上以流水线的方式执行。该技术在FPGA验证系统上得到了验证。验证的应用包括H.264基准中的整数离散余弦变换和运动估计。相比传统的可重构处理器PipeRench, MorphoSys以及TI的DSP TMS320DM642有大约3.5倍的性能提升。  相似文献   

8.
鉴于图形处理器的应用日趋广泛,多核SoC的研究日益迫切,设计了一款多核交互式图形处理器MIGPU-9及其完整的软件系统.为了兼顾编程灵活性和计算高效性,设计了具有专用指令的前端处理器FEP、支持定点/浮点运算与函数求值器的顶点染色处理器VSP、双模式的剪裁投影处理器PCPTC,以及数个像素染色处理器PSP等共计9个微处理器核;MIGPU-9将这9个具有不同功能和不同结构的微处理器核以及各种专用加速电路以双轨握手的流水线形式集成到一块XC6VLX550T FPGA上,实现了图形处理任务在不同处理器核及专用电路上的并行计算.测试结果表明,MIGPU-9支持OpenGL2.0和DirectDraw,像素填充率最高可达40 M/s,电路规模超过527万门.  相似文献   

9.
本文论述了一种按位进行的图形映象压缩方法,这种方法采用可变长度的压缩代码,提高了压缩效率和灵活性,同时还给出了实现这一方法的有关算法描述。  相似文献   

10.
骨骼动画相对于之前的动画方法具有占用空间小的优点,但是其代价是计算量的增加,从而导致绘制效率的降低.另一方面,近年来可编程图形处理器技术在计算机图形处理领域已得到广泛研究.因此,提出了基于可编程图形处理器实现骨骼动画的方法,采用了最先进的可编程处理管线.使用多种不同的方法在可编程图形处理器中实现了骨骼动画,并对其性能进行了分析与比较.该方法借助可编程图形处理器强大的计算能力,分担了骨骼动画中的顶点更新的计算任务,从而大大提升了骨骼动画的绘制效率.  相似文献   

11.
可查询XML数据压缩技术概述   总被引:1,自引:0,他引:1  
随着互联网技术的迅速发展,XML已经成为Web上信息表示和数据交换的事实标准。XML数据的冗余性影响了XML数据传输、查询处理等方面的效率,数据压缩是解决冗余的一种途径。介绍了典型的可查询XML压缩技术,阐述了各种压缩技术的优缺点,比较了各压缩技术的压缩率、压缩时间、支持查询的类型等;最后总结了可查询XML压缩技术的不足之处及其发展的趋势。  相似文献   

12.
使用GPU编程的光线投射体绘制算法   总被引:6,自引:0,他引:6  
将传统的光线投射体绘制算法在具有可编程管线的图形处理器(GPU)上重新实现.首先将体数据作为三维纹理保存在显存中,然后通过编写顶点程序和片段程序将光线进入点/离开点计算和光线遍历的计算移入GPU中执行,最后根据不同的采样点颜色混合公式实现不同的绘制效果.文中算法仅需绘制一个四边形即可完成三维重建.实验结果表明:在进行光照效果的重建时,该算法能够达到实时交互的绘制要求,并能实现半透明等复杂绘制效果.  相似文献   

13.
一种铅笔滤镜生成算法及其在GPU上的实现   总被引:2,自引:0,他引:2  
提出了一种基于卷积算子的铅笔滤镜生成算法,通过分析真实铅笔纹理的结构特征,抽象出铅笔笔画的简单数学模型.根据该模型可以方便地确定其对应的笔刷模板(卷积算子),进而获得用户所需要的铅笔纹理.本文将该算法与图形处理单元(GPu)相结合,借助于GPU的硬件加速功能成功地实现了对视频图像的实时铅笔画风格绘制.  相似文献   

14.
引力波是爱因斯坦广义相对论的一个重要预言。大爆炸,特别是双黑洞、双中子星等双星系统是理论上最容易探测到的引力波波源。因为可以通过引力波了解这些重大的天体现象,所以对引力波的探测具有十分重要的科学意义。为此, 建造 了多个耗费巨资的基于激光干涉原理的引力波观测站(Laser Interferometer Gravitational-Wave Observatory,LIGO),以期能够首次直接探测到引力波。cWB(coherent Wave Burst)是一条能对多个观测站的数据进行实时分析处理的流水线。如何提高cWB程序的计算能力,成为了探测引力波的道路上亟待解决的问题。在分析cWB流水线特点的基础上,找到其性能瓶颈,设计并实现了一种有效的并行方法,在具有很强并行处理能力的GPU硬件上实现了对cWB流水线的加速。实验结果表明,与原来基于SSE优化加速的CPU实现相比,该CPU可以达到至少10倍的加速,这对于实现多个站点引力波信号的实时处理具有重要意义,在实时数据处理技术上为使用高精度的探测设备发现引力波提供了支持。  相似文献   

15.
随着互联网技术的迅速发展,XML已经成为Web上信息表示和数据交换的事实标准。由于XML具有自我描述能力,使得XML文档显得冗长,以至于包含了大量的冗余信息,这样必将影响数据查询处理和交换的效率。因此,XML数据压缩技术对于减少资源的使用显得特别重要。概述了XML压缩研究的现状;分析了典型的XML压缩技术,对其性能进行了比较;总结XML压缩技术的不足及发展趋势。  相似文献   

16.
This paper describes a robust, modular, complete GPU architecture—the Tile-Load-Map (TLM)—designed for the real-time visualization of wide textured terrains created with arbitrary meshes. It extends and completes our previous succinct paper Amara et al. (ISVC 2007, Part 1, Lecture Notes in Computer Science, vol. 4841, pp. 586–597, Springer, Berlin, 2007) by giving further technical and implementation details. It provides new solutions to problems that had been left unresolved, in the context of a joint use of OpenGL and CUDA, optimized on the G80 graphics chip. We explain the crucial components of the shaders, and emphasize the progress we have proposed, while resolving some difficulties. We show that this texturing architecture is well suited to current challenges, and takes into account most of the distinctive aspects of terrain rendering. Finally, we demonstrate how the design of the TLM facilitates the integration of geomatic input-data into procedural selection/rendering tasks on the GPU, and immediate applications to amplification. Electronic Supplementary Material  The online version of this article () contains supplementary material, which is available to authorized users.
Xavier Marsault (Corresponding author)Email:
  相似文献   

17.
近年来计算机图形硬件性能不断提高,利用硬件来实现体绘制过程中的某些环节以获取交互的绘制速率成为可能,是目前体绘制的研究热点。描述了基于GPU的光线投射法、2D纹理映射法和3D纹理映射法等典型算法,给出了各类算法的分析与性能评价,最后实现相关算法并得出实验结果。  相似文献   

18.
水体的折射使水底阴影产生了扭曲,无法使用常用的阴影生成算法来直接产生水底阴影.提出一种基于GPU的快速水底阴影生成算法,其充分利用了GPU并行处理像素的能力.首先使用普通阴影算法产生水面阴影贴图,然后根据简化的折射公式快速计算出阴影贴图中每个阴影像素点的折射方向,最后利用地形连续性估算出阴影折射线和水底地形的交点来生成水底阴影贴图.实验结果表明,该算法能够在高帧速率的情况下产生真实的视觉效果,非常适用于三维游戏等实时性要求较高的应用.  相似文献   

19.
鉴于移动计算终端具有显示屏幕小、对模型精度要求较低和处理能力相对较弱、处理高细节度的模型十分吃力,以及受带宽所限,需要对模型进行渐进传输等特点。而已有的几何压缩和简化方法又对移动计算终端的这些特点针对性不够,为此,围绕在移动计算终端上进行3维图形的显示,根据移动计算终端的特点,提出了一个实现过程简单、简化效率较高的几何压缩方法,同时提出了一个基于顶点相邻三角形单位法向量变化的边折叠几何压缩算法,并通过计算顶点相邻三角形单位法向量差值来识别出模型的特征点,提出了一个特征保留的策略。实践表明,完整的基于单位法向量变化和特征保留的边折叠几何压缩算法可以在保持模型外观的同时,有效地降低模型的规模。最后给出了该压缩方法在移动计算终端上的应用情况。通过用该压缩算法对模型进行预处理,实现了在移动计算终端上进行3维图形显示的这一目的。随着移动计算技术的发展,移动3维图形的应用将会越来越多,因此该压缩方法在移动3维图形计算方面具有较好的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号