首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 59 毫秒
1.
基于图形处理器(GPU)的通用计算   总被引:102,自引:20,他引:102  
伴随着PC级微机的崛起和普及,多年来计算机图形的大部分应用发生了从工作站向微机的大转移,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时(中、小规模)应用中.这一切的发生从很大程度上源自于图形处理硬件的发展和革新.近年来,随着图形处理器(GPU)性能的大幅度提高以及可编程特性的发展,人们首先开始将图形流水线的某些处理阶段以及某些图形算法从CPU向GPU转移.除了计算机图形学本身的应用,涉及到其他领域的计算,以至于通用计算近2~3年来成为GPU的应用之一.并成为研究热点.文中从若干图形硬件发展的历史开始,介绍和分析最新GPU在通用计算方面的应用及其技术原理和发展状况,并结合作者自身的实践讨论和探索其发展前景。  相似文献   

2.
基于GPU的大规模海浪实时绘制   总被引:1,自引:0,他引:1  
海浪建模与绘制是近二十年来计算机图形学领域的一个经典问题,同时,随着硬件的发展,尤其是图形处理器(GPU)以大大超过摩尔定律的速度高速发展和其高速计算能力、并行性、其可编程功能,使得基于GPU的通用计算成为一个新研究热点.利用GPU的高速计算能力和可编程功能,解决海浪模拟中的复杂计算问题,提出一种基于图形硬件的大规模海浪实时绘制方法.首先,对图形处理器进行了概述.然后,基于Gerstner-Rankine模型生成海洋高度场,采用屏幕细分自适应算法对数字地球上的可视海洋表面进行采样,利用图形处理单元的可编程特性进行顶点和颜色计算,模拟实时球面海浪效果.实验结果表明,基于GPU的方法可以在普通PC图形硬件上实现大规模海浪的交互漫游.  相似文献   

3.
图形处理器通用计算关键技术研究综述   总被引:4,自引:0,他引:4  
当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依据,介绍学术和工业领域中流处理器及图形处理器体系变化趋势.从软件编程环境、硬件计算与通信等方面展开讨论,阐述通用计算中图形处理器的关键问题,包括编程模型及语言的发展和方向,存储模型的量化研究、访存模式和行为的优化以及分布式存储管理的热点问题,典型通信原型系统的对比及通信难点的分析,GPU片内和片间的负载均衡,可靠性和容错计算,GPU功耗评测及低功耗优化的研究进展.综述在海量数据处理、智能计算、复杂网络、集群应用领域中图形处理器的研究进展及成果.总结在通用计算发展中存在的技术问题和未来挑战.  相似文献   

4.
半导体工艺的发展使得芯片上集成的晶体管数目不断增加,图形处理器的存储和计算能力也越来越强大。目前,GPU的峰值运算能力已经远远超出主流的CPU,它在非图形计算领域,特别是高性能计算领域的潜力已经引起越来越多研究者的关注。本文介绍了GPU用于通用计算的原理以及目前学术界和产业界关于GPGPU体系结构和编程模型方面的最新研究成果。  相似文献   

5.
作为应用软件模型和计算机硬件之间的桥梁,编程模型在计算机领域的重要性不言而喻.但随着具备细粒度并行计算能力的图形处理器(GPU)进入主流市场,与之相适应的编程模型发展却相对滞后.Nvidia在GeForce 8系列显卡上推出的统一计算设备架构(CUDA)技术,使得通用计算图形处理单元(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算.论文从特性、组成和并行架构等几个方面对CUDA并行计算模型进行了研究,充分表明基于GPU进行高性能并行计算,是适应目前大规模计算需求的一个重要发展途径.  相似文献   

6.
GPU的概念提出后,经过十几年的迅速发展,GPU凭借其超高的计算密度以及超大的存储器带宽已经在图形图像、医疗、高性能计算、计算机网络等领域取得了突出的成果和广泛认可,本文通过了解GPU通用计算的发展历程以及追踪国内外最新的GPU通用计算技术来阐述其在相关领域的应用.  相似文献   

7.
近年来,随着图形处理器(GPU)能力以及可编程技术的发展,基于图形处理器的通用计算成为一个研究的热点。文章介绍了图形处理器的发展和结构,以及在使用通用计算时所面临的一些问题;具体介绍了利用GPU进行光线和空间三角形面片的求交测试。  相似文献   

8.
GPU的通用计算应用研究   总被引:9,自引:0,他引:9  
由于图形处理器(GPU)最近几年迅速发展,国内外学者已经将基于GPU的通用计算作为一个新的研究领域。本文在研究国外最新文献的基础上,分析了GPU本身的特性,阐明了基于GPU的应用程序的结构,研究了GPU在编程方法上与普通CPU的差别,并以高斯滤波为实例详细描述了GPU编程的方法和过程。  相似文献   

9.
随着图形硬件的快速发展,GPU的通用计算已经成为了一个新的研究领域。本文分析GPU编程模型,介绍使用图形硬件进行通用计算的方法,并把一些常用的算法映射到了GPU上。通过这些算法与CPU上对应的算法进行比较,分析使用GPU进行通用计算的优势和劣势。  相似文献   

10.
真实感火焰模拟   总被引:2,自引:0,他引:2  
针对火焰的计算机模拟难以实现真实感和实时性的问题,提出一种基于物理模型与图形处理器(GPU)通用计算相结合的火焰模拟方法.该方法首先采用半拉格朗日法求解流体方程,运用基于3D纹理的体绘制对火焰进行三维渲染.然后,根据光照和密度场将光谱转换成颜色分布来模拟火焰颜色,并在GPU上加速实现,使得真实感和实时性之间达到了平衡.  相似文献   

11.
It is proven that any (uniform) family of physical parallel devices, recognizing a language C? with time-complixity TP(n), can be simulated by a (uniform) family of sequential devices with time-complexity TP(n)1d (d is a constant, depending on the technology, but not greater than 13).  相似文献   

12.
计算能力瓶颈限制了复杂视频事件检测算法在实时系统上的应用。为此,设计一种基于Map Reduce模型的分布式视频处理平台,用算子和算子间连接关系描述算法,将算法在时域上切分为并行计算的独立任务。采用普通计算机搭建基于该模型的视频处理集群,运行按模型组织的视频处理算法。实验结果表明,对于处理密集型的视频分析算法,系统处理能力随集群计算机数量的增加呈近似线性增长,能够满足实时处理需求,具有较强的可扩展性。  相似文献   

13.
This paper summarizes the major results of a formal survey of array processor users and indicates how these results were used in the design of a language suitable for array and vector processors. A comparison is also given with an informal survey of other large-scale computer users, which concluded that the best plan was to extend Fortran 77 to meet the requirements for array processing.  相似文献   

14.
地震并行处理模式与应用框架   总被引:4,自引:0,他引:4  
文中研究石油地震数据处理的并行计算设计模式(流水、扇出/扇入、主从和混合)和应用框架,框架和模式的目的都是复用成功的软件设计自力更生,框架可以看作一类设计模式的具体实现。针对地震数据处理模式设计和实现了GRISYS地震数据处理应用框架。利用这个框架,以往大量的串行地震处理模块,不需要任何改动,可以在工作站集群计算机或大规模并行计算机上实现并行计算,在曙光2000-Ⅱ并行计算机上试验,获得了非常高的并行处理加速比。  相似文献   

15.
结合灰度匹配和特征匹配的优点,提出基于灰度权重NMI的一种复合图像匹配新方法,定义了灰度权重的概念,使其既能在特征匹配中增强NMI特征提取的质量,又能在灰度匹配时减少相关的运算量,提高了匹配的速度和质量。  相似文献   

16.
Histogram feature representation is important in many classification applications for characterization of the statistical distribution of different pattern attributes, such as the color and edge orientation distribution in images. While the construction of these feature representations is simple, this very simplicity may compromise the classification accuracy in those cases where the original histogram does not provide adequate discriminative information for making a reliable classification. In view of this, we propose an optimization approach based on evolutionary computation (Back, Evolutionary algorithms in theory and practice, Oxford University Press, New York, 1996; Fogel, Evolutionary computation: toward a new philosophy of machine intelligence, 2nd edn. IEEE, Piscataway, NJ 1998) to identify a suitable transformation on the histogram feature representation, such that the resulting classification performance based on these features is maximally improved while the original simplicity of the representation is retained. To facilitate this optimization process, we propose a hierarchical classifier structure to demarcate the set of categories in such a way that the pair of category subsets with the highest level of dissimilarities is identified at each stage for partition. In this way, the evolutionary search process for the required transformation can be considerably simplified due to the reduced level of complexities in classification for two widely separated category subsets. The proposed approach is applied to two problems in multimedia data classification, namely the categorization of 3D computer graphics models and image classification in the JPEG compressed domain. Experimental results indicate that the evolutionary optimization approach, facilitated by the hierarchical classification process, is capable of significantly improving the classification performance for both applications based on the transformed histogram representations.
Hau-San WongEmail:
  相似文献   

17.
董育宁 《计算机学报》2003,26(3):332-339
提出了一种在并行机上有效地计算(空间)可变模板的方法,论证了利用一个在图像网格点处计算多项式的优化算法,可以大大减少可变模板的运算量,对于包含非多项式函数的可变模板,可以用函数的泰勒级数展开实现在像素点上的递推运算,详细分析了可变模板中若干常用函数的泰勒展开用于实现模板运算的合理性,准确性和有效性,关于硬件的影响以及该方法的适用范围,也做了讨论。  相似文献   

18.
Charles Wetherell 《Software》1980,10(4):265-271
The Department of Energy (DoE) has a long history of large-scale scientific calculation on the most advanced ‘number-crunching’ computers. Recently, an effort to improve communications and software sharing among DoE laboratories has been underway. One result of this sharing is a project to design and implement a common language. That language turns out to be FORTRAN 77 significantly extended with new data structures, control structures and array processing. The data used to design the array processing feature is surprising and likely to be of use to others working in scientific language design; it is reported here so that others may profit from DoE's experience.  相似文献   

19.
图像处理中的对象阴影计算影响着图像的渲染速度,是图像处理领域的重要研究内容。为了进一步提高对象阴影的渲染速度,提出了一种基于聚类方法的对象阴影识别方法。按照光线的衰减半径将光线表示为一个个球体,当球体之间的距离大于预定义的最小距离时,将其划分到两个不同的类中,采用自上而下的层次方法对光线进行聚类。在聚类过程中,光线的衰减半径随着与光源的距离呈线性增长。对光线进行聚类分析后,对同一聚类内的光线采用相同的渲染方式,因而提高了阴影的渲染效率。最后通过实验验证了提出的方法的有效性。  相似文献   

20.
神经计算科学的展望   总被引:4,自引:1,他引:3  
神经计算科学是从信息科学的角度来研究如何加速神经网络模仿和延伸 人脑的高级精神活动,如联想,记忆,推理,思维及意识等智能行为,这涉及到脑科学,认知科学,神经生物学,非线性科学,计算机科学,数学,物理学诸学科的综合集成,它是综合研究和实现类脑智能信息系统的一个新思想和新策略,本文仅重点论述神经智能信息处理,盲信号处理技术,演化认知与进化计算,混沌信息技术及软科学的开发,由此展望神经计算科学的未来发展及潜力,可带动诸学科及信息技术的美好发展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号