首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
CPU-GPU混合平台上动态场景光线跟踪的研究   总被引:1,自引:0,他引:1  
张健  焦良葆  陈瑞 《计算机工程与应用》2012,48(21):151-154,159
提出了一种动态场景光线跟踪新方法,能有效地调度CPU和GPU的运行,提高渲染速度。根据加速结构kd-tree的特点,将其分成上层部分和下层部分,上层部分由于并行性较小,由CPU创建;而下层部分并行性较大,由GPU创建,提高动态场景加速结构的创建速度。同时充分利用CPU和GPU两个运算平台的特点,有效调度两者的运行,隐藏部分运算时间,进一步提高动态场景的渲染速度。实验结果表明,在安装了GeForce285GTX的PC机上,高真实感地交互渲染了包含11k三角面片的Kitchen动态场景。  相似文献   

2.
加快光线跟踪计算的网格优化划分   总被引:2,自引:0,他引:2  
网格是一类重要的光线跟踪加速结构,其结构简单、能快速创建.但是网格划分的尺度对光线跟踪的效率有很大的影响.针对此,提出一种代价预估计算方法.以度量网格划分对光线跟踪计算效率的影响,并由此计算网格优化划分的分辨率,首先根据模型类型和网格使用方式计算几种场景参数,分别预估网格创建、跟踪和空间的开销;然后根据不同应用需求,以相应的预估代价最小来进行网格的优化划分.与已有方法不同,文中方法考虑了场景中面片分布类型对网格划分的影响,提高了度量计算的精度;还综合考虑了网格创建时间、空间需求等因素,以便度量计算能根据绘制任务的不同进行相应的优化处理.该方法能更好地提高绘制效率,特别是能处理动态场景和面片非均匀分布的复杂场景,而这些是已有方法难以处理的.实验结果表明,文中方法的预估网格优化分辨率与实际的最优分辨率很接近,优于已有的类似工作.  相似文献   

3.
随着图形处理器性能的提高及其可编程特性的发展,图形处理流水线的某些处理阶段和图形算法逐渐从CPU向GPU转移。文章介绍了可编程图形硬件基础,分析了基于GPU的光线跟踪技术的实现原理。设计的6个实验场景所包含的三角形面片数,从2016个到60960个成复杂度递增,在3种不同分辨率下,分别实现GPU和CPU的光线跟踪绘制。对实验结果比较、分析后,得到了GPU加速的光线跟踪技术的特点。  相似文献   

4.
基于空盒自适应生成的动态场景光线跟踪计算   总被引:3,自引:0,他引:3  
提出了一项光线跟踪新技术,能有效提高光线在空白区域的行进速度.该技术首先用一种新方法创建均匀空间网格,然后用较少的空盒自适应聚集空的空间网格,以加快光线跟踪的计算.新加速结构的创建时间复杂度和空间复杂度均是O(n),而相应的光线跟踪计算的时间复杂度为O(logn),与kd树结构相当.当该结构与已有的一些加速结构结合后,能很好地处理大规模动态场景.比如,光线逐根跟踪且计算二次衍生光线时,新技术可在普通PC机上高真实感地交互绘制包含6G三角面片的多Buddha动态场景.  相似文献   

5.
目前,基于GPU或多核CPU加速的光线跟踪算法是与硬件相关的.研究具有跨平台性能的实时光线跟踪算法既具有挑战性,又具有很强的应用价值.为此,提出一种基于OpenCL并且跨平台的动态场景实时光线跟踪绘制算法.首先通过对通用GPU并行处理性能进行发掘,将光线跟踪中KD-Tree建立、场景遍历和绘制3个过程均设计在GPU上,而CPU只负责其中各过程的调度,从而充分利用了GPU的计算性能,并有效地降低了数据传输开销;通过设计并行分区、并行SAH、紧密的数据管理以及区间性叶结点存储等算法,在GPU中高效、高质量地建立动态场景的KD-Tree,同时高质量的KD-Tree也有效地加速了场景的遍历速度.该算法以广度优先和大规模并行模式建立K D-Tree,更具通用性,既可以运行于NVIDIA GPU(CUDA GPU),也可以运行于AMD GPU.实验结果表明,文中算法可以在NVIDIA GPU和AMD GPU上对中等规模的动态场景实现实时光线跟踪绘制.  相似文献   

6.
研究真实感图像的问题,光线跟踪算法是生成真实感图形的主要算法之一.为了解决光线跟踪算法计算量大、效率低下、对动态场景处理能力不足的问题,采用图形处理器(graphics processing unit,GPU)统一编程架构,提出了一种新的基于计算统一设备架构(Compute Unified Device Architecture,CUDA)编程模型的结合层次包围体(Bounding Volume Hierarchies,BVH)和kd-tree的光线跟踪方法,首先对场景进行启发式的层次包围体分割,随后在每一个层次包围体上做启发式的k维二叉树(k-dimensional tree,kd-tree)剖分,这样就形成了一种新的空间划分,有利于建立高效的空间数据结构,提高光线与场景物体的求交速度.新设计的算法易于扩展到动态场景的光线跟踪,而且具有更快的渲染速度,有利于在应用系统中集成和扩展.实验结果验证了算法的有效性.  相似文献   

7.
基于统一计算设备架构技术的并行图像处理研究   总被引:1,自引:0,他引:1  
对统一计算设备架构CUDA技术进行研究,分析了CUDAGPU的显著特性,总结了CUDA的通用并行程序模式,详细介绍了用CUDA实现直方图均衡化的过程,接着简要介绍了CUDA在其它图像处理算法中的应用;最后对比CPU和GPU计算256级直方图均衡化的时间,实验结果表明随着图像像素的增大,CUDA可以把计算速度提高40多倍,在其它的图像算法中,甚至可以上百倍地提高速度.  相似文献   

8.
基于光线跟踪算法的纹理映射技术   总被引:1,自引:0,他引:1  
提出了一种基于光线跟踪算法的纹理映射方法,给出了既适用于光线跟踪算法又适用于纹理映射的图形反混淆方法,并扼要介绍了对一些特殊问题的处理方法。  相似文献   

9.
光线追踪因其渲染效果的真实性,长期以来被视为下一代主流图像渲染技术,是计算机图形学领域的热点研究方向。近年来,学术界和商业界对实时光线追踪开展了广泛研究。为促进实时光线追踪的研究,对相关文献进行归纳、分析和总结。首先阐述了光线追踪的概念、算法、加速数据结构等理论知识;介绍了三款支持光线追踪商用图形处理器(GPU),并对比了之间的差异;从光线束遍历、无栈遍历、光线重排序、多分支BVH、降噪技术、与神经网络结合的实时光线追踪这六个方法综述了光线追踪的算法优化工作,并阐明了相关具体方法的优缺点;在算法加速的基础上,对使用GPU优化加速和采用定制化设计的硬件加速进行了归纳分析;最后对文章的内容进行了总结,指出了实时光线追踪仍面临的困难,并对未来的发展方向进行了展望。可以帮助研究人员系统地了解实时光线追踪的研究现状,为后续开展相关研究提供思路。  相似文献   

10.
设计和实现了GPU上基于流的光线跟踪算法,采用一种基于线索二叉树的KD-Tree结构组织场景,避免了传统KD-Tree结构在遍历场景时在堆栈上的开销。算法在组织复杂场景上,优于利用传统KD-Tree和均匀剖分结构加速场景遍历的方法,在普通PC上实现了光线跟踪的快速渲染。  相似文献   

11.
焦良葆  陈瑞 《计算机工程》2010,36(18):10-12
GPU上的并行算法效率依赖于核函数在流多处理器上的平均运行效率,基于此,分析GPU核的执行方式,以及网格、线程块和线程之间的关系,采用细化核函数的方法将光线跟踪算法进行细化。实验结果证明,核的大小设置和分布方向影响了线程块内部的一致性,核函数的细化能增加线程块中同时运行的线程捆的数量。  相似文献   

12.
鉴于Larsen等人利用图形处理器(GPU)的多纹理技术做矩阵运算操作,以实现GPU在矩阵相乘方面的通用计算,提出一种利用GPU和CPU的协同处理模式,应用在基于层次聚类的动态近邻选择模型的聚类算法(DNNS)中,将算法中比较耗时的邻接度矩阵计算步骤交由GPU完成,而算法其余步骤由CPU执行,从而使算法的聚类效率得到显著提高。在配有Pentium IV 3.4 G CPU和NVIDIA GeForce 7800GT显卡的硬件环境下经过实验测试,证明这种协同处理模式下的运算速度比完全采用CPU计算速度要快25%左右。这种改进的层次聚类算法适合在数据流环境下对大量数据进行实时高效聚类操作。  相似文献   

13.
崔翔  姜小峰 《计算机应用》2013,33(6):1711-1714
树木的动态显示在自然场景模拟中有着重要的地位。采用Cook-Torrance光照明模型和预计算的半透明贴图实现了叶片的绘制,使用梁模型导出的拟合多项式结合偏移修正实现枝干的快速形变计算,通过索引枝干层级数据贴图实现GPU中多级枝干的形变。预计算和GPU的使用使得模拟过程中真实感和实时性得以平衡。实验结果表明,该方法实现了快速真实的动态树场景渲染。  相似文献   

14.
朱遵尚  刘肖琳 《计算机工程》2010,36(12):213-215
针对Harris角点检测精度和检测速度问题,利用现代图形处理器(GPU)对角点检测算法进行改进,提出一种基于GPU的快速亚像素Harris角点检测算法,该算法利用了GPU的并行处理能力和亚像素Harris角点检测算法的并行性特点。实验结果表明,对于分辨率为720×720的24 bit视频图像,该算法能够实现实时的亚像素级Harris角点检测。  相似文献   

15.
邵桢  蔡红星  徐春风 《计算机工程》2010,36(24):278-280
采用图形处理器(GPU)为主计算核心,应用时域有限差分法(FDTD)实现电磁学中麦克斯韦方程组的快速求解。通过对FDTD求解麦克斯韦旋度方程的直接时间域的分析,给出FDTD的仿真算法。根据GPU能高效地提高FDTD的仿真速度,解决FDTD仿真算法中的计算量庞大问题。利用GPU在FDTD计算中的处理能力,实现了更长的脉冲持续时间和庞大的模型求解与仿真,在适当的时间内完成了超大量的仿真计算。根据在CPU和FDTD上的实际计算结果表明,基于GPU的FDTD仿真算法具有高精度和高效率等特点。  相似文献   

16.
大尺度空间场景可视化中浮点精度问题研究   总被引:1,自引:0,他引:1       下载免费PDF全文
汪荣峰  廖学军 《计算机工程》2011,37(16):276-278
在具有极大数值范围的空间场景中实现可视化时,为避免图形处理器以32 bit单精度浮点表示所产生的“Wobbling”、“Pieces”等现象,提出分组分次绘制的解决方法.针对上述现象产生的原因,将场景中的对象分为大实体和小实体,根据空间场景的特征和对象之间的关系将场景中的对象分组,设计组内对象的绘制方法.实验结果表明,...  相似文献   

17.
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。  相似文献   

18.
Efficient intersection queries are important for ray tracing. However, building and maintaining the acceleration structures is demanding, especially for fully dynamic scenes. In this paper, we propose a quantized intersection framework based on compact voxels to quantize the intersection as an approximation. With high‐resolution voxels, the scene geometry can be well represented, which enables more accurate simulation of global illumination, such as detailed glossy reflections. In terms of memory usage in our graphics processing unit implementation, voxels are binarized and compactly encoded in a few 2D textures. We evaluate the rendering quality at various voxel resolutions. Empirically, high‐fidelity rendering can be achieved at the voxel resolution of 1 K3 or above, which produces images very similar to those of ray tracing. Moreover, we demonstrate the feasibility of our framework for various illumination effects with several applications, including first‐bounce indirect illumination, glossy refraction, path tracing, direct illumination, and ambient occlusion.  相似文献   

19.
研究基于总变分(TV)的图像去噪问题,针对中央处理器(CPU)计算速度较慢的问题,提出了在图像处理器(GPU)上并行计算的方法。考虑总变分最小问题的对偶模型,建立原始变量与对偶变量的关系,采用梯度投影算法求解对偶变量。数值实验分别在GPU与CPU上进行。实验结果表明,总变分去噪模型对偶算法在GPU设备上执行的效率高于在CPU上执行的效率,并且随着图像尺寸的增大,GPU并行计算的优势更加突出。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号