共查询到19条相似文献,搜索用时 62 毫秒
1.
CPU-GPU混合平台上动态场景光线跟踪的研究 总被引:1,自引:0,他引:1
提出了一种动态场景光线跟踪新方法,能有效地调度CPU和GPU的运行,提高渲染速度。根据加速结构kd-tree的特点,将其分成上层部分和下层部分,上层部分由于并行性较小,由CPU创建;而下层部分并行性较大,由GPU创建,提高动态场景加速结构的创建速度。同时充分利用CPU和GPU两个运算平台的特点,有效调度两者的运行,隐藏部分运算时间,进一步提高动态场景的渲染速度。实验结果表明,在安装了GeForce285GTX的PC机上,高真实感地交互渲染了包含11k三角面片的Kitchen动态场景。 相似文献
2.
加快光线跟踪计算的网格优化划分 总被引:2,自引:0,他引:2
网格是一类重要的光线跟踪加速结构,其结构简单、能快速创建.但是网格划分的尺度对光线跟踪的效率有很大的影响.针对此,提出一种代价预估计算方法.以度量网格划分对光线跟踪计算效率的影响,并由此计算网格优化划分的分辨率,首先根据模型类型和网格使用方式计算几种场景参数,分别预估网格创建、跟踪和空间的开销;然后根据不同应用需求,以相应的预估代价最小来进行网格的优化划分.与已有方法不同,文中方法考虑了场景中面片分布类型对网格划分的影响,提高了度量计算的精度;还综合考虑了网格创建时间、空间需求等因素,以便度量计算能根据绘制任务的不同进行相应的优化处理.该方法能更好地提高绘制效率,特别是能处理动态场景和面片非均匀分布的复杂场景,而这些是已有方法难以处理的.实验结果表明,文中方法的预估网格优化分辨率与实际的最优分辨率很接近,优于已有的类似工作. 相似文献
3.
4.
基于空盒自适应生成的动态场景光线跟踪计算 总被引:3,自引:0,他引:3
提出了一项光线跟踪新技术,能有效提高光线在空白区域的行进速度.该技术首先用一种新方法创建均匀空间网格,然后用较少的空盒自适应聚集空的空间网格,以加快光线跟踪的计算.新加速结构的创建时间复杂度和空间复杂度均是O(n),而相应的光线跟踪计算的时间复杂度为O(logn),与kd树结构相当.当该结构与已有的一些加速结构结合后,能很好地处理大规模动态场景.比如,光线逐根跟踪且计算二次衍生光线时,新技术可在普通PC机上高真实感地交互绘制包含6G三角面片的多Buddha动态场景. 相似文献
5.
目前,基于GPU或多核CPU加速的光线跟踪算法是与硬件相关的.研究具有跨平台性能的实时光线跟踪算法既具有挑战性,又具有很强的应用价值.为此,提出一种基于OpenCL并且跨平台的动态场景实时光线跟踪绘制算法.首先通过对通用GPU并行处理性能进行发掘,将光线跟踪中KD-Tree建立、场景遍历和绘制3个过程均设计在GPU上,而CPU只负责其中各过程的调度,从而充分利用了GPU的计算性能,并有效地降低了数据传输开销;通过设计并行分区、并行SAH、紧密的数据管理以及区间性叶结点存储等算法,在GPU中高效、高质量地建立动态场景的KD-Tree,同时高质量的KD-Tree也有效地加速了场景的遍历速度.该算法以广度优先和大规模并行模式建立K D-Tree,更具通用性,既可以运行于NVIDIA GPU(CUDA GPU),也可以运行于AMD GPU.实验结果表明,文中算法可以在NVIDIA GPU和AMD GPU上对中等规模的动态场景实现实时光线跟踪绘制. 相似文献
6.
研究真实感图像的问题,光线跟踪算法是生成真实感图形的主要算法之一.为了解决光线跟踪算法计算量大、效率低下、对动态场景处理能力不足的问题,采用图形处理器(graphics processing unit,GPU)统一编程架构,提出了一种新的基于计算统一设备架构(Compute Unified Device Architecture,CUDA)编程模型的结合层次包围体(Bounding Volume Hierarchies,BVH)和kd-tree的光线跟踪方法,首先对场景进行启发式的层次包围体分割,随后在每一个层次包围体上做启发式的k维二叉树(k-dimensional tree,kd-tree)剖分,这样就形成了一种新的空间划分,有利于建立高效的空间数据结构,提高光线与场景物体的求交速度.新设计的算法易于扩展到动态场景的光线跟踪,而且具有更快的渲染速度,有利于在应用系统中集成和扩展.实验结果验证了算法的有效性. 相似文献
7.
基于统一计算设备架构技术的并行图像处理研究 总被引:1,自引:0,他引:1
对统一计算设备架构CUDA技术进行研究,分析了CUDAGPU的显著特性,总结了CUDA的通用并行程序模式,详细介绍了用CUDA实现直方图均衡化的过程,接着简要介绍了CUDA在其它图像处理算法中的应用;最后对比CPU和GPU计算256级直方图均衡化的时间,实验结果表明随着图像像素的增大,CUDA可以把计算速度提高40多倍,在其它的图像算法中,甚至可以上百倍地提高速度. 相似文献
8.
基于光线跟踪算法的纹理映射技术 总被引:1,自引:0,他引:1
提出了一种基于光线跟踪算法的纹理映射方法,给出了既适用于光线跟踪算法又适用于纹理映射的图形反混淆方法,并扼要介绍了对一些特殊问题的处理方法。 相似文献
9.
光线追踪因其渲染效果的真实性,长期以来被视为下一代主流图像渲染技术,是计算机图形学领域的热点研究方向。近年来,学术界和商业界对实时光线追踪开展了广泛研究。为促进实时光线追踪的研究,对相关文献进行归纳、分析和总结。首先阐述了光线追踪的概念、算法、加速数据结构等理论知识;介绍了三款支持光线追踪商用图形处理器(GPU),并对比了之间的差异;从光线束遍历、无栈遍历、光线重排序、多分支BVH、降噪技术、与神经网络结合的实时光线追踪这六个方法综述了光线追踪的算法优化工作,并阐明了相关具体方法的优缺点;在算法加速的基础上,对使用GPU优化加速和采用定制化设计的硬件加速进行了归纳分析;最后对文章的内容进行了总结,指出了实时光线追踪仍面临的困难,并对未来的发展方向进行了展望。可以帮助研究人员系统地了解实时光线追踪的研究现状,为后续开展相关研究提供思路。 相似文献
10.
设计和实现了GPU上基于流的光线跟踪算法,采用一种基于线索二叉树的KD-Tree结构组织场景,避免了传统KD-Tree结构在遍历场景时在堆栈上的开销。算法在组织复杂场景上,优于利用传统KD-Tree和均匀剖分结构加速场景遍历的方法,在普通PC上实现了光线跟踪的快速渲染。 相似文献
11.
12.
鉴于Larsen等人利用图形处理器(GPU)的多纹理技术做矩阵运算操作,以实现GPU在矩阵相乘方面的通用计算,提出一种利用GPU和CPU的协同处理模式,应用在基于层次聚类的动态近邻选择模型的聚类算法(DNNS)中,将算法中比较耗时的邻接度矩阵计算步骤交由GPU完成,而算法其余步骤由CPU执行,从而使算法的聚类效率得到显著提高。在配有Pentium IV 3.4 G CPU和NVIDIA GeForce 7800GT显卡的硬件环境下经过实验测试,证明这种协同处理模式下的运算速度比完全采用CPU计算速度要快25%左右。这种改进的层次聚类算法适合在数据流环境下对大量数据进行实时高效聚类操作。 相似文献
13.
树木的动态显示在自然场景模拟中有着重要的地位。采用Cook-Torrance光照明模型和预计算的半透明贴图实现了叶片的绘制,使用梁模型导出的拟合多项式结合偏移修正实现枝干的快速形变计算,通过索引枝干层级数据贴图实现GPU中多级枝干的形变。预计算和GPU的使用使得模拟过程中真实感和实时性得以平衡。实验结果表明,该方法实现了快速真实的动态树场景渲染。 相似文献
14.
15.
采用图形处理器(GPU)为主计算核心,应用时域有限差分法(FDTD)实现电磁学中麦克斯韦方程组的快速求解。通过对FDTD求解麦克斯韦旋度方程的直接时间域的分析,给出FDTD的仿真算法。根据GPU能高效地提高FDTD的仿真速度,解决FDTD仿真算法中的计算量庞大问题。利用GPU在FDTD计算中的处理能力,实现了更长的脉冲持续时间和庞大的模型求解与仿真,在适当的时间内完成了超大量的仿真计算。根据在CPU和FDTD上的实际计算结果表明,基于GPU的FDTD仿真算法具有高精度和高效率等特点。 相似文献
16.
17.
讨论了显示卡用于通用科学计算的问题,并以大型矩阵的基本运算问题详细比较了CPU和GPU计算之间的差别。在基本的矩阵运算中,运用适当的矩阵分块,GPU的计算速度比CPU快50倍左右。而且,显示卡低廉的价格为更多科研工作者实现大规模运算提供了可能。 相似文献
18.
Efficient intersection queries are important for ray tracing. However, building and maintaining the acceleration structures is demanding, especially for fully dynamic scenes. In this paper, we propose a quantized intersection framework based on compact voxels to quantize the intersection as an approximation. With high‐resolution voxels, the scene geometry can be well represented, which enables more accurate simulation of global illumination, such as detailed glossy reflections. In terms of memory usage in our graphics processing unit implementation, voxels are binarized and compactly encoded in a few 2D textures. We evaluate the rendering quality at various voxel resolutions. Empirically, high‐fidelity rendering can be achieved at the voxel resolution of 1 K3 or above, which produces images very similar to those of ray tracing. Moreover, we demonstrate the feasibility of our framework for various illumination effects with several applications, including first‐bounce indirect illumination, glossy refraction, path tracing, direct illumination, and ambient occlusion. 相似文献