首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
基于GPU加速的光速跟踪体绘制算法   总被引:1,自引:0,他引:1  
采用GPU编程技术,实现加速的光线跟踪体绘制算法.将原先在CPU中进行的光线进入点计算、离开点计算和光线遍历采样等步骤,移入GPU中进行,利用GPU的高速浮点运算能力,使实时绘制成为可能.通过只绘制一个代理面,避免了使用固定管线的混合操作,从而可通过自定义的混合算法来实现各种复杂的绘制效果.  相似文献   

2.
为了同时保证绘制速度和图像质量,提出了一种基于GPU加速的光线投射算法.该算法利用图形硬件自带的三线性插值功能来完成光线投射算法中耗时的采样、插值过程,在采样过程中进行空间跳跃,以实现绘制加速.实验结果表明:该算法保证了高质量的图像绘制效果,在增加存储容量较小的同时将绘制速度提高了95倍,实现了海量体数据基于GPU的实时绘制.  相似文献   

3.
依据现代GPU在通用计算方面的功能,提出了基于Brook在GPU上执行通用计算的实现方法,运用图像分割、快速傅立叶算法和光线跟踪3个应用对该方法进行了评估。评估结果表明GPU在Brook环境下通用计算能力优于CPU。  相似文献   

4.
基于图形处理器(GPU)体系架构研究二级光线跟踪技术,使其交互式地绘制出真实感极强的图像.基于二级光线的特性和GPU体系结构的特点,提出以下技术:具有高并行度的加速结构快速构造方法;二级光线包的自适应生成方法;自适应的并行光线跟踪算法;面向优化带宽使用的数据动态管理方法等.实验表明,该方法可以最大限度地发挥图形处理器强大的并行计算能力,有效地使用硬件计算资源和存储资源,从而大大地加快二级光线跟踪的并行计算.  相似文献   

5.
针对普通光线跟踪无法绘制出焦散效果的情况,提出了基于光线跟踪的焦散模拟生成算法。该算法首先从光源位置对场景进行绘制跟踪并获得焦散数据,接着将焦散数据通过坐标变换投射到正常视点的屏幕中,并与正常视平面上原有的亮度值进行叠加,从而生成具有焦散效果的图像,最后使用高斯滤波方法对图形进行滤波处理获得最终图像。通过对比,焦散模拟生成算法比普通的光子映射方法在效果差别不大的情况下帧速率有了明显的提高。实验表明,基于光线跟踪的焦散模拟生成算法可以逼真地绘制图像,同时能达到较高的帧数率。  相似文献   

6.
为提高光线与虚拟场景几何面片求交的计算效率,提出一种基于混合模式的空间加速结构。该方法改进传统的层次包围盒,把细分层次包围盒与空间均匀网格划分相结合,实现了可并行的混合空间加速设计。此外,把帧间可重用的数据抽取至数据缓存,建立多几何群组的加速结构共享,实现了光线跟踪算法的并行优化。实验证明,该混合加速结构能有效加快光线跟踪的光线场景求交判断速度,快速实现光线跟踪并行化计算。  相似文献   

7.
在传统图上关键字检索问题研究的基础上,基于图形处理器(GPU)设计新的关键字检索算法. 基于Steiner tree语义定义关键字检索问题,针对该问题结合传统多源最短路径算法在CPU上设计基本算法,由于CPU架构特性,该算法无法直接移植到GPU上. 提出GPU上的基本检索算法,分析它相对于CPU版本的优势和仍然存在的不足. 为了提升算法查询速度,反思GPU上基本检索算法的不足之处,提出基于索引的优化技术,利用单源最短路径算法的松弛更新思想、关键字独立性和内部整体性,设计GPU上的高效关键字检索算法. 扩展该算法思想,对r-cliques关键字检索问题提出GPU上的优化思路. 通过分析算法复杂度并在真实数据集上进行实验,证明该GPU算法的正确性和有效性,并证明算法在较大规模图数据上仍有较强的计算性能.  相似文献   

8.
利用光线跟踪可以绘制出高质量的真实感场景画面,但计算量很大,难以实现实时交互式绘制.为此,三维真实感场景的实时交互式绘制往往需要用到集群,但集群的绘制速度是由绘制速度最慢的节点决定的,如果节点之间的任务没有被划分均匀,集群的绘制效率就会下降.为了满足实时交互式绘制的要求、提高集群的绘制效率,设计了在粗粒度和细粒度两个层次上同时实现并行计算的集群绘制系统,并针对集群的负载均衡问题提出了基于像素递归深度的负载均衡方法.该方法首先统计出每个像素的递归深度从而得到整个场景的递归深度图,然后对上一帧按递归深度进行均衡划分.根据连续两帧所对应的场景具有的时空相关性,上一帧的划分结果可作为下一帧划分的依据.本算法的优势在于能够快速实现三维动态场景下的集群负载均衡.实验表明,该集群绘制系统可以高效地实现基于Kinect的实时交互式绘制.  相似文献   

9.
光线追踪是常用的绘制技术之一,由于能够方便的模拟生成复杂光照效果,生成高质量图像,在很多领域都有着广泛的应用。光线追踪渲染的主要运算操作耗费在光线与场景相交的判断上,可以在两个方面提升效率,一是通过建立某种空间组织结构来加速相交计算过程;另一种方式是通过并行计算模式,结合硬件来实现同时计算。首先介绍了并行计算在光线追踪计算中的作用;接着介绍了并行计算及GPU计算的一些重要概念;然后介绍了常用的加速结构及实现原理,以及基于表面积的启发式算法;再接下来进行了基于加速结构和CUDA的射线追踪算法的并行化实现及效率测试,最后进行相关分析和总结。  相似文献   

10.
传统的光线投射算法能够得到清晰的体绘制图像,但由于其运行量巨大,导致速度慢,性能低。J.Krue ger等人提出了基于GPU的光线投射算法大幅度地提高了绘制性能,但在图像融合阶段仍未能充分利用GPU的向量运算的优势。为此,本文将图像融合阶段部分标量运算转换为向量和矩阵运算,绘制性能得到了进一步提升。  相似文献   

11.
针对以CPU为处理平台的H.265/HEVC串并行编码效率较低的问题,设计了一种基于异构多核CPU+GPU处理平台的并行实时编码算法。按照CPU和GPU互不相同的硬件特性分配任务,降低了时间复杂度,同时使CPU和GPU的协作能力获得了提升,计算资源得到了更加合理的利用。视频编码并行化设计提高了编码效率,高清视频的编码速度最高可达26.31帧/s,实现了高清视频的实时编码。  相似文献   

12.
针对联机分析处理(online analytical processing,OLAP)中的整体型聚集函数中位数,提出基于图形处理单元(graphics processing unit,GPU)的GPU-Median算法,通过对数据进行划分,分段排序,不断裁剪全局中位数之前的数据,对未裁剪的数据进行合并,得到最终的中位数...  相似文献   

13.
针对高效视频编码(HEVC)实时编码高清视频和超高清视频而带来视频编码速度慢、计算复杂度高的问题,提出了基于异构多核CPU+GPU处理平台上的并行实时编码算法以及在GPU中基于率失真优化快速搜索算法,以提高视频编码的速度和降低计算复杂度。经实验验证,所提算法简单且有效,在不牺牲率失真性能的前提下,使编码速度得到明显提升,并进一步接近了实时编码的要求。  相似文献   

14.
Since the conventional central processing unit (CPU) platform could hardly fulfill the real-time requirement of radar signal processing, a software radar signal parallel processing algorithm based on multi-GPU is proposed. To make the best of GPU's strong computational capability, we design a pipeline workflow with 3 levels, task level, data level and thread level in the CPU-GPU heterogeneous system. We optimize the algorithm according to the access mechanism of GPU and take full advantage of the GPU's parallel computational resources. Experimental results show that the proposed GPU platform with 4 GPUs is 42.78 faster than the CPU platform, and manages to meet the real-time requirement of radar signal processing.  相似文献   

15.
基于气象雷达的雷暴识别与追踪是临近预报中重要的方法之一. 为解决传统算法实时性差的问题,运用OpenCL构建异构计算模型对算法进行并行化改进. 通过对算法分支结构优化、OpenCL设备内存优化,以及针对VLIW的优化,分步阐述算法优化的过程和原理. 这些方法不仅使得基于光流的计算速度大幅提升,还可为其他基于OpenCL异构计算的优化提供参考. 以AMD两代不同架构的GPU和Intel XEON CPU作为测试平台测试,结果表明,改进后的算法程序在硬件同等功耗的情况下,计算速度提高了10至18倍.  相似文献   

16.
To achieve the across-nodes technology of the heterogeneous parallel method of moments (MoM), a parallel MoM programming model is studied on CPU/GPU and CPU/MIC heterogeneous platforms. By utilizing the CONTEXT technology in the CUDA which contains the GPU common programming criterions, and the concept of environment variables in MIC, a general heterogeneous parallel programming model for the CPU/GPU and CPU/MIC is proposed, which meets the static load-balancing for the across-nodes heterogeneous parallel MoM. Numerical results show that the heterogeneous parallel MoM codes based on the proposed parallel programming model can obtain ideal speedup and good scalability.  相似文献   

17.
虚拟维度表示高光谱图像中典型地物的个数。虚拟维度的确定是高光谱图像众多应用的首要步骤。针对虚拟维度计算方法时间复杂度高的问题,根据其计算具有高度并行性的特点,该文在图形处理单元(GPU)上使用统一计算设备架构(CUDA)和它的拓展线性代数工具箱CULA及Thrust实现虚拟维度的计算,在算法并行实现的每步都做了进一步优化以获取更大的加速性能。通过在GPU设备上CUDA并行计算和CPU上非并行计算求虚拟维度的实验比较,验证了CUDA并行计算可以明显加快算法的实现。  相似文献   

18.
中期冲突探测(MTCD)是空中交通管制的重要决策支持工具。针对Prandini概率型中期冲突探测算法存在计算速度慢、探测精度不够高的缺点,提出基于GPU CUDA的加速算法。利用CUDA线程并行处理能力和GPU的计算能力,对算法进行了重新设计与优化。通过仿真实验,证明了在NVIDIA Geforce 8800GTS显卡上可得到50倍以上的加速性能,可以满足大型空管自动化系统20 min内中期冲突探测的实时性和精度要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号