首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
《中国测试》2015,(8):83-87
针对因建模的三维数据量巨大导致传统Open GL固定管线对三维地形渲染难以满足实时性需求这一问题,提出利用GPU可编程图形管线来进行渲染,实现区域的可视化实时显示。建模过程中首先使用基于分形理论的随机中点位移法产生地形高程数据,然后利用三角面元连接地形高程散点生成三维曲面,最后通过GLSL着色语言对GPU进行编程实现对地形的渲染。该方法建模过程与Open GL固定管线渲染效率进行对比,结果表明:利用GPU可编程图形管线对400万的三维地形网格数据进行渲染仅用时82.92 ms,效率远高于Open GL固定管线的渲染,能够满足实时渲染的需要。  相似文献   

2.
为了解决使用现场可编程门阵列(FPGA)进行大规模片上多核处理器模拟的容量限制难题,提出了一种新颖的FPGA模拟方法。该方法通过混合真实的处理器核与伪造的处理器核,使用1个或2个FPGA即可模拟整个片上多核处理器,而且可以有效克服FPGA的容量限制问题,同时又不过多损害对多核处理器行为特征的有效模拟。用此方法实现了周期精确的全芯片模拟,并使用流片后的片上多核处理器芯片对此模拟方法进行了有效性验证。实验很容易地实现了50MHz以上的模拟速度,比基于相同设计的软件仿真快10万倍以上。模拟速度的大幅度提升,使得可以启动未经修改的Linux操作系统和运行完整的多用户SPEC CPU2006 train测试集。这种混合真实处理器核与伪造处理器核的模拟方法为片上多核处理器的功能验证和性能评估提供了一种简单高效的途径。  相似文献   

3.
冯楠 《硅谷》2012,(9):21-22
提出一种基于GPU(图形处理器)和CPU协同处理实现来提高聚类算法Canopy的计算效率的优化方案。利用GPU高效的并行性和灵活的可编程性等特点,将Canopy聚类算法中比较耗时的距离计算及与阈值T1,T2的比较步骤交由GPU处理,算法其余步骤仍由CPU处理,理论上提高算法速度。  相似文献   

4.
针对虚拟坐标测量系统中非凸物体间的碰撞检测问题,将非凸体分解为三角形面片,利用可编程图形处理单元(GPU)的流计算优势,将分离轴检测算法映射到图形硬件的片断着色器中,以计算三角形间的相交情况.结果表明,该算法在处理流数据时具有良好的实时性和稳定性.  相似文献   

5.
3D非均匀直线网格GPU体绘制方法研究   总被引:1,自引:0,他引:1  
计算机图形硬件技术的快速发展可以用来加速可视化过程,为此针对非均匀直线网格,给出了基于均匀辅助网格的CPU光线投射算法、基于辅助纹理的GPU光线投射算法,以及基于切片的3D纹理体绘制算法,并在Nvidia Geforce 6800GT图形卡上对这些算法进行了测试。结果表明,GPU算法远远快于CPU算法,而基于切片的3D纹理体绘制算法则快于GPU光线投射算法。  相似文献   

6.
悬索桥结构分析中索鞍的精确模拟   总被引:3,自引:0,他引:3  
魏建东  刘忠玉 《工程力学》2006,23(7):114-118
为在悬索桥结构分析中精确模拟索鞍,建立了索段一端固定于鞍座上的两节点“左鞍座单元”和“右鞍座单元”,以及索段中一点固定于鞍座上的三节点“鞍座单元”,此固定点为新单元的一个节点。它们通过自动调整索与鞍座的切点而处于平衡状态,从而简化了计算。单元算法的推导基于有限元分析的基本原理和弹性悬链线的精确解,并利用了处于平衡状态时索与鞍座之间的内力关系。新单元可以考虑鞍座重量的影响,鞍槽纵向曲线可为复合圆曲线。新单元可以同常规单元一样直接用于索结构的有限元分析,设计的算例验证了其正确性,工程算例显示了其在悬索桥结构分析中的应用。  相似文献   

7.
基于GPU的快速Sobel边缘检测算法   总被引:2,自引:1,他引:1  
传统的Soble边缘检测算法的优化和实现都是针对常用处理器(CPU、DSP和FPGA等)提出的,难以应用在图像处理器(GPU)上.本文提出了一种基于NVIDIA公司CUDA架构图形处理器(GPU)的快速Sobel边缘检测算法.快速算法根据GPU的并行结构和硬件特点,采用了纹理存储技术、多点访问技术和对称计算技术三种加速技术,优化了数据存储结构,提高了数据访问效率,降低了算法复杂度.实验结果表明,快速算法充分利用了GPU的并行处理能力,在处理4 096x4 096分辨力的8位灰度图像时速度可达190 fps,是基于CPU实现的122倍.  相似文献   

8.
针对当前采用独立显卡的桌面计算机系统架构普遍存在的CPU(中心处理单元)访问GPU(图形处理单元)存储空间数据传输延迟较大的瓶颈,采用了龙芯GS464处理器核心实现的UA(uncache acceleration)机制对GPU驱动程序中的GPU存储空间访问接口进行优化,极大地提高了处理器向GPU等IO存储空间连续数据写入的速度。详细分析了龙芯处理器UA机制的原理及其相对于uncache方式IO写所能带来的性能提升。通过UA机制优化了龙芯3A+2H平台的GPU驱动性能,x11perf测试结果显示,采用UA优化GPU驱动后,Xserver的一些接口性能提升达5%~230%。将龙芯处理器的UA机制封装到了标准MMAP系统调用,并通过该扩展后的系统调用优化了Xserver的Xvideo扩展接口,实验结果显示,播放常见较高分辨率视频时该接口性能能够有6~12倍的性能提升。  相似文献   

9.
提出一种基于可编程图形处理器(GPU)有效控制烟雾模拟过程的实时算法。对于给定的烟雾当前状态和目标状态,该算法以自然的烟雾流动方式实现状态之间的转换。根据Navier-Stokes方程定义烟雾流体场的物理模型,通过调整方程中的风力项以达到控制目的。风力项由驱动力和聚合力组成,驱动力促使烟朝着目标密度分布运动,聚合力则用于抵消烟的扩散现象。烟雾的速度和密度参量被整合为纹理颜色通道,并传送到像素程序中由GPU完成计算。该算法无需保证两状态之间转移为最优,从而消除了非线性优化所带来的计算成本。实验表明该算法能实时高效地模拟两种烟雾状态之间的转换。  相似文献   

10.
嵌入式图形处理器(GPU)随着访存数据量越来越大,访存子系统在性能、面积及功耗等方面的瓶颈已经日益凸显。针对图形处理器的数据特点及访存需求,考虑到嵌入式图形处理器面积及功耗的约束,结合Godson GPU架构平台,提出了一种面向嵌入式图形处理器的访存子系统结构设计。该设计主要针对图形处理流水线的访存特点,对cache的结构进行了优化,并提出了一种基于链表方式的结构,提高了访存的效率,减少了面积且降低了功耗。为了使访存子系统适配并行图形流水线,提出了一种屏幕分区方法,可以在消除cache的一致性问题的同时,使访存子系统的负载更加均衡。该设计为嵌入式图形处理器的访存子系统设计提供了借鉴。  相似文献   

11.
提出一种实现真实感天空实时渲染的高效方法.首先利用基于分析的天空模型实现天空的光照计算,该模型充分考虑了天空的昼夜变化,并对夜空中特有的各类光源如月球、星体、黄道光和气辉等进行分析;其次通过色调重现实现天空的真实感渲染,通过对暗视效果的模拟进一步提高夜空渲染的真实感;最后给出基于观察窗口的天空几何模型和银河系、星体的渲染方法,并通过图形处理器(GPU)实现上述算法的实时渲染.该方法适用于室外场景的渲染,并已成功应用于某直升机飞行模拟器中.  相似文献   

12.
该文基于Bouc-Wen模型构造了一种2节点12自由度的显式消能器单元;利用修正的向前Euler算法实现了单元内力计算。将该文显式单元及其内力计算方法在完全自主研发的非线性有限元分析程序中完成开发。为提高显式分析效率,自主研发程序采用了CPU+GPU异构并行计算技术。通过与低屈服点钢剪切滞回试验对比,验证了该文显式消能器单元的正确性和适用性。采用该文显式消能器单元模拟某实际消能减震结构的金属消能器;基于结构整体动力分析结果,讨论了金属消能器的减震效果。  相似文献   

13.
目前有限元分析软件多基于中央处理器的平台方式构建,在处理复杂高层结构非线性响应分析时暴露出计算耗时多、计算效率低以及对计算硬件要求高等问题。图形处理器由于其硬件构造的先天优势,可以提供十倍乃至上百倍于中央处理器的浮点运算和并行计算性能,因而为高层结构非线性计算所面临的瓶颈问题提供了一个切实可行的解决方法。该文在构建异构并行计算平台的基础上,提出一种适用于图形处理器加速的有限元并行数值计算方法。该方法利用精细化结构分析模型的自由度数据和图形处理器中的线程建立一一对应映射关系,对动力响应的隐式积分算法进行图形处理器线程级的并行化处理,并且结合EBE单元级的优化存储空间机制,降低系统方程组求解时对内存空间的需求。通过对比振动台试验结果对该方法进行验证,并对实际高层钢筋混凝土框筒结构工程进行弹塑性地震响应分析,结果显示该文所提方法在保证模型精度前提下能有效提高大型复杂高层结构非线性响应分析效率。  相似文献   

14.
针对图形处理器(GPU)架构下的软件可移植性、可编程性差的问题,为了便于在GPU上开发并行程序,通过自动映射与静态编译相结合,提出了一种新的基于制导语句控制的编译优化方法,实现了一个源到源的自动转化工具GPU-S2S,它能够将插入了制导语句的串行C程序转化为统一计算架构(CUDA)程序.实验结果表明,经GPU-S2S转化生成的代码和英伟达(NVIDIA)提供的基准测试代码具有相当的性能;与原串行程序在CPU上执行相比,转换后的并行程序在GPU上能够获取显著的性能提升.  相似文献   

15.
热阻和流阻是评价液冷散热器性能的主要参数。该文研制一套高精度的液冷散热器性能测试系统,由液冷散热器的进口流体温度控制单元、进口流量控制单元、模拟热源控制单元及测量单元组成。在台面温度测量方面,由于现有标准(GB/T 8446.2—2004)规定的温度测点位置不适应液冷散热器热阻测量,提出改进方法。开发相应的测试软件,具有系统控制、数据实时采集、测试报告输出等功能。并对某型号液冷散热器进行实验研究,通过实验数据对系统的测量不确定度进行分析,流阻测试的不确定度为0.48%,热阻测试的不确定度为2.4%。验证系统用于散热器流阻热阻测试的可靠性。  相似文献   

16.
使用图形处理器(GPU)代替传统中央处理器(CPU)作为数值求解硬件,建立基于LABVIEW?MATLAB?GPU的实时子结构试验架构.以土?结相互作用系统为载体,通过数值仿真与试验对该架构的性能进行验证.试验与仿真结果表明,本文方法将实时子结构试验中数值子结构求解自由度提高到27000,提升了数值模型求解规模,拓展了...  相似文献   

17.
球形传声器阵列因其完全对称的结构,可在三维空间内实现有效的声源定位。文章重点关注基于球谐函数展开的可控波束响应算法,推导了算法的实现流程,并通过仿真验证了可控波束响应算法的性能。建立了包含8个传声器单元的实验系统,其中球形结构在8个单元的条件下可以视为立方结构,通过低阶球谐展开实验验证了可控波束算法的性能。在视听室的实验结果充分验证了定位算法的有效性,定位误差小于10°。  相似文献   

18.
研究了MPEG-4纹理填充算法的特点,设计了纹理填充硬件实现的VLSI结构.在Xilinx ISE6.1i集成开发环境下,采用VHDL对该结构进行了描述,并使用了电子设计自动化(EDA)工具进行了模拟和验证.仿真和综合结果表明,所设计的VLSI处理器,逻辑功能完全正确,而且可以满足MPEG-4 Core Profiles & Level2的实时编码要求,可用于MPEG-4的VLSI实现.  相似文献   

19.
通过分析虚拟牙齿钻削手术对模型的要求,建立了基于线性表的均匀立方体体素网格模型,设计了材料去除与模型重构算法,实时模拟钻削中模型的拓扑结构变化,并采用点绘制方法进行图形显示。采用0.1mm的剖分粒度进行实验,证明牙齿体素模型的实时性可以满足1kHz的力觉反馈和30Hz的图形显示要求,设计的模型重构算法可以较精确地实现多种不同尺寸工具的钻削仿真。  相似文献   

20.
电磁式惯性型作动器的闭环控制策略与性能试验   总被引:1,自引:0,他引:1  
针对电磁驱动AM D控制系统在开环控制模式下性能试验存在的问题,提出利用位置和速度反馈的闭环控制策略进行系统性能测试,从而可以研究系统在低频和大位移控制下的动态工作性能。首先借鉴运动伺服控制方法,把电磁驱动AM D控制系统的力-电关系模型转换成系统运动方程。其次类比于旋转电机并结合量纲分析方法,建立电磁驱动AM D控制系统闭环控制算法参数的理论计算公式,通过试验验证了公式及算法参数的准确性。最后分别进行正弦位移和阶跃位移控制下系统的闭环性能试验,实测结果表明电磁驱动AM D控制系统是一种响应迅速、线性性能良好的结构振动主动控制系统,基于试验结果与理论模型预测结果的比较,再次证实了系统力-电关系计算模型的正确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号