首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 456 毫秒
1.
平板探测器技术的发展使得锥形束计算机断层扫描技术(Cone Beam Computerized Tomography,CBCT)成为一种重要的成像技术,有着十分广泛的应用.基于C形臂的CBCT,除了具有CBCT的技术优势外,还特别适合在影像引导介入手术中应用.然而,如何在满足手术实时性要求的同时获得高分辨率高质量的三维断层图像,仍是个十分具有挑战性的课题.文章提出一种基于GPU加速技术的C形臂CBCT三维图像快速重建方法:在算法层面应用GPU并行加速技术对重建算法进行优化,在系统层面通过设计分布式系统和延迟隐藏机制,大大提升了由二维投影图像重建三维体数据的效率.在保持重建精度的前提下,优化后的GPU加速的FDK算法极大地提升了重建过程的计算效率.延迟隐藏机制进一步提升了系统的运行效率.在使用90帧投影时,系统效率提升了26%,重建延迟加速了2.1倍;当使用120帧投影时,系统效率提升39%,重建延迟加速达到3.3倍.  相似文献   

2.
计算机断层扫描CT(Computed Tomography)等医学影像设备产生的投影数据巨大,因此由投影数据重建原始图像是一个需要大量计算的耗时过程。为了提高CT图像重建速度,在主流的个人计算机平台上,将基于GPU(Graphic Processing Unit)并行计算的CUDA(Compute Unified Device Architecture)技术应用于Cimmino同步迭代重建算法,并针对GPU并行架构的特点,使用CSR-ELL联合存储格式对数据的存储进行了优化以进一步提高并行效率。实验结果显示,该GPU并行Cimmino重建方法能够减少72%的图像重建时间,在保证成像质量的前提下提高了重建速度。  相似文献   

3.
通过改进GPU的渲染到纹理策略加速锥束反投影计算,提高了圆弧轨迹Katsevich锥束CT重建算法的执行效率.在CPU中完成投影数据的滤波处理,并将其重排为四通道浮点纹理载人GPU内存;绑定2个浮点输出纹理到帧缓冲对象的不同绑定点,用于将渲染结果输出到纹理,并同时完成反投影数据的累加计算;将矩形网格编码为四叉树结构用于加速物体切片的绘制.实验结果表明,文中算法在较大锥角时仍能重建出高质量图像,并获得接近于实时的重建速度.  相似文献   

4.
何希  吴炎桃  邸臻炜  陈佳 《计算机应用》2019,39(7):2008-2013
形态学重建是医学图像处理中非常基础和重要的操作。它根据掩膜图像的特征对标记图像反复进行膨胀操作,直到标记图像中的像素值不再变化为止。对于传统基于中央处理器(CPU)的形态学重建系统计算效率不高的问题,提出了使用图形处理器(GPU)来加速形态学重建。首先,设计了适合GPU处理的数据结构:并行堆集群;然后,基于并行堆集群,设计和实现了一套基于GPU的形态学重建系统。实验结果表明,相比传统基于CPU的形态学重建系统,基于GPU的形态学重建系统可以获取超过20倍的加速比。基于GPU的形态学重建系统展示了如何把基于复杂数据结构的软件系统高效地移植到GPU上。  相似文献   

5.
PMVS(Patch-based Multi-View Stereo)三维重建算法被广泛应用于无人机航拍影像的三维场景重建中。针对PMVS三维重建算法计算量大、时间复杂度高的问题,提出了PMVS算法的CPU多线程和GPU两级粒度并行策略(Multithread and GPU Parallel Schema,MGPS),方法具体包括:基于GPU的PMVS算法特征提取和片面扩散的并行设计;多影像的GPU和CPU任务分配机制,以使得部分任务分配给CPU采用多线程并行,部分任务分配给GPU并行时,程序总运行时间最短。实验采用搭载24核CPU和NVIDIA Tesla K20 GPU的高性能服务器作为测试平台,针对分辨率为4081×2993的16幅无人机影像进行三维重建。实验结果表明,相比串行的PMVS算法,基于MGPS的PMVS算法取得4倍左右的加速比,其中特征提取最高加速13倍,计算误差在10%以内,该方法实现了更高效的PMVS三维重建。基于MGPS的PMVS算法还可用于文物保护、医学图像处理、虚拟现实等领域。  相似文献   

6.
基于稀疏表示的超分辨率算法的图像重建质量好,但算法复杂,现有的CPU串行执行算法无法满足视频实时处理的需要。为此提出了基于GPU加速的稀疏表示的实时视频超分辨率算法。该算法着重于优化数据并行处理流程,提高GPU资源利用率,通过设置视频帧队列、提高显存访问并发率、采用主成分分析(PCA)降维、优化字典查找等手段,使算法执行速度比现有CPU串行算法提高了2个数量级,在显示分辨率为669×546的视频回放测试中达到每秒33帧。  相似文献   

7.
基于光线投射的全GPU实现的地形渲染算法   总被引:1,自引:0,他引:1  
刘小聪  杨新 《计算机仿真》2010,27(2):226-230
地形渲染算法需要处理大量的地形及纹理数据,影响三维动画显示的流畅性和性能提高。随着GPU绘制能力提高,CPU与GPU的负载失衡逐渐成为制约性能提高的瓶颈。结合现代GPU体系结构,在GPU上实现了基于光线投射(Ray Casting)的地形渲染算法。算法简化了Ray Casting算法,把LOD策略和预裁剪统一到GPU中实现,保证了CPU和GPU之间的负载平衡,同时简化了应用程序的编制。为获得较好效果,还采用查找表(Lookup—Table)的实时纹理合成算法合成纹理,进一步降低了CPU处理纹理数据的开销。实验表明,本文算法不仅充分利用了GPU的处理能力,还降低了CPU负载,提高了动态三维重建的帧刷新率,并获得较逼真的渲染效果。  相似文献   

8.
荆锐  赵旦谱  台宪青 《计算机工程》2012,38(23):198-202
在三维重建中,不同摄像机坐标系下点云配准耗时过多。为此,提出一种基于图形处理单元(GPU)的实时三维点云数据配准算法。利用投影映射法获取匹配点对,使用点到切平面距离最小化方法计算变换矩阵,通过GPU多线程并行处理大规模图像数据。实验结果表明,对于分别包含307 200个数据的2帧点云,在保持原有配准效果的基础上,该算法的最优耗时仅为基于CPU的最近邻迭代算法的11.9%。  相似文献   

9.
为提升三维重建任务的执行速度,解决行业现实应用对时效性的需求,提出一种无人机影像并行处理与特征提取算法,基于CPU与GPU两种计算架构在三维重建的两个阶段并行加速处理。一是基于CPU的并行处理策略,针对多核处理器采用OpenMP多线程机制,对无人机影像进行并行加载,为后续处理提供高效数据源;二是基于GPU的并行处理策略,通过改进SIFTGPU算法在GPU上以并行方式对图像进行特征提取,为快速重建提供特征输入。真实数据的实验结果表明,与现有算法相比,在图像处理速度上提升了2倍,特征点数量提升了4倍的同时,提取速度提升了11倍。  相似文献   

10.
摘要:针对采用单CPU CT图像重建时间长,采用CPU集群重建成本及能耗高的问题,本文提出了CPU多线程+GPU的异构重建模型。这种模型采用CPU多线程流水线模式,将整个任务分解为若干个处理阶段,相邻的两个阶段之间以循环缓存连接,上一阶段完成一次计算任务后将数据放到循环缓存里,然后继续下一次的计算任务,下一阶段探测到循环缓存里有数据后,从缓存里取出数据开始计算。各个任务是并行处理任务的,针对某一耗时瓶颈模块再采用GPU并行加速,充分发挥CPU和GPU的计算资源。CPU多线程+GPU模型相对于CPU多线程模型加速16.45倍,相对于串行CT图像重建加速20.5倍以上。将CPU多线程+GPU模型重建的图像与CPU串行程序重建的CT图像比较,数据结果在误差范围内,满足实验设计要求。本文提出的图像重建模型采用成本较低的GPU显卡就实现了性能大幅提升,大大降低了CT图像重建系统的成本及功耗,而成本及功耗的降低会引起CT医疗诊断费用的降低,最终惠及广大病患。  相似文献   

11.
为了提高传统FDK(Feldkamp-Davis-Kress)重建算法的重建速度,根据三角函数在一定程度上表现出来的周期性的特点对极坐标下的FDK重建算法进行了改进。改进的算法能够一次性对多幅投影数据进行反投影重建,并且大大减少了三角函数的运算量。同时利用正余切函数的对称性,在将重建后的图像从极坐标向笛卡尔坐标的转换过程中一次性将多个重建后的像素点进行转换。实验结果表明,对比传统FDK重建算法,经过该优化的算法在重建速度上提高了近10倍。  相似文献   

12.
基于集群并行及指令优化的FDK重建算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为提高锥束CT的FDK重建算法在重建高分辨率的图像时的速度,分析2种并行策略及其对应的通信时耗,研究集群并行与SSE指令优化计算相结合的FDK算法,在8个节点的集群系统上进行实现。实验结果表明,采用集群并行加指令优化的方式,可将分辨率为2563的图像的重建速度提高到原来的29倍。  相似文献   

13.
一种新的基于平面检测器的锥形束体积重建算法   总被引:2,自引:0,他引:2       下载免费PDF全文
由于锥形束体积重建算法具有较高的获取投影数据的速度、较大的 X射线利用率及能保持重建物体的空间和密度各向同性等方面的优点 ,因而引起了人们的广泛关注 .针对锥顶轨迹为单圆的锥形束体积重建问题 ,提出了一种基于平面检测器的 T- FDK算法 (简称 FT- FDK算法 ) .该算法首先将锥形束投影数据重排为倾斜平行投影数据 ,然后再经过加权滤波和反投影重建来得到待测物体的三维结构 .实验结果表明 ,该算法不仅与传统的 FDK算法有相同的计算复杂度 ,且重建图象的质量有了明显的提高 ,因而该算法在医学成像和无损探伤等领域具有重要的实用价值 .  相似文献   

14.
一种基于可编程图形硬件的快速三维图像重建算法*   总被引:4,自引:0,他引:4  
针对三维CT图像重建时间过长这一瓶颈问题,给出了FDK算法的几何描述,并据此导出了利用可编程图形硬件加速三维图像重建的方法,最后利用图形处理器的可编程、高精度以及并行计算等特性实现了该方法。实验结果表明,该三维图像重建方法非常有效,与原始算法相比取得了8倍左右的重建加速比。  相似文献   

15.
基于CUDA的并行布谷鸟搜索算法设计与实现   总被引:1,自引:0,他引:1  
布谷鸟搜索(cuckoo search,CS)算法是近几年发展起来的智能元启发式算法,已经被成功应用于多种优化问题中。针对CS算法在求解大数据、大规模复杂问题时,计算时间过长的问题,提出了一种基于统一计算设备架构(compute unified device architecture,CUDA)的并行布谷鸟搜索算法。该算法的并行实现采用任务并行与数据并行相结合的方式,利用图形处理器(graphic processing unit,GPU)线程块与线程分别映射布谷鸟个体与个体的每一维数据,并行实现CS算法中的鸟巢位置更新、个体适应度评估、鸟巢重建、寻找最优个体操作。整个CS算法的寻优迭代过程完全通过GPU实现,降低了算法计算过程中CPU与GPU的通信开销。对4个经典基准测试函数进行了仿真实验,结果表明,相比标准CS算法,基于CUDA架构的并行CS算法在求解收敛性一致的前提下,在求解速度上获得了高达110倍的计算加速比。  相似文献   

16.
特征点检测被广泛应用于目标识别、跟踪及三维重建等领域。针对三维重建算法中特征点检测算法运算量大、耗时多的特点,对高斯差分(Difference-of-Gaussian,DoG)算法进行改进,提出特征点检测DoG并行算法。基于OpenMP的多核CPU、CUDA及OpenCL架构的GPU并行环境,设计实现DoG特征点检测并行算法。对hallFeng图像集在不同实验平台进行对比实验,实验结果表明,基于OpenMP的多核CPU的并行算法表现出良好的多核可扩展性,基于CUDA及OpenCL架构的GPU并行算法可获得较高加速比,最高加速比可达96.79,具有显著的加速效果,且具有良好的数据和平台可扩展性。  相似文献   

17.
为了确定病人的摆位误差,实现精确放疗,提出一种改进的Demons弹性配准算法。采用FDK算法对锥形束CT(CBCT)图像进行三维重建,利用可视化工具包 (VTK)体绘制法可视化重建结果;在分割与配准工具包 (ITK)基础上实现Demons算法,并基于对称梯度的思想,将参考图像和浮动图像的梯度场信息加入到Demons算法中,给出新的Demons形变力公式。分别使用单模态和多模态医学图像进行配准实验,结果显示改进的Demons算法与原始Demons算法相比,配准速度更快、精度更高。基于对称梯度的Demons算法更适用于图像引导放射治疗中CBCT重建图像与CT计划图像间的配准。  相似文献   

18.
张峰  陆利忠  闫镔  李磊 《计算机工程》2011,37(10):275-277
反投影运算是锥束CT图像重建算法中运算量最大,最耗时的部分,是制约重建速度的瓶颈。为此,在计算统一设备架构模型下,应用体素驱动法实现基于Tesla平台的反投影(BP)并行运算,并对BP运算上的访存和数学指令进行优化。实际CT数据的重建结果表明,该方法的运算速度是CPU串行程序的198倍,效率高且易于实现。  相似文献   

19.
Fermi架构下的时域高斯滤波并行算法   总被引:1,自引:0,他引:1  
为提高图形图像处理中高斯滤波算法模块的计算速度,将高斯滤波与Fermi平台相结合,设计了一种高斯滤波时域的并行算法。数据测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到误差精度小于0.0001的计算结果,而且可以取得较大的加速效果。在数据规模为512×112×128和滤波窗口大小为11的情况下能够达到约210倍的加速效果。  相似文献   

20.
吴健  兰时勇  黄飞虎 《计算机工程》2014,(2):208-211,218
针对当前高分辨率的多路视频拼接系统速度慢、实时性能低的问题,提出一种基于CPU和GPU并行架构的多路高清视频拼接算法。该算法在传统基于方向的快速特征点检测和旋转不变的特征描述算法上进行改进,删除针对尺度不变性应用的图像金字塔模块,并使用基于重叠区的局部配准方法,将配准后的图像数据在GPU设备端进行并行融合。在GPU与CPU异步执行的原则上,实现CPU端当前帧图像的配准,与其前帧图像融合,且以并行方式执行。通过显卡端图像数据计算与图像渲染之间的共享缓冲区,完成帧图像的快速渲染。实验结果表明,在4路200万像素的网络相机环境下,该算法实现的全景拼接系统的视频帧率达到17 f/s,可满足大场景的实时性需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号