期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何兴无周洪林蒋蕙竹雷静《计算机应用与软件》2012,(10):276-279

在医学超声成像系统中斑点噪声是影响超声图像成像品质的重要因素.使用直方图信息可以较好地识别出斑点噪声和组织结构区域,从而进行自适应滤波抑制噪声.但这一处理涉及大量的复杂计算,使其成为临床实时成像系统中的一大性能瓶颈.为此研究并提出一种基于高性能计算平台Fermi架构GPU(graphicsprocessingunit图形处理单元)的并行处理算法.数据测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到完全一致和较好的图像去噪效果,而且可以获得良好的加速性能,基本满足实时系统的需求.对于512×512的图像数据能够达到228fps的高帧率,速度提高了大约115倍. 相似文献

2.

CUDA下使用区域增长的超声斑点噪声抑制

何兴无李辉《微处理机》2013,34(4)

在数字彩色超声成像系统中斑点噪声是影响超声图像成像品质的重要原因.使用图像局部区域的统计信息可以较好地识别出斑点噪声和组织结构区域,进而使用自适应滤波抑制斑点噪声.但这一处理涉及大量复杂计算,使其难以在临床实时成像系统发挥作用,为此研究并提出了一种基于新兴的高性能并行计算平台Fermi架构GPU(graphics processing unit图形处理单元)的并行斑点噪声抑制处理算法.数据测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到完全一致和较好的图像去噪效果,而且可以取得较大的加速性能.对512 ×512的图像数据能够达到65fps的高帧率,速度提高了大约183倍. 相似文献

3.

Fermi架构下各向异性扩散超声斑点噪声抑制

何兴无《微处理机》2013,34(1):41-44,48

在医学超声成像系统中斑点噪声是影响超声图像成像品质的主要原因。使用图像局部区域的相干性信息可以较好地进行斑点噪声抑制,半隐式加性算子分裂的运算方式相比较于传统显式各向异性的滤波方式更稳定可靠。但这一各向异性扩散方法在处理时涉及大量的复杂计算,使其在目前的超声系统上难以得到实际应用,为此提出一种基于新兴高性能并行计算平台Fermi架构GPU(graphics processing unit图形处理单元)的并行斑点噪声抑制处理算法。测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到完全一致和较好的图像去噪效果,而且可以取得较大的加速效果,基本满足实时系统需求。对于512×512的图像数据能够达到378fps的帧率,速度提高了约119倍。相似文献

4.

基于GPU光线投射的多平面交互彩色体数据切割方法

袁非牛《数据采集与处理》2010,25(4)

基于代理多边形的3D纹理映射体绘制成像速度快,能够直接利用OpenGL剪切平面功能实现多平面实时切割,但成像质量不高.本文通过分析彩色数据场的不透明度转换函数,研究基于GPU的光线投射算法,用于数字人彩色体数据的快速高质量可视化.为了避免转换函数设计困难和不足,提出一种基GPU的多平面快速切割算法,能够实时清晰观察彩色体数据内部组织.实验结果表明:基于GPU的光线投射算成像质量高、速度快,该多平面交互切割方法能够清晰观察组织结构. 相似文献

5.

基于压缩域的脑成像大数据体可视化方法

时学凯王文珂黄辉李思昆傅艺绮《计算机科学》2017,44(3):27-31

脑科学是当今国际科技研究的前沿邻域,而对高精度脑成像数据进行可视化是脑神经科学在结构成像方面的基础性需求。针对高精度脑成像数据可视化过程中存在的数据量大以及绘制效率低的问题,提出了基于分类分层矢量量化和完美空间哈希相结合的压缩域可视化方法。首先对体数据进行分块,记录每块的平均值并依据块内体数据的平均梯度值是否为0进行分类;其次运用分层矢量量化对平均梯度值不为0的块进行压缩;然后用分块完美空间哈希技术存储压缩得到两个索引值;最后对上面的压缩体数据进行解码得到恢复体数据,采用分块完美空间哈希对原始体数据与恢复体数据作差得到的残差数据进行压缩。绘制时,只需将压缩得到的数据作为纹理加载到GPU内,即可在GPU内完成实时解压缩绘制。实验结果表明,在保证较好图像重构质量的前提下,该算法减少了数据的存储空间,提高了体可视化的绘制效率,从而可以在单机上处理较大的数据。相似文献

6.

基于FPGA+GPU的图像采集处理系统设计

下载免费PDF全文

蒋俊伦丰大强徐新瑞程坤常中坤王桢《计算机测量与控制》2023,31(8):273-279

随着嵌入式图像处理系统的快速发展,对于前端图像采集模块的需求越来越高。图像采集的速度、分辨率、可靠性以及集成度对后续设计的准确度由极大的影响。通过对数字图像采集系统进行研究,设计出了基于FPGA和GPU架构的图像采集处理系统,重点研究了图像采集处理系统的硬件设计过程和软件设计过程。在基于FPGA+GPU的图像采集处理系统中,让具有强大运算处理能力的GPU专注于数据存储、用户交互以及后续的图像处理。系统中,FPGA则负责图像的采集、外设控制、任务调度。GPU与FPGA之间通过高速PCIE总线进行通信,分别设计编写基于Linux系统的驱动程序和FPGA端PCIE程序。实验结果表明,所设计基于FPGA+GPU的图像采集处理系统可实现437.5Mbps的实时图像采集存储速度,传输过程实时稳定,数据传输完整。相似文献

7.

GPU加速的并行粒子模拟在线可视化

方晓健徐骥威华彪何险峰葛蔚《计算机与应用化学》2011,28(10)

粒子模拟是研究离散粒子和连续介质运动规律的常用方法.而大规模的粒子模拟通常借助高性能计算系统.近年来,得益于其众核架构,图形处理器(GPU)已成为高性能计算的重要设备,并被广泛用于大规模粒子模拟过程的加速.本文讨论了一种对GPU加速的分布式粒子模拟进行在线可视化的方法.在该方法中,GPU除了被用于加速粒子模拟过程外,也被用于数据到图像的快速转换.同时,并行绘制技术被用于分布式数据的可视化.通过本文所述的方法,用户可在并行计算运行过程中,通过显示于拼接显示墙的高分辨率图像,实时地观察到粒子模拟中发生的现象,并对计算过程进行跟踪和调整. 相似文献

8.

地震资料逆时偏移中的图形处理器加速算法

柯璇石颖刘诗竹《计算机系统应用》2013,22(11):115-118

叠前逆时偏移（RTM）方法是目前地震勘探领域最为精确的一种地震数据成像方法,其运用双程声波方程进行波场延拓,可实现对复杂构造介质的准确成像．文中采用互相关成像条件对震源波场与检波点波场在同时刻相关成像．针对RTM方法计算量大的问题,将图形处理器（GPU）引入到RTM计算中,充分挖掘GPU的众核结构优势,利用基于CUDA架构的并行加速算法取代传统CPU的串行运算,对逆时偏移算法中较为耗时的波场延拓和相关成像过程进行加速．复杂模型测试结果表明,在确保RTM成像精度的前提下,相比于传统CPU计算,GPU并行加速算法可大幅度地提高计算效率,进而实现基于GPU加速的叠前逆时偏移算法对复杂介质的高效率、高精度成像．相似文献

9.

大规模数据快速体绘制方法的设计与实现

周琳娜蔡勋曾亮《计算机工程与设计》2009,30(23)

体绘制是科学计算可视化的重要手段,针对大规模数据场体绘制计算量大、效率低的问题,提出一种基于哈尔小波变换的三维规则网格数据场快速体绘制方法.采用整体描述、局部细化的策略对转换后的数据进行组织、管理和调度,实现了多尺度分析和快速随机存取,并有效解决了CPU在处理大规模数据集时纹理内存的局限;采用基于CUDA(计算统一设备架构)的GPU加速技术提高体绘制算法性能,很好的实现了大规模数据集的交互式可视化. 相似文献

10.

GPU加速的台风可视化方法

下载免费PDF全文

秦绪佳张勤锋陈坚郑红波徐晓刚《中国图象图形学报》2012,17(2):293-300

自然现象的可视化是计算机图形学和虚拟现实领域的重要研究内容。对传统光线投射算法分析的基础上进行改进,提出基于球壳体的光线投射算法。将GPU运用于球壳体数据场的体绘制,设计了基于球壳体数据场的顶点着色程序和像素着色程序。同时,对台风源数据格式进行解析,生成了用于台风可视化的体数据,采用提出的算法实现了台风云层和因子的可视化。实验结果表明,本文基于GPU的球壳体光线投射算法在球体表面较好地实现了实时台风可视化效果。相似文献

11.

CUDA平台下的超声弹性成像并行处理算法

张霞何兴无《计算机与数字工程》2012,40(9):113-116

超声弹性模式成像是新兴高端超声成像系统中出现的新型成像模式,与传统的黑白超,彩超成像模式不同,它能够为临床诊断提供组织器官的硬度信息.弹性成像模式可以帮助医生定性和定量地检测组织的弹性值变化,特别是对一些肿瘤疾病如乳腺癌等的早期检测有巨大的推动作用,因此,这一新型检测手段具有十分重大的临床应用价值.但是弹性成像系统在处理时涉及大量的复杂运算,使其难于在临床实时系统中得到应用,为此文章研究并提出一种基于CUDA(Compute Unified Device Architecture,统一计算设备架构)平台的超声弹性成像模式并行处理算法.算法包括了信号预处理,运动计算,应变估计和图像后处理与显示等处理步骤的并行实现.由弹性体模得到的数据实验表明,基于CUDA的超声弹性成像处理结果与基于CPU的实现相比,不仅可以得到相同质量的显示图像,而且可以取得较大的加速效果,满足实时系统需求,文章的数据测试显示对于256×512的信号数据能够达到63fps的帧率,速度提高了85倍. 相似文献

12.

Real-time virtual environment signal extraction and denoising using programmable graphics hardware

Yang Su Zhi-Jie Xu Xiang-Qian Jiang 《国际自动化与计算杂志》2009,6(4):326-334

The sense of being within a three-dimensional (3D) space and interacting with virtual 3D objects in a computer-generated virtual environment (VE) often requires essential image, vision and sensor signal processing techniques such as differentiating and denoising. This paper describes novel implementations of the Gaussian filtering for characteristic signal extraction and wavelet-based image denoising algorithms that run on the graphics processing unit (GPU). While significant acceleration over standard CPU implementations is obtained through exploiting data parallelism provided by the modern programmable graphics hardware, the CPU can be freed up to run other computations more efficiently such as artificial intelligence (AI) and physics. The proposed GPU-based Gaussian filtering can extract surface information from a real object and provide its material features for rendering and illumination. The wavelet-based signal denoising for large size digital images realized in this project provided better realism for VE visualization without sacrificing real-time and interactive performances of an application. 相似文献

13.

并行时空处理模型下的快速N-body算法

下载免费PDF全文

王伟曾栩鸿王福焕傅丽丽曾国荪《计算机科学与探索》2011,5(11):1006-1013

图形处理器(graphic processing unit,GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU的CUDA(compute unified device architecture)和OpenCL(open computing language)编程模型为程序员提供了充足的类似于C语言的应用程序接口(application programming interface,API),便于程序员发挥GPU的并行计算能力。采用图形硬件进行加速计算,通过一种新的GPU处理模型——并行时间空间模型,对现有GPU上的N-body实现进行了分析,从而提出了一种新的GPU上快速仿真N-body问题的算法,并在AMD的HD Radeon 5850上进行了实现。实验结果表明,相对于CPU上的实现,获得了400倍左右的加速;相对于已有GPU上的实现,也获得了2至5倍的加速。相似文献

14.

基于GPU的图像快速旋转算法的研究及实现 总被引：2，自引：0，他引：2

下载免费PDF全文

刘耀林邱飞岳王丽萍《计算机工程与科学》2008,30(6):48-50

本文提出一种基于GPU（图形处理器）的图像旋转并实时绘制方法。首先,文章概述了一种由GPU完成旋转变换的算法,指出其存在的问题与局限性;然后,引出基于GPU的图像旋转算法,并利用DirectX9．0作为软件开发包,在VC＋＋6．0平台实现了图像的旋转以及实时显示;最后,对两种方法的实验结果进行了比较与分析。算法充分吸收GPU在速度以及节约CPU资源等方面的优势,保证了图像旋转的运算速度与旋转质量。相似文献

15.

Fermi架构下的时域高斯滤波并行算法 总被引：1，自引：0，他引：1

何兴无《计算机与数字工程》2012,40(11):142-145

为提高图形图像处理中高斯滤波算法模块的计算速度,将高斯滤波与Fermi平台相结合,设计了一种高斯滤波时域的并行算法。数据测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到误差精度小于0.0001的计算结果,而且可以取得较大的加速效果。在数据规模为512×112×128和滤波窗口大小为11的情况下能够达到约210倍的加速效果。相似文献

16.

CPU/GPU 异构环境下图像协同并行处理模型

杨洪余李成明王小平姜青山《集成技术》2017,6(5):8-18

随着GPU通用计算能力的不断发展,一些新的更高效的处理技术应用到图像处理领域.目前已有一些图像处理算法移植到GPU中且取得了不错的加速效果,但这些算法没有充分利用CPU/GPU组成的异构系统中各处理单元的计算能力.文章在研究GPU编程模型和并行算法设计的基础上,提出了CPU/GPU异构环境下图像协同并行处理模型.该模型充分考虑异构系统中各处理单元的计算能力,通过图像中值滤波算法,验证了CPU/GPU环境下协同并行处理模型在高分辨率灰度图像处理中的有效性.实验结果表明,该模型在CPU/GPU异构环境下通用性较好,容易扩展到其他图像处理算法. 相似文献

17.

Design space exploration of SW beamformer on GPU

Thi Yen Phuong Jeong‐Gun Lee 《Concurrency and Computation》2015,27(7):1718-1733

Ultrasound imaging has become one of the most widely used modalities in medical diagnosis today. However, real‐time ultrasound imaging requires large amount of data transfer and massive computation and therefore mainly relies on a complex dedicated hardware system. A recent trend of a graphics processing unit (GPU) based software‐based approach offers the advantages of flexibility and quick implementation. The GPUs have been reported as excellent accelerators across a wide range of applications. For best exploiting outstanding computational power and high memory bandwidth of a GPU, the paper explores the design space of implementing an ultrasound beamformer on a GPU platform. The design spaces are expanded by applying different optimization strategies to the beamformer on a GPU platform, and we also discuss the performance evaluation results on the various GPUs whose architectural characteristics are different to each others. The performance analysis shows that by optimizing CUDA code, our real‐time‐GPU‐based beamformer can be successfully implemented with 181 frames per second (fps) and speedup of 230.6X compared with the single‐threaded implementation on a high‐performance CPU platform. Copyright © 2014 John Wiley & Sons, Ltd. 相似文献

18.

图形处理器空间插值并行算法的实现

下载免费PDF全文

赵艳伟程振林董慧方金云《中国图象图形学报》2012,17(4):575-581

空间插值是地理信息系统(GIS)空间分析中计算复杂且耗时的操作,因此无法满足实时性的要求。随着图形处理器(GPU)浮点计算能力的大幅提高,GPU通用计算已成为处理GIS领域内复杂计算的研究热点。为实时化一些传统低效的算法提供了良好的契机。利用GPU在并行计算上的优势,将反距离加权法插值算法映射到了统一计算设备架构(CUDA)并行编程架构。首先在GPU中建立二级索引使计算层次得到了合理的划分,然后利用多线程分块策略执行并行插值计算。最后通过实验表明,该方法的插值误差与CPU方法相比能控制在10-6数量级,并且在插值半径较大插值数据较多的情况下,该算法可达到40倍以上的加速比。充分证明了该方法的正确性及高效性。相似文献

19.

大规模稀疏矩阵的主特征向量计算优化方法 总被引：1，自引：0，他引：1

王伟陈建平曾国荪俞莉花谭一鸣《计算机科学与探索》2012,6(2):118-124

矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图形处理单元求解得到了广泛关注。分别从应用特征和GPU体系结构特征两方面分析了PEC运算的性能瓶颈,提出了一种面向GPU的稀疏矩阵存储格式——GPU-ELL和一个针对GPU的线程优化映射策略,并设计了相应的PEC优化执行算法。在ATI HD Radeon5850上的实验结果表明,相对于传统CPU,该方案获得了最多200倍左右的加速,相对于已有GPU上的实现,也获得了2倍的加速。相似文献

20.

基于CUDA的超声脉冲多普勒成像

尹华国何兴无周洪林《计算机工程与应用》2012,48(19):140-144

医学超声脉冲多普勒成像模式是在临床超声成像系统中获得人体血管中血流分布情况的一种重要的检测工具,与传统的B超,彩超成像模式不同,超声脉冲多普勒成像模式不仅可以通过频谱图显示表示流过取样容积的血流速度变化和测定某一位置的血流,而且相比较于连续波式多普勒模式它可以消除多普勒信号的混叠效应提高检测的空间分辨率。但是脉冲多普勒系统在处理时涉及大量的复杂运算,例如FFT（快速傅里叶变换）和卷积运算等,使其难于应用到临床实时系统中。为此研究并提出了一种基于统一计算设备架构（CUDA）平台的超声脉冲多普勒成像系统的并行处理算法。该算法包括了壁滤波、频谱估计、移频处理和频谱显示后处理等处理步骤的并行实现。数据实验结果表明,基于CUDA的超声脉冲多普勒成像处理结果与基于CPU的实现相比,不仅可以得到相同质量的频谱图,而且可以取得较大的加速效果,满足实时系统需求;数据测试显示,对于65 535×20的信号数据能够达到1秒处理2 770条谱线的计算性能,速度提高了约140倍。相似文献