首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
基于Intel SIMD指令的二维FFT优化算法   总被引:1,自引:0,他引:1  
在基于频域的大数据量图像处理算法中,最为耗时的步骤就是对图像数据进行二维FFT变换的过程。论文针对这一问题,提出一种基于Intel SIMD指令的二维FFT优化算法。通过将数据按照便于SIMD指令计算的方式进行组织,利用SSE3指令加速复数乘法,在二维处理中针对处理器缓存进行优化等方法,实现了很高的性能。实验结果表明:描述的算法比目前使用最广泛的公共域FFT程序包FFTW快30%左右。达到了对大数据量图像进行快速处理的要求,具有较大的工程实用价值。  相似文献   

2.
成像速度是影响体绘制应用的关键 .为了提高成像速度 ,提出一种基于 Intel奔腾 SIMD和分割技术的快速体绘制算法 .仅仅应用奔腾 SIMD并行技术 ,常规光线投射算法的成像速度能够提高 2~ 5倍 .奔腾 SIMD并行指令与分割技术相结合 ,减少了大量空采样 ,进一步提高了成像速度 ,而且这种简单的分割技术能够快速地适应转换函数的改变 .在一台 P4 / 1.6 G的 PC机上 ,以 5 12× 5 12分辨率渲染时 ,该算法渲染速度比常规光线投射算法提高了 10多倍 ,使得等值面的体绘制速度能够达到 1~ 3帧 /秒 .实验结果表明 ,该算法具有渲染速度快、成像质量高等显著优点 ,而且不需要费时的预处理和特殊体视硬件 ,具有较大的实际应用价值 .  相似文献   

3.
一种基于SIMD技术的快速并行代数重建算法   总被引:2,自引:0,他引:2       下载免费PDF全文
代数重建算法是解决非完全投影数据重建的有效方法,尤其在对于超出探测器尺寸范围的大型零件的无损检测中已成为最有力的关键技术,但以往算法计算量较大、耗时较长。为了快速地进行代数重建,提出了一种基于Intel处理器单指令多数据(single instruction multiple data,SIMD)技术[2]的快速并行算法,并在充分分析代数重建公式特点的基础上,设计了一套便于并行化运算的数据结构及计算流程,其在运算中可一次性加载多个打包数据,利用MMX(multimedia extension)、SSE(streaming SIMD extension)和SSE2指令完成SIMD方式计算。通过仿真实验证明,该算法在达到同样精度的前提下,不仅提高了重建速度(加速比4倍),解决了传统代数重建算法运算速度慢的瓶颈问题,并且能够较好地重建部分数据缺失的投影图像,该算法对于航空航天大型零部件的无损检测具有重要的理论意义及工程应用价值。  相似文献   

4.
提出了一种改进的混合高斯背景模型方法,克服了传统混合高斯背景建模方法计算时间长的缺点。通过对视频图像中运动目标区域进行背景建模,减小了每一帧的背景建模区域,同时在提取运动目标区域前先对初提取的前景目标进行中值滤波,减小运动目标区域的范围,进一步压缩了背景建模的时间。最后通过与时间平均背景建模和传统混合高斯背景建模方法进行比较,验证了本文算法的高效性。  相似文献   

5.
模板匹配是进行滤波、边缘检测、目标识别和图像匹配的一种基本和有效的方法。但是模板匹配是一种密集型运算,在单处理机上实现耗时较多,但是如采用并行阵列计算机,硬软件成本也会相应提高。所幸Intel处理器提供了MMX/SSE/SSE2指令集,支持指令级SIMD操作。可将模板匹配主要运算部分进行SIMD并行化,在Linux平台下编程实现单处理机上的并行处理。测试结果表明:SIMD大大加快了模板匹配的速度。  相似文献   

6.
基于SSE2的模板匹配并行算法改进   总被引:1,自引:0,他引:1  
Intel处理器的SSE2(Streaming SIMD Extensions 2,数据流单指令多数据扩展)技术,支持指令级SIMD操作,提供了单处理器上并行处理的解决方法。将模板匹配算法用SSE2 技术并行化,在Linux平台下用GCC编译实现。试验结果表明:SSE2技术大大加快了模板匹配的速度,能够在保证原有精度和稳定性基础上,解决了模板匹配方法计算量大、耗时多, 成本高的问题,有效地满足了在电子产品与制造等众多领域对计算机视觉技术的实时要求。  相似文献   

7.
固定摄像机目标提取多以高斯混合模型为背景模型,在检测运动缓慢、间歇停滞的目标时会出现前景目标空洞的问题。为此,提出一种能够适应目标间歇停滞的多模型协同目标提取方法。采用高斯混合模型进行背景学习,通过光线检测模型和场景状态检测模型协同控制背景适时更新,利用阴影检测模型剔除阴影。实验结果表明,与KaewTraKulPong P方法相比,该方法能较完整地提取到目标轮廓,且单帧处理时间较少。  相似文献   

8.
融合高斯混合模型和小波变换的运动目标检测   总被引:2,自引:1,他引:1       下载免费PDF全文
当前景目标与背景在颜色上接近时,仅采用高斯混合模型进行目标检测容易导致误判。为了提高模型分割算法的鲁棒性,提出一种融合高斯混合模型和小波变换的运动目标检测算法。通过小波变换提取图像的纹理特征信息,利用高斯混合模型拟合背景信息。将两者融合起来,把纹理信息作为颜色信息的补偿,保证了模型在线更新背景信息时模型的稳定性和收敛性,同时弥补了目标分割中前景与背景颜色信息接近时容易导致误判的不足。实验结果表明,本文方法比经典高斯混合模型方法具有较高的分割精度。  相似文献   

9.
新型背景混合高斯模型   总被引:5,自引:2,他引:3       下载免费PDF全文
针对背景减除法中经典混合高斯模型计算量过大的问题,提出一种新的背景混合高斯模型。该方法利用偏差均值作为判断模型是否与当前像素值匹配的阈值参数,有效减少了经典模型中由于开平方及指数运算带来的庞大计算量;同时引入持续平稳时间的概念,采用非线性权值更新方法,能够使较长时间停留在场景中的物体迅速成为背景。实验结果表明,该方法显著提高了背景模型的计算效率。  相似文献   

10.
针对混合高斯模型对于噪声与光照变化检测效果不佳的问题,文章提出了结合三帧差分与改进型混合高斯模型的运动目标检测方法.该方法先通过三帧差分快速获取一副背景图像,然后将该背景图像按一定的比例更新到混合高斯模型主背景分布中,再按照改进的混合高斯模型进行背景提取,最后得到前景图像.实验结果表明,利用改进的混合高斯模型算法,提高了算法检测的准确度,并且结合三帧差分法能有效解决噪声与光照变化问题,提高了算法的鲁棒性.  相似文献   

11.
基于CUDA的GMM模型快速训练方法及应用   总被引:1,自引:1,他引:0  
由于能够很好地近似描述任何分布,混合高斯模型(GMM)在模式在识别领域得到了广泛的应用.GMM模型参数通常使用迭代的期望最大化(EM)算法训练获得,当训练数据量非常庞大及模型混合数很大时,需要花费很长的训练时间.NVIDIA公司推出的统一计算设备架构(Computed unified device architecture,CUDA)技术通过在图形处理单元(GPU)并发执行多个线程能够实现大规模并行快速计算.本文提出一种基于CUDA,适用于特大数据量的GMM模型快速训练方法,包括用于模型初始化的K-means算法的快速实现方法,以及用于模型参数估计的EM算法的快速实现方法.文中还将这种训练方法应用到语种GMM模型训练中.实验结果表明,与Intel DualCore PentiumⅣ3.0 GHz CPU的一个单核相比,在NVIDIA GTS250 GPU上语种GMM模型训练速度提高了26倍左右.  相似文献   

12.
扇束工业CT图像重建算法的并行实现   总被引:2,自引:0,他引:2       下载免费PDF全文
工业CT图像的重建速度是工业CT产品的一个重要指标。使用并行算法是提高重建速度的一个行之有效的方法。提出了基于Beowulf集群系统的滤波反投影算法的并行实现方法;并且提出了基于Intel 奔腾SIMD技术的加速算法。在用4台P4/2.9 G微机构建的集群系统平台上对工业CT采集的4个不同的断层投影数据进行重建实验,实验数据表明使用SIMD技术可以得到4-6倍的加速,使用集群并行技术的算法能够得到1.5-3倍的加速,综合应用这两项技术可以得到8-10倍的加速。  相似文献   

13.
Gaussian filtering is a basic operation commonly used in numerous image and volume processing algorithms. It is, therefore, desirable to perform it as efficiently as possible. Over the last decade CPUs have been successfully extended with several SIMD (Single Instruction Multiple Data) extensions, such as MMX, 3DNow!, and SSE series. In this paper we introduce a new technique for Gaussian filtering of volume data sets—the extended volume—together with its SIMD implementation using the SSE technology. We further introduce a SIMD optimized recursive IIR implementation of the Gaussian filter, and finally, we parallelize the SSE versions with the help of OpenMP (Open Multi‐Processing). Experimental evaluation indicates that the SIMD implementation can significantly speed up both versions of the Gaussian filtering and that the non‐recursive extended volume version is faster than the recursive IIR one for small widths of the Gaussian filter. Copyright © 2010 John Wiley & Sons, Ltd.  相似文献   

14.
为准确检测织物在生产过程产生的疵点,提出了一种基于EM算法的高斯混合模型的算法来实现织物疵点的自动检测。由于织物背景纹理信息对织物疵点检测影响较大,采用均值采样对其进行预处理来消除背景纹理的影响,用高斯混合模型对新得到的图像进行处理。在进行高斯混合模型计算时分为E步骤、M步骤。E步骤初始化参数,计算样本像素的后验概率,M步骤更新高斯混合模型中的各参数。根据计算各像素的后验概率判断各像素点应该属于疵点部分还是非疵点部分。实验结果证明该算法能检测、分割出较多种类的织物疵点,具有较好的有效性和可靠性。  相似文献   

15.
为有效地利用无线传感器网络跟踪移动目标,提出了一种基于高斯混合模型的Mean Shift跟踪算法。该算法运用高斯混合模型描述网络区域内目标信号分布的统计特征,利用Mean Shift区分目标信号与环境噪声,并对目标进行定位与跟踪。仿真实验结果表明,该算法在网络存在较大噪声,特别是网络存在大量异常传感器节点读数的情况下,定位精度高、受异常传感器节点读数影响较小。较之以往无线传感器网络目标跟踪算法,该算法具有更好的鲁棒性。  相似文献   

16.
Performance of a parallel algorithm on a parallel machine depends not only on the time complexity of the algorithm, but also on how the underlying machine supports the fundamental operations used by the algorithm. This study analyzes various mappings of image correlation algorithms in SIMD, MIMD, and mixed-mode environments. Experiments were conducted on the Intel Paragon, MasPar MP-1, nCUBE 2, and PASM prototype. The machine features considered in this study include: modes of parallelism, communication/computation ratio, network topology and implementation, SIMD CU/PE overlap, and communication/computation overlap. Performance of an implementation can be enhanced by using algorithmic techniques that match the machine features. Some algorithmic techniques discussed here are additional communication versus redundant computation, data block transfers, and communication/computation overlap. The results presented are applicable to a large class of image processing tasks. Case studies, such as the one presented here, are a necessary step in developing software tools for mapping an application task onto a single parallel machine and for mapping the subtasks of an application task, or a set of independent application tasks, onto a heterogeneous suite of parallel machines.  相似文献   

17.
在多高斯模型的基础上,从场景中模型分布不均匀性出发,提出了一种新的快速背景差算法。该算法针对混合高斯模型中固定模型数量不足的问题,建立了模型产生和退出的机制,使模型数量能够自动适应场景特点,实现了高斯模型的实时自适应分布,即提高了准确性又有效地减少了模型的总量;同时,针对混合高斯模型中计算量大的问题,对模型参数的计算进行了优化,将耗时的浮点运算转化为整型运算,减少了计算量;算法中引入了生存时间和模型重现频率的概念,通过对模型重现频率的限制有效抑制高频噪声。与混合高斯模型的实验结果对比说明,该快速算法保持了原算法的优点,执行速度提高1倍以上,检测结果准确,算法内存消耗小,前景轮廓清晰,抑制高频噪声的能力强,整体效果优于混合高斯模型的背景差算法。  相似文献   

18.
SIMD技术与向量数学库研究   总被引:2,自引:0,他引:2  
首先,结合Intel, AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Celll SDK函数,因其独特的体系结构,多个向量处理单元带来的平均加速比为10。最后,通过测试结果的对比,发现不同数学库中的向量函数之间在性能方面也存在着差异,并对差异原因进行了分析,得出性能差异主要是处理器架构和向量计算单元个数和访存等因素造成的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号