共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
5.
针对射电信号观测的需求,设计并实现了一种基于统一计算设备架构(CUDA)和图形显示卡(GPU)的宽带高速频谱分析系统.该系统通过运用库利-图基(Cooley-Tukey)快速傅立叶变换算法与谱分析算法实现实时宽带高速频谱分析.系统的关键部分在于通过CUDA来完成运用线程合并算法对数据在CPU与GPU之间传递时的转换,并使用并行流水算法在总线中共享多核GPU来降低实时运算时间.该系统主要为500m口径射电望远镜工程的高分辨率微波巡视项目而设计,实测中满足目标需求,并可应用在射电信号观测或类似的高速密集数据运算中. 相似文献
6.
纹理合成在计算机动画制作中具有重要地位。为克服传统串行点匹配纹理合成算法效率低下的缺陷,提出一种基于计算统一设备架构(CUDA)的并行合成算法。通过合理安排CPU和GPU之间的数据传输,用GPU进行繁琐耗时的计算,明显地提高了算法效率。 相似文献
7.
基于GPU的快速Sobel边缘检测算法 总被引:2,自引:1,他引:1
传统的Soble边缘检测算法的优化和实现都是针对常用处理器(CPU、DSP和FPGA等)提出的,难以应用在图像处理器(GPU)上.本文提出了一种基于NVIDIA公司CUDA架构图形处理器(GPU)的快速Sobel边缘检测算法.快速算法根据GPU的并行结构和硬件特点,采用了纹理存储技术、多点访问技术和对称计算技术三种加速技术,优化了数据存储结构,提高了数据访问效率,降低了算法复杂度.实验结果表明,快速算法充分利用了GPU的并行处理能力,在处理4 096x4 096分辨力的8位灰度图像时速度可达190 fps,是基于CPU实现的122倍. 相似文献
8.
针对图形处理器(GPU)架构下的软件可移植性、可编程性差的问题,为了便于在GPU上开发并行程序,通过自动映射与静态编译相结合,提出了一种新的基于制导语句控制的编译优化方法,实现了一个源到源的自动转化工具GPU-S2S,它能够将插入了制导语句的串行C程序转化为统一计算架构(CUDA)程序.实验结果表明,经GPU-S2S转化生成的代码和英伟达(NVIDIA)提供的基准测试代码具有相当的性能;与原串行程序在CPU上执行相比,转换后的并行程序在GPU上能够获取显著的性能提升. 相似文献
9.
《振动与冲击》2016,(14)
利用GPU强大的并行计算能力,开发了一种结构非线性有限元静力、动力分析的高精度和高效率分析平台HSNAS(GPU)。为了验证所开发平台的计算精度和效率,分别对反复荷载作用下的钢筋混凝土构件层次和整体结构层次的拟静力试验以及典型框架结构的振动台试验进行模拟。结果表明HSNAS(GPU)平台得到的计算结果与试验结果吻合较好,该平台能较好地模拟构件轴力-弯矩-剪力的多维耦合效应以及刚度和强度退化等非线性行为,求解精度较高。与传统CPU计算平台相比,HSNAS(GPU)平台显示出12倍~14倍以上的加速效率。鉴于GPU的巨大计算潜能空间,所开发的计算平台为工程应用中大规模梁柱结构非线性有限元分析提供了高精度和高效率的分析手段。 相似文献
10.
CUDA是由NVIDIA开发的用于通用并行计算的开发平台,可方便地实现并行算法的编程。本文利用光线跟踪算法具有的天然可并行性,采用KD树加速结构,在CUDA上实现光线跟踪的并行算法,经过纹理内存的优化使用后,可达到交互式光线跟踪。 相似文献
11.
《振动与冲击》2016,(14)
基于传统串行计算平台的有限元分析面临精度不足、耗时巨大的问题成为目前高层钢筋混凝土框架结构非线性动力时程分析面临的瓶颈,利用GPU强大的并行计算能力,开发了一种结构非线性有限元静力、动力分析的高精度和高效率分析平台HSNAS(GPU)。针对静力问题提出了适用于GPU计算,且能有效解决结构负刚度问题的位移增量迭代算法,开发了相应的GPU线性方程组并行求解器;针对动力问题,开发了GPU基于Newmark时间积分算法的动力分析软件平台,结合纤维模型单元技术,引入扭转、剪切变形以及材料非线性。算例模型表明,HSNAS(GPU)平台在满足精度条件下能有效地提高结构非线性静、动力分析的计算效率。 相似文献
12.
随着人们对计算性能要求的不断提高,基于GPU的通用计算逐渐成为个研究热点。本文首先研究了基于GPU的通用计算发展过程中硬件和软件的演变,并进。步讨论了适合GPU通用计算的应用,最后对GPU通用计算在小刖领域的研究力向进行概述。 相似文献
13.
提高各种图像处理算法的处理速度具有重要的实用价值。针对像素级图像处理算法具有并行化程度高的特点,利用GPU的高性能并行处理能力,提出基于CUDA的数字图像并行化处理方法,提高了处理速度。 相似文献
14.
该文采用将EBE计算策略、多重网格法以及GPU并行计算方法三者相结合的计算策略, 设计了一种新颖的迭代求解方法, 可以有效的提高大规模壳结构的有限元分析效率。该方法中, EBE计算策略将总体运算分解到单元上进行, 可以节约计算内存, 提高单机上问题的求解规模, 并且可以有效地提高隐式有限元算法的并行性;多重网格法通过在疏密不同的网格层上进行迭代, 平滑不同频率的误差分量, 可以加快迭代收敛速度;GPU并行计算方法可以在较低硬件成本的前提下实现高效的并行计算。该文采用统一计算架构(Compute Unified Device Architecture, CUDA)进行程序的编制, 并在采用GTX460显卡的个人计算机执行。数值计算结果表明该方法在保证计算精度的同时可以取得较高的计算加速比。 相似文献
15.
16.
17.
谷物粒型是决定谷粒品质和产量的重要参数之一。传统人工测量粒型的方法耗时、工作量大、主观性强。本文首先介绍一种基于线阵列采集技术和工业输送技术的谷物粒型自动测量系统。为提高系统测量效率,文章中应用了图形处理器(GPU)并行处理技术,在统一计算设备架构(CUDA)下对测量算法进行优化。实验结果表明,基于GPU的并行加速算法,能有效提高测量效率,当图像中谷粒数近2000颗时,优化后的算法速度为中央处理器(CPU)下算法运行速度的400多倍,且随着采集图像中谷粒数的增多,优化测量算法的加速效果更显著。 相似文献
18.
为了提高声场模型的计算效率以满足当前水声研究对声场计算速度的要求,针对对称多处理器集群系统多节点并且节点内存在多个处理器的特点,利用共享存储模型OpenMP和消息传递编程模型MPI(Message Passing Inter-face)对声学计算模型RAM(Range-dependent Acoustic Model)进行并行编程,构建了并行计算平台,实现了RAM模型在对称多处理器集群系统上节点间和节点内两级并行,并通过实验对该平台的性能进行了测试。实验结果表明,RAM模型适用于并行计算,该并行计算方法具有很高的并行效率,可以大幅度提高声场计算速度。 相似文献
19.