期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于嵌入式移动GPU的离散傅里叶变换并行优化 总被引：1，自引：0，他引：1

曾宝国杨斌《单片机与嵌入式系统应用》2016,(1):12-15

GPGPU能够针对计算密集型的计算问题进行大规模的并行加速,为DFT在嵌入式平台上的高效实现提供了一种新的方式.基于Mali-T604嵌入式GPU实现了针对DFT和FFT的并行加速方案,并进行了实际测试.实验结果证明,所设计的并行方案能够在ARM嵌入式平台上有效加速DFT和FFT,可大大提升移动设备进行数字信号处理的实时性. 相似文献

2.

基于GPU的并行报文分类方法

张唯唯张玉洁《计算机与现代化》2014,(11):9-14

报文分类是网络设备的基本处理模式,通常采用报文过滤系统对每个报文进行分类。传统报文分类难以适应当今越来越高的网络流量,分类处理速度低于报文到达网络接口的速度,无法实现实时分析。因此,本文提出使用GPU对大规模报文集进行并行分类的方法,利用GPU的线程级并行处理能力加速报文分类吞吐率,并对其性能及优化方法进行详细分析。实验结果表明,GPU加速的Linear Search和RFC报文分类算法与纯CPU系统执行相比可达到4.4~132.5倍的加速比。相似文献

3.

基于GPU的网络编码并行优化算法研究

王任黄理灿王高选《工业控制计算机》2011,24(12):59-61

在组播通信网络中,在满足组播速率的前提下,如何使编码资源开销最小化即网络编码优化是一个NP难问题.针对现有基于基本遗传算法的网络编码优化的不足,提出基于GPU的并行遗传算法应用于网络编码优化.通过在不同的网络拓扑结构中进行仿真实验,结果表明提出的并行遗传算法能够在更短的时间内找到满意的编码方案,具有更高的性能. 相似文献

4.

基于GPU的图像特征并行计算方法

张杰柴志雷喻津《计算机科学》2015,42(10):297-300, 324

特征提取与描述是众多计算机视觉应用的基础。局部特征提取与描述因像素级处理产生的高维计算而导致其计算复杂、实时性差,影响了算法在实际系统中的应用。研究了局部特征提取与描述中的关键共性计算模块——图像金字塔机制及图像梯度计算。基于NVIDIA GPU/CUDA架构设计并实现了共性模块的并行计算,并通过优化全局存储、纹理存储及共享存储的访问方式进一步实现了其高效计算。实验结果表明,基于GPU的图像金字塔和图像梯度计算比CPU获得了30倍左右的加速,将实现的图像金字塔和图像梯度计算应用于HOG特征提取与描述算法,相比CPU获得了40倍左右的加速。该研究对于基于GPU实现局部特征的高速提取与描述具有现实意义。相似文献

5.

(加急)基于GPU的并行加速渲染算法的研究

下载免费PDF全文

张晓芬薛国新陆柯彤张宸铭《计算机测量与控制》2016,24(10)

目前,GPU渲染技术仍然存在不足之处,在分配渲染任务时,没有充分发挥各个处理器的优势,浪费了性能较好的处理器,影响了渲染速度的提高。针对以上问题,根据武进区邹区现代农业产业园人口疏散地域接收安置动画的项目,在原有GPU渲染架构的基础上提出了一种基于sort-last架构的带反馈的动态负载均衡算法。在分配渲染任务之前,对所有处理器进行性能统计,将时长较长的场景分配给性能较好的处理器,时长短的分配给剩余的处理器,待有处理器完成渲染任务时,将剩余场景时间较长的,分配给第一轮任务先完成的处理器,以此类推。实验结果表明,该方法对解决上述问题具有较好的效果,解决了目前集群渲染存在的不足之处和负载不平衡的问题,最终实现了加速渲染。相似文献

6.

基于GPU的GRAPES模型并行加速及性能优化

王卓薇许先斌赵武清何水兵张玉萍《计算机研究与发展》2013,50(2):401-411

GRAPES(globalregional assimilation and prediction system)数值天气预报模式作为地球大气一个典型的非线性化离散系统,计算量非常巨大,因此利用低成本、低功耗和高性能的GPU对GRAPES模式进行并行加速成为目前的研究热点.首先通过实现GRAPES模式在GPU中的并行加速,发现系统性能提升并不理想.在此基础上,提出了性能优化策略,包括缓解数据传输时间、降低设备内存加载和存储的数量和避免线程控制流分支,实验结果表明,利用GPU的性能优化策略有效地提升了GRAPES系统性能. 相似文献

7.

三维Navier-Stokes方程的差分-谱方法混合法在GPU上的实现与优化

徐莹徐磊《计算机工程与科学》2012,34(8):53-58

差分-谱方法通常在槽道湍流的直接数值模拟中使用,本文主要研究差分-谱方法在单GPU卡上的实现。由于GPU的硬件发展十分迅速,不同的GPU硬件对双精度计算的支持有所不同,本文首先验证GPU上数值计算的精度,用差分-谱混合法求解标量扩散方程,并将GPU和CPU上获取的数值结果与解析解进行对比,以确定GPU上数值算法实现的精确度。标量扩散方程在Nvidia S2050单GPU卡上求解,获得接近20倍的加速比,三维不可压缩Navier-Stokes方程达到了25倍的加速比。相似文献

8.

基于GPU的遥感图像配准并行程序设计与存储优化

周海芳赵进《计算机研究与发展》2012,(Z1):281-286

遥感图像配准是遥感图像应用的一个重要处理步骤.随着遥感图像数据规模与遥感图像配准算法计算复杂度的增大,遥感图像配准面临着处理速度的挑战.最近几年,GPU计算能力得到极大提升,面向通用计算领域得到了快速发展.结合GPU面向通用计算领域的优势与遥感图像配准面临的处理速度问题,研究了GPU加速处理遥感图像配准的算法.选取计算量大计算精度高的基于互信息小波分解配准算法进行GPU并行设计,提出了GPU并行设计模型;同时选取GPU程序常用面向存储级的优化策略应用于遥感图像配准GPU程序,并利用CUDA(compute unified device architecture)编程语言在nVIDIA Tesla M2050GPU上进行了实验.实验结果表明,提出的并行设计模型与面向存储级的优化策略能够很好地适用于遥感图像配准领域,最大加速比达到了19.9倍.研究表明GPU通用计算技术在遥感图像处理领域具有广阔的应用前景. 相似文献

9.

基于GPU的实时群体仿真算法实现

范晓晔田丰林陈戈《计算机技术与发展》2014,(11):17-22

群体仿真在虚拟现实、影视动画、计算机游戏等领域有着广泛的应用。大规模的群体仿真中每个个体都要同其感知范围内的其他个体相互作用,当实时更新所有个体的状态时,就会导致O（ N2）计算量的问题。针对这一问题,实现了一种基于GPU（图形处理器）的BOIDS群体行为模拟算法,充分利用GPU并行计算的能力处理大规模群体运动的巨大计算量。该方法利用GPU的快速光栅化计算每个个体同其感知范围内的其他个体的相互作用力,通过像素颜色混合功能实现作用力的累加,利用GPU自动生成MipMap的能力计算所有个体的平均速度和平均位置。实验结果表明,该方法能够有效提高大规模群体运动的渲染速度。相似文献

10.

基于GPU并行处理的SAR回波仿真器设计方法

沈晓峰吴文明田宏伟于希辰《测控技术》2019,38(5):99-103

针对合成孔径雷达(SAR)设计了一种基于GPU的回波仿真器,使用并行计算的方法提高SAR回波模拟的效率。仿真数字回波信号通过数/模转换,转换为射频信号输出给SAR系统。使用了BP成像算法对仿真器模拟得到的点目标及分布式目标回波数据进行成像处理,验证了提出的SAR回波仿真器的有效性。实验分析表明,使用GPU并行处理的方法提高了SAR回波仿真的效率。相似文献