首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
CUDA并行程序的内存访问优化技术研究   总被引:2,自引:0,他引:2  
对统一计算设备架构CUDA技术进行了研究,分析了CUDA体系结构及其内存访问机制的显著特点,总结了CUDA并行程序常见的内存访问问题,针对全局内存的非对齐访问和共享内存的访问冲突,提出了相应的内存访问优化策略;最后,利用直方图均衡算法对此优化技术进行了测试,对比了优化前后的程序执行时间;实验结果表明,利用此优化技术可以大大缩短CUDA程序的执行时间,并且图像像素越大,优化效果越好。  相似文献   

2.
目前已有几种CUDA加速的图像高斯滤波算法,但这些算法有的描述不清楚,也没有人对它们的性能进行详尽的比较,这给理解及应用带来了困难。描述了几种CUDA加速的图像高斯滤波算法,包括直观的实现方式、使用共享内存的分离滤波器方法、使用纹理内存的分离滤波器方法、基于CUFFT的卷积滤波以及递归高斯滤波器。强调了这些算法的核心思想,比较了它们的时间复杂度,通过实验对它们的性能进行了分析。  相似文献   

3.
Nginx设计了简单的内存池进行内存管理来降低开发中对内存资源管理的复杂度。Nginx各进程间使用共享内存的方式共享数据,而对共享内存的内存池进行管理的方法是基于经典的Slab算法,其通过构造小的内存块来避免内存碎片、使用链表方式连接有限的页面来提高分配速率。本文详细介绍Nginx的Slab算法,对其进行总结,并与经典的Linux内核的Slab算法对比。  相似文献   

4.
基于四元三角格网(QTM)之间距离计算与比较的球面Voronoi图生成算法相对于扩张算法具有较高的精度,但由于需要计算并比较每个格网到所有种子点的距离,致使算法效率较低。针对这一问题,利用图形处理器(GPU)并行计算对算法进行实现,然后从GPU共享内存、常量内存、寄存器等三种内存的访问方面进行优化,最后用C++语言和统一计算设备架构(CUDA)开发了实验系统,对优化前后算法的效率进行对比。实验结果表明,不同内存的合理使用能在很大程度上提高算法的效率,且数据规模越大,所获得的加速比越高。  相似文献   

5.
为了有效解决多分辨图像内存在噪声的问题,提出一种基于视觉灵敏度的多分辨图像双边滤波算法。通过粗糙集理论初步判断多分辨图像内的噪声,利用视觉灵敏度对判断结果展开修正。通过双边滤波器将噪声图像分解为高低频两个部分,高频部分使用Curvelet变换折衷阈值,根据设定的阈值保留多分辨图像中更多的边缘纹理细节。将低频图像和处理后的高频图像重构,获取经过滤波处理后的多分辨图像。实验结果表明,所提算法可以精准检测出多分辨图像内存在的噪声,同时能够获取满意的多分辨图像滤波结果。  相似文献   

6.
随着计算机科学技术的迅速发展,嵌入式领域实时图像处理应用越来越广泛,然而传统硬件因为自身架构导致并行化程度不高,针对在视频监控、机器视觉、视频压缩、医疗影像分析等领域需要对图像进行高性能计算的问题,提出一种以OpenCL软件模型和FPGA异构模式的高性能图像处理解决方案,实现了图像显示和OpenCL加速功能,以Sobel边缘检测算法为研究对象,进行了算法并行性分析,并在系统中运用OpenCL加速内核算法,与基本的ARM平台和OpenCL共享内存加速机制相比较,展开性能测试,对加速效果进行了研究。实验数据表明,使用该系统处理不同分辨率的图像,OpenCL加速子系统的处理较基于片上ARM硬核的软件处理,实现相同功能上有100倍左右的性能提升。  相似文献   

7.
张哲 《计算机工程》2011,37(1):36-38
利用并行体系结构中不同层次级别的内存和计算单元,提出一种求解对称结构化特普利茨线性系统的多级并行算法。通过数学推导将特普利茨线性系统转换成柯西式线性系统,利用消息传递接口和开放多平台共享内存并行程序设计工具实现该算法,并通过实验验证其可行性。  相似文献   

8.
我校有多台286无硬盘微机供学生实验用,在一实验中将CMOS SETUP中的参数给改变了,当启动机器、机器内存自检到640KB时,屏幕提示:  相似文献   

9.
现代GPU一般都提供特定硬件(如纹理部件、光栅化部件及各种片上缓存)以加速二维图像的处理和显示过程,相应的编程模型(CUDA、OpenCL)都定义了特定程序设计接口(CUDA的纹理内存,OpenCL的图像对象)以便图像应用能利用相关硬件支持。以典型图像模糊化处理算法在AMD平台GPU的优化为例,探讨了OpenCL的图像对象在图像算法优化上的适用范围,尤其是分析了其相对于更通用的基于全局内存加片上局部存储进行性能优化的方法的优劣。实验结果表明,图像对象只有在图像为四通道且计算过程中需要缓存的数据量较小时才能带来较好的性能改善,其余情况采用全局内存加局部存储都能获得较好性能。优化后的算法性能相对于精心实现的CPU版加速比为200~1000;相对于NVIDIA NPP库相应函数的性能加速比为1.3~5。  相似文献   

10.
分析了面向先进硬件平台上的数据库优化技术,提出了基于内存存储模型的多表连接查询处理优化技术,采用内存存储模型存储维表并对维表主键进行顺序化,从而使维表的主键与内存维表记录的内存偏移地址相一致,实现对维表记录的内存直接访问。通过列存储技术减少维表记录的访问宽度,进一步优化维表访问的cache性能。与基于SQL Server 2005的查询执行计划的连接算法、join index连接算法以及基于列存储模型的优化连接算法进行了实验比较和性能分析,结果表明:基于内存存储模型的多表连接算法在处理星型结构数据仓库多谓词、多连接的复杂查询时具有很好的性能,与join index相比不需要额外的空间开销,与列存储数据模型相比具有更好的兼容性和性能。  相似文献   

11.
针对遥感数据非结构化、有格式、单景数据量大、记录总量小、大部分处理过程后数据量不显著减少的特点和大规模遥感数据处理的迫切需求,基于已有硬件资源,设计和实现了集中式集群计算的多源定量遥感产品生产系统。系统为解决遥感科学工作者设计开发的算法进行并行计算的问题以及大规模数据管理的需求,设计了基于任务并行的处理系统和面向应用的并行文件系统。系统集成了遥感科学工作者开发的30多种原始数据的预处理算法和50多种多源定量遥感产品生产算法,解决了多源定量遥感产品规模化流程化按需生产的难题,并进行了产品生产,证明了系统在管理和处理大规模遥感数据时的可靠性和有效性。  相似文献   

12.
针对目前遥感图像在应用卷积神经网络分类时需要大量计算,并占用大量内存的问题,提出了一种基于剪枝网络的知识蒸馏对遥感图像分类方法.以模型剪枝理论为基础,在网络结构中引入注意力机制,加强对重要特征的提取之后,并对网络进行模型剪枝,然后引入知识蒸馏技术对模型进行迁移学习,补偿模型剪枝之后分类精度的损失.为了证明方法的先进性与可靠性,利用在NWPU-RESISC45遥感卫星数据集上,与同类算法进行对比实验.实验结果表明,所提方法不仅在分类精度有更好的表现,并且在模型大小上更具有优势.  相似文献   

13.
海岸线卫星遥感提取方法研究进展   总被引:10,自引:0,他引:10  
海岸线是划分海洋与陆地管理区域的基准线。不同海岸地貌的海岸线划分依据各不相同,因此,它们在卫星图像上的解译标志与提取方法也存在差异。论述了利用遥感进行海岸线动态监测的优势与海岸线的基本特点及其分类,明确了在各个领域中对海岸线的不同定义,指出了不同类型海岸的遥感解译标志。详细论述了不同种类卫星图像中的海岸线成像机理,介绍了使用卫星遥感图像提取各类海岸线的算法及其发展过程,并对遥感图像中的海岸线提取算法的发展方向做出了分析。  相似文献   

14.
基于GDAL大于2G遥感图像的快速浏览   总被引:1,自引:0,他引:1       下载免费PDF全文
快速显示与浏览大的遥感图像是遥感图像处理与分析软件的一个重要的功能。利用GDAL的快速高效的文件读取功能,动态地分块从文件中读取图像块到内存,动态地建立金字塔结构,从而能快速地显示大的遥感图像。放大、缩小和漫游操作实现了渐变的效果,能给用户非常快速和平滑的感觉。  相似文献   

15.
卫星遥感影像提取村庄区域在地理和气象领域均有十分重要的意义.针对卫星遥感影像的特点,提出了一种村庄区域提取方法.利用改进的去雾算法对卫星遥感影像进行预处理,通过遥感卫星影像的颜色特征实现分割,结合村庄区域分布特点进行去噪处理,实现卫星遥感影像村庄区域的提取.实验结果表明:该算法能够对卫星遥感图像中不同类型村庄区域进行提取,且提取准确率高,可以应用于地理以及气象等领域.  相似文献   

16.
史文旭  鲍佳慧  姚宇 《计算机应用》2020,40(12):3558-3562
为解决目前的遥感图像目标检测算法存在的对小尺度目标检测精度低和检测速度慢等问题,提出了一种基于深度学习的遥感图像目标检测与识别算法。首先,构建一个含有不同尺度大小的遥感图像的数据集用于模型的训练和测试;其次,基于原始的多尺度单发射击(SSD)网络模型,融入了设计的浅层特征融合模块、浅层特征增强模块和深层特征增强模块;最后,在训练策略上引入聚焦分类损失函数,以解决训练过程中正负样本失衡的问题。在高分辨率遥感图像数据集上进行实验,结果表明所提算法的检测平均精度均值(mAP)达到77.95%,相较于SSD网络模型提高了3.99个百分点,同时检测速度为33.8 frame/s。此外,在拓展实验中,改进算法对高分辨率遥感图像中模糊目标的检测效果也优于原多尺度单发射击网络模型。实验结果说明,所提改进算法能够有效地提高遥感图像目标检测的精度。  相似文献   

17.
为解决机载遥感图像质量易受环境影响的问题,对其进行超分辨率重建,对现有深度学习机载遥感图像超分辨率重建方法存在的特征提取能力差、重建图像边缘平滑、模型训练困难的问题进行改进,增强图像重建效果。将生成对抗网络作为模型的整体框架,使用密集剩余残差块增强模型特征提取能力,增加跳跃连接,有效提取机载遥感图像的浅层和深层特征,引入沃瑟斯坦式生成对抗网络优化模型训练。该方法能够有效对机载遥感图像进行4倍重建,在峰值信噪比评价上较对比方法约有2 dB增益,重建出的机载遥感图像在视觉上更清晰、细节更丰富、边缘更锐利。实验结果表明,该方法有效提升了模型特征提取能力,优化了训练过程,重建的机载遥感图像效果较好。  相似文献   

18.
史文旭  鲍佳慧  姚宇 《计算机应用》2005,40(12):3558-3562
为解决目前的遥感图像目标检测算法存在的对小尺度目标检测精度低和检测速度慢等问题,提出了一种基于深度学习的遥感图像目标检测与识别算法。首先,构建一个含有不同尺度大小的遥感图像的数据集用于模型的训练和测试;其次,基于原始的多尺度单发射击(SSD)网络模型,融入了设计的浅层特征融合模块、浅层特征增强模块和深层特征增强模块;最后,在训练策略上引入聚焦分类损失函数,以解决训练过程中正负样本失衡的问题。在高分辨率遥感图像数据集上进行实验,结果表明所提算法的检测平均精度均值(mAP)达到77.95%,相较于SSD网络模型提高了3.99个百分点,同时检测速度为33.8 frame/s。此外,在拓展实验中,改进算法对高分辨率遥感图像中模糊目标的检测效果也优于原多尺度单发射击网络模型。实验结果说明,所提改进算法能够有效地提高遥感图像目标检测的精度。  相似文献   

19.
利用连续监视遥感图像进行的目标动态监测   总被引:1,自引:0,他引:1  
陈新燕  罗功成  杜杨松 《计算机工程》2005,31(8):232-232,F003
利用同一地区不同时期变化检测技术,通过对获取的同一目标、不同时间遥感图像的分析,认为遥感技术对目标的动态监测具有重要的参考价值。  相似文献   

20.
在遥感图像监督分类中经常遇到在单独PC下使用复杂的遥感图像分类算法来实现对大数据量遥感图像监督分类的情况。在这种情况下,由于遥感图像监督分类算法的复杂性与单独PC计算能力的限制导致处理效率低下,并有可能出现内存溢出等状况。经过对网格技术与遥感图像监督分类的研究,给出基于网格环境的遥感图像监督分类算法处理该类问题的解决方案,并使用B/S结构为该应用创建可扩展测试与实验结果查看平台。实验结果表明,此方案有效提高大数据遥感图像分类的效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号