首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
深度神经网络图像语义分割方法综述   总被引:1,自引:0,他引:1  
图像语义分割是计算机视觉领域近年来的热点研究课题,随着深度学习技术的兴起,图像语义分割与深度学习技术进行融合发展,取得了显著的进步,在无人驾驶、智能安防、智能机器人、人机交互等真实场景中应用广泛。首先对应用于图像语义分割的几种深度神经网络模型进行简单介绍,接着详细阐述了现有主流的基于深度神经网络的图像语义分割方法,依据实现技术的区别对图像语义分割方法进行分类,并对每类方法中代表性算法的技术特点、优势和不足进行分析与总结。之后归纳了图像语义分割常用的大规模公共数据集和性能评价指标,并在此基础上对经典的语义分割方法的实验结果进行了对比,最后对语义分割领域未来可行的研究方向进行展望。  相似文献   

2.
图像语义分割是计算机视觉领域的热点研究课题,随着全卷积神经网络的迅速兴起,图像语义分割和全卷积神经网络的融合发展取得了非常卓越的成绩.通过对近年来高质量文献的收集,重点对全卷积神经网络图像语义分割方法进行总结.将收集的文献,按照应用场景的不同,划分为经典语义分割、实时性语义分割和RGBD语义分割,对具有代表性的分割方法...  相似文献   

3.
Liu  Han  Du  Hang  Zeng  Dan  Tian  Qi 《计算机科学技术学报》2019,34(3):622-633
Journal of Computer Science and Technology - Cloud detection plays a very significant role in remote sensing image processing. This paper introduces a cloud detection method based on super pixel...  相似文献   

4.
针对图像语义分割中存在分割效果粗糙、细节缺失的问题,提出一种结合区域建议网络并实现卷积层共享的联合网络结构。利用区域建议网络生成包含类别标记信息的区域建议框,并使用这些区域建议框来校正全卷积语义分割网络的分割结果。实验表明,该方法可以有效提高像素点的分类正确率,得到更精细的分割效果。  相似文献   

5.
Few-shot semantic segmentation aims at training a model that can segment novel classes in a query image with only a few densely annotated support exemplars.It remains a challenge because of large intra-class variations between the support and query images.Existing approaches utilize 4D convolutions to mine semantic correspondence between the support and query images.However,they still suffer from heavy computation,sparse correspondence,and large memory.We propose axial assembled correspondence n...  相似文献   

6.
语义分割是计算机视觉中的基本任务,是对图像中的不同目标进行像素级的分割与分类.针对多尺度的目标分割难题,本文提出了一种基于Res Net网络的方法,通过定义并联支路,将浅层特征图像信息融合到深层特征图像中,提出新的空洞空间金字塔模块,该模块采用并行的不同采样率的空洞卷积进行特征提取与融合,从而更有效的提取不同层的特征以及上下文信息,并且在新模块中加入批规范化计算,增强参数调优的稳定性.本文还采用了Adam自适应优化函数,在训练的过程中,使得每个参数的更新都具有独立性,提升了模型训练的稳定性.本文结果在PASCAL VOC 2012语义分割测试集中取得了77.31%mIOU的成果,优于Deeplab V3的效果.  相似文献   

7.
无人机航拍图像语义分割研究综述   总被引:1,自引:0,他引:1       下载免费PDF全文
随着无人机技术的快速发展,无人机在研究领域和工业应用方面受到了广泛的关注。图像和视频是无人机感知周围环境的重要途径。图像语义分割是计算机视觉领域的研究热点,在无人驾驶、智能机器人等场景中应用广泛。无人机航拍图像语义分割是在无人机航拍图像的基础上,运用语义分割技术使无人机获得场景目标智能感知能力。介绍了语义分割技术和无人机的应用发展、相关无人机航拍数据集、无人机航拍图像特点和常用语义分割评价指标。针对无人机航拍的特点介绍了相关语义分割方法,包括小目标、模型实时性和多尺度整合等方面。综述无人机语义分割相关应用,包括线检测、农业和建筑物提取等方向,并分析无人机语义分割未来发展趋势和挑战。  相似文献   

8.
随着深度卷积神经网络优异的特征提取能力被发掘, 目标检测的进程开始以一种势不可挡的姿态向前推进, 同时, 和深度学习结合的目标检测技术取得了显著的成果, 在自动驾驶、智能化交通系统、无人机场景、军事目标检测和医学导航等现实场景中得到了广泛的应用. 本文回顾了传统目标检测算法的缺点, 介绍了常用的检测数据集以及性能评估指标, 综述了基于深度学习的目标检测经典算法, 阐述了当前目标检测的以及存在的困难与挑战, 对目标检测的未来可行的研究方向进行了展望.  相似文献   

9.
深度卷积神经网络的目标检测算法综述   总被引:1,自引:0,他引:1       下载免费PDF全文
目标检测是计算机视觉中的核心任务之一,在智能视频监控、自动化监测、工业检测等领域应用广泛。近些年来,随着深度学习的快速发展,基于深度卷积神经网络的目标检测算法逐渐替代了传统的目标检测算法,成为了该领域的主流算法。介绍了目标检测算法的常用数据集和性能评价指标,介绍了卷积神经网络的发展,重点分析比较了两阶段目标检测算法和单阶段目标检测算法,展望了基于深度卷积神经网络的目标检测算法未来的发展。  相似文献   

10.
近年来,深度传感器和三维激光扫描仪的普及推动了三维点云处理方法的快速发展。点云语义分割作为理解三维场景的关键步骤,受到了研究者的广泛关注。随着深度学习的迅速发展并广泛应用到三维语义分割领域,点云语义分割效果得到了显著提升。主要对基于深度学习的点云语义分割方法和研究现状进行了详细的综述。将基于深度学习的点云语义分割方法分为间接语义分割方法和直接语义分割方法,根据各方法的研究内容进一步细分,对每类方法中代表性算法进行分析介绍,总结每类方法的基本思想和优缺点,并系统地阐述了深度学习对语义分割领域的贡献。然后,归纳了当前主流的公共数据集和遥感数据集,并在此基础上对比主流点云语义分割方法的实验结果。最后,对语义分割技术未来的发展方向进行了展望。  相似文献   

11.
为了准确分割开紧密粘连的砂石目标,并获得砂石目标粒径大小,提出一种基于两阶段深度学习的砂石图像粒径检测方法。该方法利用图像处理技术对砂石图像进行预处理,然后通过第一阶段的网络分割模型对砂石目标进行目标分割。对分割目标进行形态学处理后,很多砂石目标紧密粘连在一起,再通过第二阶段的网络分离模型将粘连的砂石目标分离开来,得到分割且分离的结果图。最后计算砂石目标最长径,求均值后得到砂石图像的平均粒径大小。通过实验验证该算法可以快速、准确地将紧密粘连的砂石目标分割开来,提高了砂石目标粒径大小计算精度。  相似文献   

12.
语义分割是近年来比较热的一个主题,而其中对二维人脸图片的区域分割技术的研究,对机器人应用,人脸头部姿势预测,三维人脸识别,分割,动画等方面有重要促进意义。由于目前的人脸区域分割算法在精度上存在一定不足,提出了基于深度网络的人脸区域分割方法,并进行了实验。实验结果表明该算法相较于以前的一些方法精度更高,鲁棒性好,有实际应用意义。  相似文献   

13.
深度卷积神经网络在计算机视觉中的应用研究综述   总被引:13,自引:0,他引:13  
随着大数据时代的到来,含更多 隐含层的深度卷积神经网络(Convolutional neural networks, CNNs)具有更复杂的网络结构,与传统机器学习方法相比具有更强大的特征学习和特征表达能力。使用深度学习算法训练的卷积神经网络模型自提出以来在计算机视觉领域的多个大规模识别任务上取得了令人瞩目的 成绩。本文首先简要介绍深度学习和卷积神经网络的兴起与展,概述卷积神经网络的基本模型结构、卷积特征提取和池化操作。然后综述了基于深度学习的卷积神经网络模型在图像分类、物体检测、姿态估计、图像分割和人脸识别等多个计算机视觉应用领域中的研究现状 和发展趋势,主要从典型的网络结构的构建、训练方法和性能表现3个方面进行介绍。最后对目前研究中存在的一些问题进行简要的总结和讨论,并展望未来发展的新方向。  相似文献   

14.
In recent years, a gain in popularity and significance of science understanding has been observed due to the high paced progress in computer vision techniques and technologies. The primary focus of computer vision based scene understanding is to label each and every pixel in an image as the category of the object it belongs to. So it is required to combine segmentation and detection in a single framework. Recently many successful computer vision methods has been developed to aid scene understanding for a variety of real world application. Scene understanding systems typically involves detection and segmentation of different natural and manmade things. A lot of research has been performed in recent years, mostly with a focus on things (a well-defined objects that has shape, orientations and size) with a less focus on stuff classes (amorphous regions that are unclear and lack a shape, size or other characteristics Stuff region describes many aspects of scene, like type, situation, environment of scene etc. and hence can be very helpful in scene understanding. Existing methods for scene understanding still have to cover a challenging path to cope up with the challenges of computational time, accuracy and robustness for varying level of scene complexity. A robust scene understanding method has to effectively deal with imbalanced distribution of classes, overlapping objects, fuzzy object boundaries and poorly localized objects. The proposed method presents Panoptic Segmentation on Cityscapes Dataset. Mobilenet-V2 is used as a backbone for feature extraction that is pre-trained on ImageNet. MobileNet-V2 with state-of-art encoder-decoder architecture of DeepLabV3+ with some customization and optimization is employed Atrous convolution along with Spatial Pyramid Pooling are also utilized in the proposed method to make it more accurate and robust. Very promising and encouraging results have been achieved that indicates the potential of the proposed method for robust scene understanding in a fast and reliable way.  相似文献   

15.
当前通过图像处理的方法来进行瞳孔分割,导致鲁棒性不高、分割精度低以及运算量大无法满足实时性要求的问题,为此提出一种基于深度学习的人眼瞳孔精确分割方法。该方法采用基于ADEU-Net的快速人眼语义分割网络来获取瞳孔区域,实现对瞳孔的精准分割;该网络创新性地提出膨胀卷积与普通卷积双线并行的方式,在扩大感受野的同时可提升局部精细化能力,并且引入了注意力机制,以充分提取语义特征。实验结果表明,该瞳孔分割方法通过端到端学习,PA相对于U-Net、传统图像处理算法分别提高了5、35个百分点;均交并比MIoU达到94%,明显高于U-Net、传统图像处理算法90%和57%,同时保证了83 frame/s的高分割速度。  相似文献   

16.
舟山作为我国重要的海洋养殖城市与海洋旅游城市,在经济快速发展的同时如何解决日益严峻的海洋垃圾污染问题愈发突显。相比传统的雷达回波方式,基于深度学习的机器视觉检测方法,具备抗海浪干扰能力强,检测速度快,识别信息丰富等优点。采用DeepLabv3+图像语义分割模型,通过YOLOv5s目标检测算法对海面垃圾目标进行实时检测,最后由摄像机单目测距获取目标距离,可以实现检测效率25 fps,检测准确率87%,具备较好的工程应用价值。  相似文献   

17.
视觉感知是无人驾驶技术中的重要一环,而语义分割技术又是实现视觉感知的主要技术手段之一.现在的语义分割技术多采用计算量大、内存占用高的空洞卷积来提取高分辨率特征图,从而导致现在主流的语义分割网络分割速度不足,无法有效应用于无人驾驶的场景中.针对这一问题,提出了一种实时性更好的语义分割网络.首先,采用了一种轻量级的卷积神经...  相似文献   

18.
当前导光板表面缺陷仍主要由人工肉眼观察进行检测,仅有少数生产厂家利用传统的图像处理方法进行检测.由于导光板缺陷在高分辨率工业相机拍摄的图像成像下仍极其微小,且不同缺陷的特征各异,以及整张导光板自身的导光点分布密集、不均匀等纹理特点,导致传统的图像处理检测方法需要经验丰富的视觉工程师进行大量的特征提取算法编程工作和昂贵的代码维护成本,准确率低且稳定性差,为此提出一种基于深度学习语义分割的缺陷检测方法.该方法通过训练神经网络的方式来自主学习提取导光板缺陷特征从而避免繁杂的特征提取算法编程工作.首先,对搜集的导光板缺陷进行缺陷标记,制作样本集;其次,利用迁移学习将预先训练好的金字塔场景解析网络(PSPNet)对标记样本进行再训练;进而,利用训练好的模型实现对导光板缺陷的检测;由于单独的深度学习语义分割缺陷检测方法通常无法满足工业实际应用需求,最后还需结合简单的机器视觉方法,对深度学习语义分割方法检出的所有疑似缺陷区域进行二次判断筛选.实验结果表明,该方法针对亮点、暗点和划痕3种缺陷的检出率高达96%,基本可以满足工业检测要求.  相似文献   

19.
为实现轮毂缺陷检测自动化,该文依据轮毂X射线图像,提出一种基于U-Net卷积神经网络的自动分割的改进方法。将原始U-Net模型的最大池化操作替换为卷积操作,并加入Dropout层对网络进行优化,提升模型可靠性。同时对带有缺陷的轮毂图像做数据预处理,用于训练改进的U-Net模型。结果表明,该网络在复杂轮毂X射线图像的缺陷识别中表现良好,DICE系数为0.8554,SSIM系数为0.9655,识别速度达到3 ms/张;该方法能较好地实现轮毂射线图像缺陷的自动分割,满足无损检测的自动化需要。  相似文献   

20.
基于监控视频的人数(人群)统计是人群行为的分析、资源的优化配置、现代安防、商业信息的采集以及智能管理等重要任务的基础,具有较高的研究意义与应用价值。近年来,数字图像处理技术以及深度学习理论的不断完善和发展,极大地促进了基于监控视频的人数统计的研究,但仍然无法很好地解决监控场景中人数统计准确率较低、高清图片耗时的问题。针对在待检对象尺度变化较大的情况下,基于对象检测的人数统计方法的准确率大幅下降的问题,提出一种基于自适应叠合分割与深度神经网络的人数统计方法。该方法的思想来源于注意力机制,同时充分利用了叠合分割块内人头对象的尺度信息和人数信息。实验结果表明,自适应叠合分割算法能够与现有深度神经网络对象检测模型相结合,并且相较于直接利用深度神经网络对象检测模型进行人数统计的方法, 该结合方法可以大幅提高人数统计的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号