首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 167 毫秒
1.
类别激活热度图算法是一种可以在图像中找到具体分类对应的热度图的使用弱监督样本进行训练的算法,算法提取得到的语义信息可以提供给其他的检测任务或者定位任务所使用。提出一种使用神经网络进行计算的图像语义分割的算法,仅需要使用弱监督的训练数据对神经网络进行训练,得到模型。该算法将神经网络所输出的特征图像与网络参数相结合计算得到语义分割的大致区域,再在其中使用语义信息回传的方法,从大致区域的结果中得到更为精确的图像语义分割。最后介绍了该算法在不同的数据集上进行验证的结果,并且展示了内部的实现细节。  相似文献   

2.
针对当前流行的码本模型背景建模和混合高斯模型背景建模对背景像素的分布描述不够精确,建模过程较为复杂,以及处理高分辨率的视频不具备实时性这些问题提出了一种快速简洁的背景建模方法。通过对动态的背景像素在RGB空间的三个色彩分量的统计和分析,发现三个分量相互间的差值在一个狭窄的区域内波动,基于这一事实提出基于RGB色彩分量统计的背景建模方法。该方法充分考虑了RGB三个颜色分量的相关性,较之基于混合高斯模型和码本模型的这两种方法,背景建模的过程更加简单,并且前景检测的过程也更加快捷。实验结果表明该方法不仅能够更准确地描述背景像素的RGB色彩分布,具有良好的鲁棒性,并且大大减少了前景检测的计算复杂度,时间消耗和内存消耗。  相似文献   

3.
目标检测是计算机视觉任务的一个重要组成部分,也是人工智能的一个重要应用,其目的是在自然图像中的大量预定义类别中定位对象实例。同时目标识别也有着广泛的应用场景,可以应用到自动驾驶技术中以及各种侦察车上。系统性介绍了主要的目标识别方法,之后主要介绍两种基于深度卷积神经网络的目标识别方法,并分别说明了它们的应用场景,同时通过具体的实验数据对比了骨干网络的优缺点。与传统的基于特征的目标检测方法相比,基于深度学习的目标检测方法可以同时学习图像的低级特征和高级特征。最后展望了目标检测方法的发展前景。  相似文献   

4.
基于深度学习的目标检测算法综述   总被引:2,自引:0,他引:2  
传统目标检测算法大多基于滑动窗口和人工特征提取,存在计算复杂度高和在复杂场景下鲁棒性差的缺点。近年来,研究人员将深度学习技术应用于目标检测领域,显著提高了算法性能。相比传统算法,基于深度学习的目标检测算法具有速度快、准确性高和在复杂条件下鲁棒性强的优点。从评价指标、公开数据集、传统算法框架等方面对目标检测任务进行阐述,按照是否存在显式的区域建议和是否定义先验锚框两种分类标准,对现有基于深度学习的目标检测算法进行分类,分别介绍算法的演进路线并总结算法机制、优势、局限性及适用场景。在此基础上,分析对比代表性算法在公开数据集中的表现,并对基于深度学习的目标检测的未来研究方向进行展望。  相似文献   

5.
深度卷积神经网络的目标检测算法综述   总被引:1,自引:0,他引:1       下载免费PDF全文
目标检测是计算机视觉中的核心任务之一,在智能视频监控、自动化监测、工业检测等领域应用广泛。近些年来,随着深度学习的快速发展,基于深度卷积神经网络的目标检测算法逐渐替代了传统的目标检测算法,成为了该领域的主流算法。介绍了目标检测算法的常用数据集和性能评价指标,介绍了卷积神经网络的发展,重点分析比较了两阶段目标检测算法和单阶段目标检测算法,展望了基于深度卷积神经网络的目标检测算法未来的发展。  相似文献   

6.
海上石油平台监控环境复杂,采油工作平台摄像头监控角度不同,海上环境复杂多变,雨雾等天气下,摄像头图片模糊不清.针对上述增加了目标检测的难度的问题,提出了一种基于卷积神经网络的复杂场景目标检测算法(简称ODCS)来检测图像中的特定对象.该方法结合不同分辨率的特征图预测来自然处理各种尺寸的对象,消除了特征重新采样阶段,并将所有计算封装在单个网络中,这样易于训练且可以直接集成到需要检测组件的系统中.实验结果表明,相对于传统的方法,该方法检测在准确率和召回率上明显提高,且检测效率能够满足实时应用的要求.  相似文献   

7.
在R-CNN框架提出后,基于深度学习的目标检测框架逐渐成为主流,可分为基于候选窗口和基于回归两类。近两年来,在Faster R-CNN、YOLO、SSD等经典的基于深度学习目标检测框架的基础上,出现了大量的优秀框架。根据优化方法对近几年提出的框架进行了梳理和总结。在PASCAL_VOC和MS COCO等主流测试集上对目标检测方法的性能及优缺点进行了对比分析。讨论了目标检测领域当前面临的困难与挑战,对可能的发展方向进行了展望。  相似文献   

8.
随着深度卷积神经网络优异的特征提取能力被发掘, 目标检测的进程开始以一种势不可挡的姿态向前推进, 同时, 和深度学习结合的目标检测技术取得了显著的成果, 在自动驾驶、智能化交通系统、无人机场景、军事目标检测和医学导航等现实场景中得到了广泛的应用. 本文回顾了传统目标检测算法的缺点, 介绍了常用的检测数据集以及性能评估指标, 综述了基于深度学习的目标检测经典算法, 阐述了当前目标检测的以及存在的困难与挑战, 对目标检测的未来可行的研究方向进行了展望.  相似文献   

9.
目标检测算法研究综述   总被引:1,自引:0,他引:1       下载免费PDF全文
目标检测是计算机视觉中一个重要问题,在行人跟踪、车牌识别、无人驾驶等领域都具有重要的研究价值。近年来,随着深度学习对图像分类准确度的大幅度提高,基于深度学习的目标检测算法逐渐成为主流。梳理了目标检测算法的发展与现状,并作出展望:总结了传统算法与引入深度学习的目标检测算法的发展、改进与不足,并就此做出对比;最后讨论了基于深度学习的目标检测算法所存在的困难与挑战,并就可能的发展方向进行了展望。  相似文献   

10.
SSD(Single Shot MultiBox Detector)是一种基于深度学习的目标检测算法,它作为当前最为主流的检测算法之一,在极大地提高检测速度的同时,还能保证一定的检测精度,但是仍难以满足实际应用的需求。本文在SSD模型的基础上,引入注意力机制,提出一种基于SSD改进的目标检测算法。注意力机制能够有效地提高卷积神经网络对图片特征的提取能力,从而进一步提高算法的检测精度。改进后的算法在Pascal VOC数据集上进行对比试验。实验结果表明,改进后的模型在Pascal VOC2007测试集上的检测精度达到78.5% mAP(mean Average Precision),比改进前提高4.2个百分点,在Pascal VOC2012测试集上的检测精度达到77.1% mAP,比改进前提高4.7个百分点。  相似文献   

11.
目的 自然场景图像中,特征提取的质量好坏是决定目标检测性能高低的关键因素。大多数检测算法都是利用卷积神经网络(CNN)强大的学习能力来获得目标的先验知识,并根据这些知识进行目标检测。卷积神经网络的低层次特征缺乏特征的代表性,而高层次的特征则对小尺度目标的监测能力弱。方法 利用原始SSD(single shot multiBox detector)网络提取特征图,通过1×1卷积层将提取的特征图统一为256维;通过反卷积操作增加自顶向下特征图的空间分辨率;通过对应元素相加的操作,将两个方向的特征图进行融合。将融合后的特征图采用3×3的卷积核进行卷积操作,减小特征图融合后的混叠效应。根据以上步骤构建具有较强语义信息的特征图,同时保留原有特征图的细节信息;对预测框进行聚合,利用非极大抑制(NMS)实现最终的检测效果。结果 在PASCAL VOC 2007和PASCAL VOC 2012数据集上进行实验测试,该模型的mAP(mean average precision)为78.9%和76.7%,相对于经典的SSD算法,分别提高了1.4%和0.9%;此外,本文方法在检测小尺度目标时相较于经典SSD模型mAP提升了8.3%。结论 提出了一种多尺度特征图融合的目标检测算法,以自顶向下的方式扩展了语义信息,构造了高强度语义特征图用于实现精确目标检测。  相似文献   

12.
刘子威  邓春华  刘静 《计算机应用》2020,40(12):3526-3533
基于无锚框深度学习的目标检测是一种主流的单阶段目标检测算法。融合多层监督信息的沙漏网络结构能够显著提升无锚框目标检测算法的精度,然而其速度却远低于同层次的普通网络的速度,并且不同尺度目标间的特征会互相干扰。针对上述问题,提出了一种非对称沙漏网络结构的目标检测算法。该算法在融合不同网络层的特征时不受形状大小的约束,能够快速高效抽象出网络的语义信息,使模型更容易学习到各种尺度之间的差异。针对不同尺度目标检测问题,设计了一种多尺度输出的沙漏网络结构用来解决不同尺度目标间特征互相干扰的问题,并精细化输出的检测结果。另外,针对多尺度输出使用了一种特殊的非极大值抑制算法以提高检测算法的召回率。实验结果表明,所提算法在COCO数据集上的AP50指标达到61.3%,相较于无锚框网络CenterNet提升了4.2个百分点。所提算法在精度与时间的平衡上超越了原始算法,尤其适用于对工业场景的目标进行实时检测。  相似文献   

13.
胡嵽  冯子亮 《计算机应用》2021,41(5):1326-1331
针对深度学习中道路图像语义分割模型参数量巨大以及计算复杂,不适合于部署在移动端进行实时分割的问题,提出了一种使用深度可分离卷积构建的轻量级对称U型编码器-解码器式的图像语义分割网络MUNet.首先设计出U型编码器-解码器式网络;其次,在卷积块之间设计稀疏短连接;最后,引入了注意力机制与组归一化(GN)方法,从而在减少模...  相似文献   

14.
小目标检测是针对图像中像素占比少的目标,借助计算机视觉在图像中找到并判断该目标所属类别的目标检测技术。与目前应用较为成熟的大尺度、中尺度目标检测不同,小目标自身存在着语义信息少、覆盖面积小等先天不足,导致小目标的检测效果并不理想,因此如何提高小目标的检测效果依然是计算机视觉领域的一大难题。对近年来国内外小目标检测领域研究成果进行了梳理,以小目标检测技术为核心,对关于小目标的定义、检测难点进行分析;将能有效提高小目标检测精度的方法进行分类汇总,并介绍了各种方法的应用与优缺点;最后对未来小目标检测领域发展趋势进行了预测与展望。  相似文献   

15.
张华迪 《计算机应用研究》2020,37(12):3811-3814,3819
针对目前协同显著性检测方法中存在的语义特征类相差悬殊的物体被误检测为协同对象等问题,提出了一种基于卷积神经网络和语义相关的协同显著性检测算法CSCCD。首先,采用引导超像素滤波方法对SLIC分割出的超像素区域和DSS生成的显著性区域进行处理,清晰地显示了目标边界轮廓;然后使用Mask R-CNN提取语义特征,给出了图像语义特征和语义一致性的定义,并针对提取语义特征过程中出现的同一语义类别的物体在不同形态下被检测为不同语义类别的问题,提出了图像组语义相关类的概念,在此概念的基础上定义了图像组语义关联类,解决了多幅图像的语义关联问题;最后融合显著性检测区域和图像组语义一致性区域得到协同显著性检测结果。在公开基准数据集上的实验结果表明,该算法能够有效凸显目标整体及轮廓,在客观量化方面的综合性能有明显提升。  相似文献   

16.
邱哲瀚  李扬 《计算机应用》2021,41(12):3680-3685
为了提高立体匹配算法处理前景视差估计任务的计算效率,针对一般网络采用完全双目图像作为输入,场景内前景空间占比小而导致输入信息冗余度大的缺点,提出了一种基于稀疏卷积的目标实时立体匹配算法。为实现和改善算法对稀疏前景的视差估计,首先利用分割算法同时获得稀疏前景掩膜和场景语义特征;其次通过稀疏卷积提取稀疏前景区域的空间特征后与场景语义特征相融合,并将融合特征输入到解码模块进行视差回归;最后以前景真值图作为损失生成视差图。在ApolloScape数据集上的测试结果表明,所提算法的准确性和实时性均优于先进算法PSMNet和GANet,且算法的单次运行时间低至60.5 ms,对目标遮挡具有一定的鲁棒性,可用于目标实时深度估计。  相似文献   

17.
针对当前基于深度学习的目标检测算法采取的特征图融合方式存在缺陷,算法普遍不能很好地应对尺度变化等问题,提出一种跨深度卷积特征增强的目标检测算法CDC-YOLO。对YOLOv3算法进行改进,针对多尺度预测层各自的特点采用与之适应的特征增强模块,采用多通道的跨深度的卷积核并结合空洞卷积并行地提取特征,最终级联起来。该模块能充分利用多尺度多深度特征,形成统一的多尺度特征表达。在VOC2007test上的实验结果表明,提出算法的mAP (均值平均精度)高达82.33%,比原始YOLOv3提升了约2%,且对尺度变化大的物体鲁棒性更强。  相似文献   

18.
目的 时序行为识别是视频理解中最重要的任务之一,该任务需要对一段视频中的行为片段同时进行分类和回归,而视频中往往包含不同时间长度的行为片段,对持续时间较短的行为片段进行检测尤其困难。针对持续时间较短的行为片段检测问题,文中构建了3维特征金字塔层次结构以增强网络检测不同持续时长的行为片段的能力,提出了一种提案网络后接分类器的两阶段新型网络。方法 网络以 RGB 连续帧作为输入,经过特征金字塔结构产生不同分辨率和抽象程度的特征图,这些不同级别的特征图主要在网络的后两个阶段发挥作用:1)在提案阶段结合锚方法,使得不同时间长度的锚段具有与之对应的不同大小的感受野,锚段的初次预测将更加准确;2)在感兴趣区域池化阶段,不同的提案片段映射给对应级别特征图进行预测,平衡了分类和回归对特征图抽象度和分辨率的需求。结果 在THUMOS Challenge 2014数据集上对模型进行测试,在与没有使用光流特征的其他典型方法进行比较时,本文模型在不同交并比阈值上超过了对比方法3%以上,按类别比较时,对持续时间较短的行为片段检测准确率则普遍得到提升。消融性实验中,在交并比阈值为0.5时,带特征金字塔结构的网络则超过使用普通特征提取网络的模型1.8%。结论 本文提出的基于3维特征金字塔特征提取结构的双阶段时序行为模型能有效提升对持续时间较短的行为片段的检测准确率。  相似文献   

19.
人脸活体检测是人脸识别过程中的一个重要环节,对于身份验证的安全性尤为重要。针对人脸识别过程存在照片、视频、面具、头套、头模等欺骗手段,通过Intel Realsense相机采集人脸RGB图和深度图信息,并在MobileNetV3的基础上提出了特征融合的轻量级活体检测网络,将深度图与RGB图的特征融合起来并且进行端到端的训练。而为了解决深度学习中参数量较大以及网络尾部对于权重区域的区分的问题,提出在网络尾部采用Streaming Module以减少网络参数量并且对权重区域进行区分。在CASIA-SURF数据集以及所制作的CQNU-LN数据集上进行仿真实验,结果表明所提方法在两个数据集上均于TPR@FPR=10E-4的级别上达到了95%的精度,相较对比方法中精度最高的ShuffleNet分别提高了0.1%和0.05%;在所制作的CQNU-3Dmask数据集上,所提方法于TPR@FPR=10E-4的级别达到了95.2%的精度,比仅训练RGB图或仅训练深度图的方法分别提升了0.9%和6.5%,并且,模型的参数文件的大小仅为1.8 MB,每秒浮点数运算量(FLOPs)仅为1.5×106。该方法能够在实际应用中对提取到的人脸进行准确的实时检测。  相似文献   

20.
图像可分为前景部分与背景部分,而前景往往是视觉中心.在图像着色任务上,由于前景的类别多且情况复杂,着色困难,以至于图像中的前景部分会存在着色暗淡和细节丢失等问题.针对这些问题,提出了基于前景语义信息的图像着色算法,以改善图像着色效果,达到图像整体颜色自然、内容颜色丰富的目的.首先利用前景子网提取前景部分的低级特征和高级...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号