首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
侯庆山  邢进生 《电子学报》2000,48(12):2409-2416
鉴于Single Shot Multibox Detector(SSD)算法对中小目标检测时会出现漏检甚至错检的情况,提出一种改进的SSD目标检测算法,以提高中小目标检测的准确性.运用Gradient-weighted Class Activation Mapping(Grad-CAM)技术对检测过程中的细节作可视化处理,并以类激活图的形式呈现各检测层细节,分析各检测层的类激活图发现SSD算法中待检测目标的错检以及中小目标的漏检现象与回归损失函数相关.据此,采用Kullback-Leibler(KL)边框回归损失策略,利用Non Maximum Suppression(NMS)算法输出最终预测框.实验结果表明,改进算法相较于已有检测算法具有更高的准确率以及稳定性.  相似文献   

2.
为了保证定位的速度和准确率,采用2016年在目标检测领域取得最佳检测效果的YOLO v2网络制作了以明显特征的地物作为目标区域的目标检测数据集。通过目标框维度聚类、分类网络预训练、多尺度检测训练及更改候选框的筛选规则等方法改进YOLO v2网络,使其更好地适应定位任务。能够将无人机实时获取的航拍图像定位到目标区域,并通过投影关系进行坐标转换得到无人机的经纬度。结果表明:该方法效果较为理想,在航拍图像的目标区域检测任务中检测网络的平均准确率提高到79.5%;在包含目标区域的航拍图像中,经模拟飞行的仿真实验验证,其网络定位准确率大于84%。  相似文献   

3.
单发多框检测器SSD是一种在简单、快速和准确性之间有着较好平衡的目标检测器算法。SSD网络结构中检测层单一的利用方式使得特征信息利用不充分,将导致小目标检测不够鲁棒。该文提出一种基于注意力机制的单发多框检测器算法ASSD。ASSD算法首先利用提出的双向特征融合模块进行特征信息融合以获取包含丰富细节和语义信息的特征层,然后利用提出的联合注意力单元进一步挖掘重点特征信息进而指导模型优化。最后,公共数据集上进行的一系列相关实验表明ASSD算法有效提高了传统SSD算法的检测精度,尤其适用于小目标检测。  相似文献   

4.
单发多框检测器SSD是一种在简单、快速和准确性之间有着较好平衡的目标检测器算法.SSD网络结构中检测层单一的利用方式使得特征信息利用不充分,将导致小目标检测不够鲁棒.该文提出一种基于注意力机制的单发多框检测器算法ASSD.ASSD算法首先利用提出的双向特征融合模块进行特征信息融合以获取包含丰富细节和语义信息的特征层,然后利用提出的联合注意力单元进一步挖掘重点特征信息进而指导模型优化.最后,公共数据集上进行的一系列相关实验表明ASSD算法有效提高了传统SSD算法的检测精度,尤其适用于小目标检测.  相似文献   

5.
随着深度学习方法在合成孔径雷达(SAR)图像解译领域的广泛应用,SAR目标识别深度网络可理解性问题逐渐受到学者的关注。类激活映射(CAM)作为常用的可理解性算法,能够通过热力图的方式,直观展示对识别任务起作用的显著性区域。然而作为一种事后解释的方法,其只能静态展示当次识别过程中的显著性区域,无法动态展示当输入发生变化时显著性区域的变化规律。该文将扰动的思想引入类激活映射,提出了一种基于SAR背景杂波特性类激活映射方法(SCC-CAM),通过对输入图像引入同分布的全局扰动,逐步向SAR识别深度网络施加干扰,使得网络判决发生翻转,并在此刻计算网络神经元输出激活值的变化程度。该方法既能解决添加扰动可能带来的扰动传染问题,又能够动态观察和度量目标识别网络在识别过程中显著性区域的变化规律,从而增强深度网络的可理解性。在MSTAR数据集和OpenSARShip-1.0数据集上的试验表明,该文提出的算法具有更加精确的定位显著性区域的能力,相比于传统方法,在平均置信度下降率、置信度上升比例、信息量等评估指标上,所提算法具有更强的可理解性,能够作为通用的增强网络可理解性的方法。  相似文献   

6.
在智能交通领域中,道路场景的三维目标实时检测对于保障汽车行驶安全具有重要意义.使用雷达点云和图像数据进行融合能够达到优势互补的效果,然而使用这两种数据融合的三维目标检测算法为得到较高的检测精度,通常都采用两阶段网络,相比于单阶段网络运算速度较慢,而在实际应用中检测系统的速度是非常重要的.针对以上问题,在单阶段网络RetinaNet上进行改进,设计了一种三维目标实时检测方法,将三维锚框映射到点云和图像的特征图上,利用ROI池化,将锚框在特征图上裁剪出的区域转换成相同大小并融合,最终输出目标边界框的回归参数和类别,并且对锚框进行调整得到目标预测边界框.在KITTI数据集上进行的实验表明,所研究的网络在行人、车辆等多目标检测的精确度和时间消耗方面均优于对比算法.  相似文献   

7.
目标检测的任务是精确识别,有效定位出图像中目标物体,且预定义其类别.针对主流目标检测(single shot multibox detector,SSD)算法存在小目标检测准确度不高,检测效率较低等问题,提出一种基于空间-通道注意力机制的SSD目标检测算法(spatial and channel single shot multi-box detector,SC_SSD).通过在SSD深层网络引入空间-通道注意力机制增强高层特征图语义信息,提高算法获取目标物体的细节与位置信息的能力,从而降低漏检率及误检率,并提高小目标物体检测的准确度.此外,利用MobileNetV2中的深度可分离卷积对SSD主干网络(visual geom-etry group network,VGG-16)进行剪枝处理,降低参数量,从而减少训练与检测的时间.在PASCAL VOC 2007数据集上进行实验,本文算法检测的精确度与速度分别为78.9%与59.4 Fps,比SSD算法提升了 3.2%与26.7 Fps,满足实时性需求.算法也优于相比较的其他算法,是一种有效可行的目标检测算法.  相似文献   

8.
陈禹蒲  马晓川  李璇 《信号处理》2022,38(11):2359-2371
利用侧扫声呐图像来探查海底目标对海洋资源开采和海上军事防护都有重大意义。目前人为提取图像特征进行目标检测的传统机器学习方法逐渐被深度学习取代。深度学习技术在降低算法复杂度的同时提高图像目标检测效率,极大地推动了目标检测技术地发展。将深度学习检测算法应用到侧扫声呐图像目标检测领域时,锚框作为目标检测网络中较为重要的先验信息会影响最终的检测性能,考虑到声呐数据集的真实目标框与网络设定的锚框未必贴合的问题,本文在YOLOv3的基础上对锚框进行了优化,给出了一种能够获取有效先验锚框的策略。首先使用K-Means算法对真实目标框进行聚类,获得比较贴合于声呐数据集的锚框,然后设计了一种超参数锚框映射关系对聚类后的锚框进行拉伸变换,这样获得的锚框既包含了声呐数据集的目标框信息,也能利用到YOLOv3的多尺度特性。实验结果表明,所提锚框优化策略能够让YOLOv3网络获得更优的检测性能,适用于侧扫声呐图像的目标检测问题。  相似文献   

9.
基于深度学习的多视窗SSD目标检测方法   总被引:1,自引:0,他引:1       下载免费PDF全文
唐聪  凌永顺  郑科栋  杨星  郑超  杨华  金伟 《红外与激光工程》2018,47(1):126003-0126003(9)
提出了一种基于深度学习的多视窗SSD (Single Shot multibox Detector)目标检测方法。首先阐述了经典SSD方法的模型与工作原理,并根据卷积感受野的概念和模型特征层与原始图像的映射关系,分析了各层级卷积感受野大小和特征层上默认框在原始图像上的映射区域尺寸,揭示了经典SSD方法在小目标检测上不足的原因。基于此,提出了一种多视窗SSD模型,阐述了其模型结构与工作原理,并通过106张小目标图像数据集测试,评估和对比了多视窗SSD方法与经典SSD方法在小目标检测上的物体检索能力与物体检测精度。结果表明:在置信度阈值为0.4的条件下,多视窗SSD方法的AF (Average F-measure)为0.729,mAP (mean Average Precision)为0.644,相比于经典SSD方法分别提高了0.169和0.131,验证了所提出算法的有效性。  相似文献   

10.
安防场景的行人目标检测不仅需要识别并标定行人位置,还需要对人脸进行检测与提取,支持人脸比对等下游任务。当前目标检测算法在实际应用中存在运行速度慢、边界框标定不准确、小目标检测效果不佳等问题,文中提出一种基于SSD检测器的安防场景下的行人目标检测算法。针对检测器因为分类与定位子任务强耦合造成边界框标定不准确的问题,采用一种解耦的“检测头”保证检测器定位精度,并通过在不同分支上引入特征增强模块提取适应不同子任务的特征;采用一种任务耦合的损失函数来提升训练效果;针对运行速度慢,采用轻量化网络作为主干网络,结合TensorRT量化模型提升算法在嵌入式平台上的运行速度。通过在NVIDIA TX2嵌入式深度学习平台进行实验,单帧图像检测时间为23.8 ms,平均帧率约为42 f/s,算法具备优秀的实时性与准确性。  相似文献   

11.
李维鹏  杨小冈  李传祥  卢瑞涛  黄攀 《红外与激光工程》2021,50(3):20200511-1-20200511-8
针对红外数据集规模小,标记样本少的特点,提出了一种红外目标检测网络的半监督迁移学习方法,主要用于提高目标检测网络在小样本红外数据集上的训练效率和泛化能力,提高深度学习模型在训练样本较少的红外目标检测等场景当中的适应性。文中首先阐述了在标注样本较少时无标注样本对提高模型泛化能力、抑制过拟合方面的作用。然后提出了红外目标检测网络的半监督迁移学习流程:在大量的RGB图像数据集中训练预训练模型,后使用少量的有标注红外图像和无标注红外图像对网络进行半监督学习调优。另外,文中提出了一种特征相似度加权的伪监督损失函数,使用同一批次样本的预测结果相互作为标注,以充分利用无标注图像内相似目标的特征分布信息;为降低半监督训练的计算量,在伪监督损失函数的计算中,各目标仅将其特征向量邻域范围内的预测目标作为伪标注。实验结果表明,文中方法所训练的目标检测网络的测试准确率高于监督迁移学习所获得的网络,其在Faster R-CNN上实现了1.1%的提升,而在YOLO-v3上实现了4.8%的显著提升,验证了所提出方法的有效性。  相似文献   

12.
在空间红外弱目标检测问题中,相关模板法和帧间差分法等传统算法判别率较低,且对数据质量要求较高.针对这一问题,本文提出了一种基于改进YOLOV4的空间红外弱目标检测方法,该算法首先针对空间不同红外目标建立了相应的数据集;以YOLOv4为基础建立了空间目标检测任务专用的神经网络框架,利用k-means聚类算法重新构造先验框...  相似文献   

13.
弱监督目标检测是一种利用图像级别的标签来检测图像中多个或单个示例边界框的计算机视觉任务,具有很高的挑战性。本文首先介绍了弱监督目标检测的背景、问题定义和基本框架,然后对当前的弱监督目标检测算法进行了总结和分析,比较了它们的优缺点,最后探讨了该领域未来的研究方向。  相似文献   

14.
随着地铁乘客的大量增加,实时准确地监测地铁站内客流量对于保证乘客安全具有重要意义。针对地铁场景复杂、行人目标小等特点,该文提出了多尺度加权特征融合(MWF)网络,实现地铁客流量的精准实时监测。在数据预处理阶段,该文提出过采样目标增强算法,对小目标占比不足的图片进行拼接处理,增加小目标在训练时的迭代频率。其次,在单镜头多核检测器(SSD)网络基础上添加了基于VGG16网络的特征提取层,将不同尺度的特征层以不同方式进行加权融合,并选出最优的特征融合方式。最终,结合小目标过采样增强算法,得到多尺度加权特征融合模型。实验证明,该方法与SSD网络相比,在保证实时性的同时,检测精度提升了5.82%。  相似文献   

15.
随着地铁乘客的大量增加,实时准确地监测地铁站内客流量对于保证乘客安全具有重要意义.针对地铁场景复杂、行人目标小等特点,该文提出了多尺度加权特征融合(MWF)网络,实现地铁客流量的精准实时监测.在数据预处理阶段,该文提出过采样目标增强算法,对小目标占比不足的图片进行拼接处理,增加小目标在训练时的迭代频率.其次,在单镜头多核检测器(SSD)网络基础上添加了基于VGG16网络的特征提取层,将不同尺度的特征层以不同方式进行加权融合,并选出最优的特征融合方式.最终,结合小目标过采样增强算法,得到多尺度加权特征融合模型.实验证明,该方法与SSD网络相比,在保证实时性的同时,检测精度提升了5.82%.  相似文献   

16.
王芋人  武德安 《激光杂志》2021,42(10):42-46
当前目标检测器设计锚框的比例和面积,适合于大中型目标,对小目标的适应性较弱,先验锚框和标注框的交并比小,导致检测精较低,检测速度较慢。为改善这个问题,首先证明了当锚框和标注框面积和比例相同时,交并比最大,然后用GMM算法分别对小目标数据集中的标注框的宽高比和面积进行聚类,在FasterRCNN模型中设计出对标注框适应性更强的锚框。该方法在小目标数据集上验证了效果,与优化之前的Faster-RCNN模型进行测试对比,平均预测准确率m AP相比提高了3.8%,检测速度FPS是优化前的7.1倍。  相似文献   

17.
毋立芳  汪敏贵  简萌  刘旭 《信号处理》2020,36(9):1399-1406
体育视频包含大量不同类型的人体,其中运动员的行为与比赛进程和视频内容直接相关,因此运动员检 测是体育视频分析的关键环节。现有人体目标检测算法在通用人体检测任务上取得了良好的性能,但是无法有效区分运动员和非运动员。专门训练一个运动员检测模型需要标注大量的运动员位置,成本较高。本文提出了一种基于多示例学习的人体目标检测方法。在通用人体检测的基础上,引入多示例学习模块,基于图像级标注,通过弱监督方式自动学习获取特征映射矩阵,将人体特征映射到运动员特征空间,最后通过度量人体特征与运动员特征之间的相似度,实现运动员与非运动员的区分。对比实验结果表明,本文方法充分利用通用人体检测框架,以 极小的标注数据量达到了专门训练运动员检测模型的精度。   相似文献   

18.
深度学习模型中的特征金字塔网络(Feature Pyramid Network,FPN)常被用作合成孔径雷达(Synthetic Aperture Radar,SAR)图像中多目标船舶的检测。针对复杂场景下多目标船舶检测问题,提出了一种基于改进锚点框的FPN模型。首先将特征金字塔模型嵌入传统的RPN(Region Proposal Network)并映射成新的特征空间用于目标检测,然后利用基于形状相似度距离(Shape Similar Distance,SSD)度量的Kmeans聚类算法优化FPN的初始锚点框,并使用SAR船舶数据集测试。实验结果表明,所提算法目标检测精确率达到98.62%,在复杂场景下与YOLO、Faster RCNN、FPN based on VGG/ResNet等模型进行对比,模型准确率提高,整体性能更好。  相似文献   

19.
现有基于深度学习的目标检测算法在图像的目标检测过程中存在物体视角的多样性、目标本身形变、检测物体受遮挡、光照性以及小目标检测等问题。为了解决这些问题,本文将对比学习思想引入到SSD(Single Shot MutiBox Detectior)目标检测网络中,对原有的SSD算法进行改进。首先,通过采用图像截块的方式随机截取样本图片中的目标图片与背景图片,将目标图像块与背景图像块输入到对比学习网络中提取图片特征进行对比损失计算。随后,使用监督学习的方法对SSD网络进行训练,将对比损失传入到SSD网络中与SSD损失值加权求和反馈给SSD网络,进行网络参数的优化。由于在目标检测网络中加入了对比学习的思想,提高了背景和目标在特征空间中的区分度。因此所提出的算法能显著提高SSD网络对于目标检测的精度,并在可见光和热红外图像中均取得了令人满意的检测效果。在PASCAL VOC2012数据集实验中,AP50值提升了0.3%,在LLVIP数据集实验中,AP50值提升了0.2%。  相似文献   

20.
基于等价伪译词模型的无指导译文消歧研究   总被引:2,自引:1,他引:1  
该文提出了一种基于等价伪译词进行无指导译文消歧的方法。该方法利用源语言岐义词不同语义下目标语译文的单义同义词集合,定义并构造等价伪译词。利用等价伪译词从目标语语料中自动获取大量已标注语义的目标语实例。由这些实例得到的目标语语义知识,可直接形成该等价伪译词的语义分类器。利用Hownet可将含目标歧义词的英语实例映射成汉语词集合,然后利用这个语义分类器进行译文消歧。在国际标准语义评测集上进行的测试表明,该方法优于其余两种自动获取已标注语料的系统,且与Senseval-2 ELS上可比较的最好无指导系统的性能相当。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号