共查询到20条相似文献,搜索用时 15 毫秒
1.
针对传统显著性目标检测方法在检测不同尺度的多个显著性目标方面的不足,提出了一种多尺度特征深度复用的显著性目标检测算法,网络模型由垂直堆叠的双向密集特征聚合模块和水平堆叠的多分辨率语义互补模块组成。首先,双向密集特征聚合模块基于ResNet骨干网络提取不同分辨率语义特征;然后,依次在top-down和bottom-up两条通路上进行自适应融合,以获取不同层次多尺度表征特征;最后,通过多分辨率语义互补模块对两个相邻层次的多尺度特征进行融合,以消除不同层次上特征之间的相互串扰来增强预测结果的一致性。在五个基准数据集上进行的实验结果表明,该方法在Fmax、Sm、MAE最高能达到0.939、0.921、0.028,且检测速率可达74.6 fps,与其他对比算法相比有着更好的检测性能。 相似文献
2.
显著性目标检测旨在获取图像中的视觉显著目标,是计算机视觉领域的重要研究内容。相比传统手工提取特征的方法,基于全卷积神经网络的方法已在这一领域展现出强大优势。然而,显著性目标检测仍然存在一些问题。复杂场景下,背景中可能存在一些易被误判为显著目标的噪声,导致检测性能下降。另外,当显著目标轮廓较为复杂时,边界像素点的检测也变得较为困难。为了解决这些问题,提出一种坐标注意力特征金字塔的显著性目标检测算法。采用基于特征金字塔的网络结构,提取显著目标中不同层次的特征,并设计特征细化模块以实现不同层次特征的有效融合。为解决背景误判问题,采用坐标注意力模块,增大显著性区域权重的同时,抑制背景噪声。对于边界复杂问题,设计边界感知损失函数并结合多层次监督方法,帮助网络更加关注边界像素点,生成边界清晰的高质量显著图。在五个常用显著性目标检测数据集上的实验结果表明,该算法在五种评价指标上均取得较优的检测结果。 相似文献
3.
基于特征金字塔网络的目标检测算法没有充分考虑不同目标间的尺度差异以及跨层特征融合过程中高频信息损失问题,使网络无法充分融合全局多尺度信息,导致检测效果不佳.针对这些问题,提出了尺度增强特征金字塔网络.该方法对特征金字塔网络的侧向连接和跨层特征融合方式进行了改进,设计具有动态感受野的多尺度卷积组作为侧向连接来充分提取每一个目标的特征信息,引入基于注意力机制的高频信息增强模块来促进高层特征与底层特征融合.基于MS COCO数据集的实验结果表明,该方法能有效提高各尺度目标的检测精度,整体性能优于现有方法. 相似文献
4.
近年来,基于深度学习的显著性目标检测(SOD)取得了很大进展。目前主流的基于深度学习方法的RGB显著性目标检测,忽略了编码器和解码器之间信息交换,以及不同层级编码器对最终预测图的贡献差异。本文设计了一种基于多尺度特征解码的RGB显著性目标检测网络,通过在编码和解码模块之间增加精炼过渡层和注意力机制,对编码器输出特征进行打磨,以还原更详细的显著性信息。此外,在网络的顶部增加感受野增强模块,以定位不同尺度信息,增强深层特征的全局语义信息,使预测结果更准确。在主流的6个数据集上的测试结果显示,本文的方法优于其他同类算法。 相似文献
5.
由于忽略了对多尺度特征的提取,以及不同层次特征之间的差异,显著性目标检测仍然存在预测结构不完整、细节丢失的问题。为了解决这些问题,提出了一个新的显著性检测模型M3Net。该网络主要由多尺度特征自适应融合模块和循环反馈聚合模块组成。多尺度特征自适应融合模块旨在自适应地捕捉和聚合不同层次的多尺度特征。循环反馈聚合模块组成可以在迭代过程中对不同层次的特征聚合的同时,有效地防止特征的稀释。在五个基准数据集上的实验结果表明,该网络在Fβ、Em、MAE三种评价指标上优于十种现有网络。在DUT-OMRON数据集上,Fβ指标比排名第二的显著性检测模型提高了0.4%,Em指标提高了0.3%;在ECSSD数据集上,Fβ指标比排名第二的显著性检测模型提高了0.2%,Em指标提高了0.3%,同时网络还具有优秀的速度表现。 相似文献
6.
针对显著性目标检测算法中全局和局部信息难以联合表征和目标边界难以细化的问题,提出了一种多尺度Transformer与层次化边界引导的显著性目标检测算法。首先,构建Transformer模型提取全局信息,同时通过自注意力机制获取有判别性的浅层局部特征,对全局和局部信息进行联合表征。然后,引入Tokens-to-Token方法提取多尺度特征,使模型实现尺度变换平滑的编解码。进一步,提出了一种层次化的边界学习策略,引导模型在每个解码特征层提取精细化的显著性目标边界特征,提升显著性目标边界的预测准确性。实验结果表明,提出的算法在四个公开显著性目标检测数据集上均优于八种主流的显著性目标检测算法,并且通过消融实验验证了提出模型和边界学习策略的有效性。 相似文献
7.
传统的显著性检测方法大多在单一的尺度上分辨感兴趣的目标和背景,无法有效地获取多分辨率下的局部细节信息,为此提出多尺度反卷积的深度学习网络模型。首先,在多尺度下对各层特征及各层对比特征进行反卷积,充分利用反卷积层中的卷积核对输入物体的形状进行重建,在多种分辨率特征图上利用反卷积网络来学习细节特征,减少信息的丢失,以此保持不同尺寸特征图的细节信息;然后,将各尺度下的反卷积特征进行融合,形成多层次局部信息;最后,与VGG16网络提取的全局信息融合后,计算各个像素的显著值,从而获得最终的显著性结果。实验结果表明,多尺度反卷积结构表现出较优的性能,与传统方法相比,可以相对增强突出物体与背景之间的对比,保持细节方面的特征;与最新深度学习的方法相比,可以检测出相对清晰准确的区域,一定程度上减少了信息的损失,还原出了更多的细节,能够有效地获取各种分辨率下的显著性目标,而且各反卷积层的独立性也显著提高了本文算法的运算速度。 相似文献
8.
9.
显著性目标检测是获取图像中视觉显著目标的任务,它是计算机视觉及相关研究领域的重要内容。当前在复杂的自然场景下基于深度学习的算法依然存在特征学习不足和检测错误率较高的问题,因此提出一种新颖的基于多特征融合的显著性目标检测算法。以HDHF(hybrid deep and handcrafted feature)模型的预测显著图作为特征,融合全局像素的深度特征。此外,利用显著性提名获取候选目标的位置,并在各候选目标中添加中心先验。在全卷积神经网络中,利用前向传播算法最终预测得到像素级的显著性目标。在四个包含多个显著性目标和复杂背景的图像数据集上进行验证,实验结果表明,该算法有效地提高了复杂场景下显著性目标的检测精度,尤其是在背景复杂的图像上具有较优的检测效果。 相似文献
10.
目的 自然场景图像中,特征提取的质量好坏是决定目标检测性能高低的关键因素。大多数检测算法都是利用卷积神经网络(CNN)强大的学习能力来获得目标的先验知识,并根据这些知识进行目标检测。卷积神经网络的低层次特征缺乏特征的代表性,而高层次的特征则对小尺度目标的监测能力弱。方法 利用原始SSD(single shot multiBox detector)网络提取特征图,通过1×1卷积层将提取的特征图统一为256维;通过反卷积操作增加自顶向下特征图的空间分辨率;通过对应元素相加的操作,将两个方向的特征图进行融合。将融合后的特征图采用3×3的卷积核进行卷积操作,减小特征图融合后的混叠效应。根据以上步骤构建具有较强语义信息的特征图,同时保留原有特征图的细节信息;对预测框进行聚合,利用非极大抑制(NMS)实现最终的检测效果。结果 在PASCAL VOC 2007和PASCAL VOC 2012数据集上进行实验测试,该模型的mAP(mean average precision)为78.9%和76.7%,相对于经典的SSD算法,分别提高了1.4%和0.9%;此外,本文方法在检测小尺度目标时相较于经典SSD模型mAP提升了8.3%。结论 提出了一种多尺度特征图融合的目标检测算法,以自顶向下的方式扩展了语义信息,构造了高强度语义特征图用于实现精确目标检测。 相似文献
11.
基于深度学习的特征金字塔网络(Feature Pyramid Networks, FPN)仅采用一次上采样与相邻层特征融合的方法,存在浅层网络与深层网络特征关联性不强,多层网络特征融合不充分的问题,影响多尺度目标检测精度。对此,将主干网络中提取的特征进行由深到浅的叠加融合,并对特征金字塔中得到的特征进行补充叠加融合。此外,为进一步提高检测器对目标特征的识别能力,对每次叠加融合后得到的特征通过non-local网络进行特征增强。以PASCAL VOC为数据集的目标检测实验结果表明,所提目标检测模型对数据集中所有类别目标的平均检测精度(mean Average Precision, mAP)为80.6%,对行人类别的检测精度(Average Precision, AP)为81.3%,较FPN网络分别提高了2.4%和2.8%,有效提高了多尺度目标检测精度。 相似文献
12.
针对深度学习网络在特征提取过程中运用上采样操作而致使细节纹理等高频特征缺失的问题,提出一种金字塔频率特征融合目标检测网络.网络由3个深度学习金字塔网络构成,输入图像经初级金字塔提取深度特征后,分别通过高频、低频增强金字塔形成不同的频率特征,利用特征融合来凸显深度学习网络在信息逐层传递过程中对细节信息的保护能力,提高目标... 相似文献
13.
目的 多层特征对于显著性检测具有重要作用,多层特征的提取和融合是显著性检测研究的重要方向之一。针对现有的多层特征提取中忽略了特征融合与传递、对背景干扰信息敏感等问题,本文基于特征金字塔网络和注意力机制提出一种结合空间注意力的多层特征融合显著性检测模型,该模型用简单的网络结构较好地实现了多层特征的融合与传递。方法 为了提高特征融合质量,设计了多层次的特征融合模块,通过不同尺度的池化和卷积优化高层特征和低层特征的融合与传递过程。为了减少低层特征中的背景等噪声干扰,设计了空间注意力模块,利用不同尺度的池化和卷积从高层特征获得空间注意力图,通过注意力图为低层特征补充全局语义信息,突出低层特征的前景并抑制背景干扰。结果 本文在DUTS,DUT-OMRON(Dalian University of Technology and OMRON Corporation),HKU-IS和ECSSD(extended complex scene saliency dataset) 4个公开数据集上对比了9种相关的主流显著性检测方法,在DUTS-test数据集中相对于性能第2的模型,本文方法的最大F值(MaxF)提高了1.04%,平均绝对误差(mean absolute error,MAE)下降了4.35%,准确率—召回率(precision-recall,PR)曲线、结构性度量(S-measure)等评价指标也均优于对比方法,得到的显著图更接近真值图,同时模型也有着不错的速度表现。结论 本文用简单的网络结构较好地实现了多层次特征的融合,特征融合模块提高了特征融合与传递质量,空间注意力模块实现了有效的特征选择,突出了显著区域、减少了背景噪声的干扰。大量的实验表明了模型的综合性能以及各个模块的有效性。 相似文献
14.
遥感图像中的目标具有密集性、多尺度和多角度等特性,这使得遥感图像多类别目标检测成为一项具有挑战性的课题.因此,文中提出了一种新的端到端的遥感图像目标检测框架.该框架通过提取显著性特征和不同卷积通道之间的相互关系来增强目标信息,抑制非目标信息,从而提高特征的表示能力.同时,在不增加模型参数的情况下,在卷积模块中添加多尺度... 相似文献
15.
伪装目标检测是一项在复杂场景中定位和识别伪装目标的任务. 目前基于深度神经网络的方法已初步运用, 但在复杂场景下遇到干扰时, 许多方法无法充分利用目标的多级特征来提取丰富的语义信息, 仅依靠固定尺寸特征识别伪装目标. 为解决这一问题, 本文提出了一种基于多尺度特征融合交互的伪装目标检测网络. 该网络包含两个创新设计: 多尺度特征感知模块和双阶段邻级交互模块. 前者旨在通过结合多尺度特征的方式充分捕获复杂场景中丰富的局部-全局场景对比信息. 后者则是整合来自相邻层的特征以利用跨层相关性将有价值的上下文信息从编码器传输到解码器网络. 本文在CHAMELEON、CAMO-Test、COD10K-Test这3个公共数据集上对提出的方法进行了评测并与当前的主流方法对比. 实验结果表明, 本文方法的性能超越了当前的主流方法, 在各项指标上达到了优异的性能水平. 相似文献
16.
《计算机科学与探索》2019,(6):1049-1061
提出了一种改进的多尺度卷积特征目标检测方法,用以提高SSD(single shot multibox detector)模型对中目标和小目标的检测精确度。该方法先对SSD模型低层特征层采用区域放大提取的方法以提高对小目标的检测能力,再对高层特征层进行特征提取以改善中目标的检测效果。最后,利用SSD模型中原有的多尺度卷积检测方法,将改进的多层特征检测结果进行融合,并通过参数再训练以获得最终改进的SSD模型。实验结果表明,该方法在MS COCO数据集上对中目标和小目标的测试精确度分别为75.1%和40.5%,相比于原有SSD模型分别提升16.3%和23.1%。 相似文献
17.
18.
伪装目标检测(COD)能够在复杂环境下探测出与背景相似度极高的伪装目标,在军事侦查和工业检测等领域具有重要的应用价值。针对现有伪装目标检测方法对区域级特征信息利用率低的问题,提出一种基于区域特征强化的多尺度伪装目标检测网络(RFE-Net)方法,实现可见光条件下伪装目标的准确探测。RFE-Net主要包含弱语义特征增强模块、空间信息交互模块和上下文信息聚合模块。首先弱语义特征增强模块引入了条状池化和非对称卷积,通过优化网络的感受野来动态调整搜索区域,从而加强长距离弱语义特征间的联系;然后将级联的U型块结构组合为空间信息交互模块,消除错误预测样本的干扰;最后设计上下文信息聚合模块,通过充分融合深层语义信息和浅层细粒度信息以精细化处理目标边缘细节,从而提升预测准确度。实验结果表明,所提方法能够加强目标内部的弱语义关联,提高目标与背景的区分度,在最大测试集NC4K上的结构性度量、增强对准度量、加权F1值和平均绝对误差4个指标上均取得最优值,其中结构性度量和平均绝对误差高于第2名方法1.1%和7.7%。 相似文献
19.
20.
针对目标检测中分类和定位子任务分别需要大感受野和高分辨率,难以在这两个相互矛盾的需求间取得平衡的问题,提出一种用于目标检测的基于注意力机制的特征金字塔网络算法。该算法能整合多个不同感受野来获取更丰富的语义信息,以一种更关注不同特征图重要性的方式融合多尺度特征图,并在注意力机制引导下进一步精练复杂融合后的特征图。首先,通过多尺度的空洞卷积获取多尺度感受野,在保留分辨率的同时增强语义信息;其次,通过多级特征融合(MLF)方式将多个不同尺度的特征图通过上采样或池化操作变为相同分辨率后融合;最后,利用注意力引导的特征精练模块(AFRM)对融合后的特征图作精练处理,丰富语义信息并消除融合带来的混叠效应。将所提特征金字塔替换Faster R-CNN中的特征金字塔网络(FPN)后在MS COCO 2017数据集上进行实验,结果表明当骨干网络为深度50和101的残差网络(ResNet)时,平均精度(AP)分别达到了39.2%和41.0%,与使用原FPN的Faster R-CNN相比,分别提高了1.4和1.0个百分点。可见,所提特征金字塔网络算法能替代原FPN,更好地应用在目标检测场景中。 相似文献