共查询到18条相似文献,搜索用时 70 毫秒
1.
随着计算机硬件和人工智能技术的发展,强监督目标检测算法已经取得了很大的成果。然而,强监督目标检测算法需要在大规模、标注精度高的数据集上进行训练。但在某些特定领域,上述条件要求过于苛刻。例如,军事上常用的迷彩伪装目标的图像数据集就比公共数据集更难获得且标注难度更大。因此,采用对数据集要求更低的弱监督目标检测算法来实现迷彩伪装目标的检测任务。由于图像中迷彩伪装目标与背景融合度较大,导致原始浅层特征感知伪监督目标定位(Shallow feature-aware Pseudo supervised Object Localization, SPOL)算法的检测精度相对较低。本文的核心是在SPOL算法的基础上融合注意力机制,通过加入注意力模块,让模型更加关注迷彩伪装目标的区域,以此来提高迷彩伪装目标的检测精度。 相似文献
2.
3.
针对道路检测目标小、模型特征融合不充分等问题,提出了一种基于注意力机制和多尺度特征融合的道路目标检测算法MFFDM。该算法将Resnext50网络与注意力模块进行融合形成新的主干特征提取网络;其次,新增具有空间位置信息的底层检测层来匹配对小物体的检测;另外,利用反卷积模块及特征纹理提取模块设计多尺度特征融合网络DEFTFN。实验表明,与FCOS算法相比,该算法在KITTI数据集上的平均精度提升了9.3%,对道路行人目标的检测精度提升明显,提升幅度达14.6%。 相似文献
4.
作为一个多任务的学习过程,目标检测相较于分类网络需要更好的特征.基于多尺度特征对不同尺度的目标进行预测的检测器性能已经大大超过了基于单一尺度特征的检测器.同时,特征金字塔结构被用于构建所有尺度的高级语义特征图,从而进一步提高了检测器的性能.但是,这样的特征图没有充分考虑到上下文信息对语义的补充作用.在SSD基准网络的基... 相似文献
5.
针对传统的SSD目标检测算法在进行多尺度目标检测时,存在特征图有效信息弱和困难目标漏检率大等问题,提出一种改进的SSD目标检测算法.首先,在网络特征图输出处引入即插即用的轻量级注意力机制,通过不降维、局部跨通道交互以及核大小自适应选择等操作,在保持网络原始计算量的同时有效突出特征图中关键信息.该模块有利于增强背景信息和... 相似文献
6.
现有基于微调的二阶段小样本目标检测方法对新类特征不敏感,易将新类别误判成与它相似度高的基类,影响模型的检测性能。针对上述问题,提出一种融合多尺度和注意力机制的小样本目标检测(MA-FSOD)算法。首先在骨干网络使用分组卷积和大卷积核提取更具类别区分性的特征,并加入卷积注意力模块(CBAM)实现特征的自适应增强;再通过改进的金字塔网络实现多尺度的特征融合,使候选框生成网络(RPN)可以准确找到感兴趣区域(RoI),从多个尺度向分类头提供更丰富的高质量正样本;最后在微调阶段采用余弦分类头进行分类,降低类内方差。在PASCAL-VOC 2007/2012数据集上与基于候选框编码对比损失的小样本目标检测(FSCE)算法相比,MA-FSOD算法对新类的AP50提升了5.6个百分点;在更具挑战性的MSCOCO数据集中,与Meta-Faster-RCNN相比,10-shot和30-shot对应的AP则分别提升了0.1个百分点和1.6个百分点。实验结果表明,相较于一些主流的小样本目标检测算法,MA-FSOD算法能更有效地缓解误分类问题,实现更高精度的小样本目标检测。 相似文献
7.
8.
伪装目标检测是一项在复杂场景中定位和识别伪装目标的任务. 目前基于深度神经网络的方法已初步运用, 但在复杂场景下遇到干扰时, 许多方法无法充分利用目标的多级特征来提取丰富的语义信息, 仅依靠固定尺寸特征识别伪装目标. 为解决这一问题, 本文提出了一种基于多尺度特征融合交互的伪装目标检测网络. 该网络包含两个创新设计: 多尺度特征感知模块和双阶段邻级交互模块. 前者旨在通过结合多尺度特征的方式充分捕获复杂场景中丰富的局部-全局场景对比信息. 后者则是整合来自相邻层的特征以利用跨层相关性将有价值的上下文信息从编码器传输到解码器网络. 本文在CHAMELEON、CAMO-Test、COD10K-Test这3个公共数据集上对提出的方法进行了评测并与当前的主流方法对比. 实验结果表明, 本文方法的性能超越了当前的主流方法, 在各项指标上达到了优异的性能水平. 相似文献
9.
针对现有算法的多尺度特征融合效果不理想和全局信息利用不充分的问题,提出一种基于多尺度优化和全局注意力的显著目标检测模型.利用特征增强模块对从骨干网络VGG-16中提取出来的粗糙特征进行增强,提升特征的显著性表达能力,对不同层次特征融合得到高层级和低层级特征;设计全局注意力模块,利用空洞空间卷积池化金字塔ASPP模块提取... 相似文献
10.
目的 在计算机断层扫描(computed tomography,CT)影像中对骨组织部位进行自动分析和检测,对于骨科疾病的早期诊断具有重要意义,然而基于人工分析诊断的方法存在效率较低、诊断的准确性和客观一致性无法保证等问题。为此,本文研究构建一个骨组织病变检测的级联神经网络模型,以期为骨科医生的诊断提供支持。方法 在影像预处理阶段使用改进的增强方法对CT影像进行对比度增强并获取影像中的人体有效部位;根据骨骼组织CT值(Hounsfield unit,HU)的分布范围进行阈值分割,得到大致的骨组织区域;以级联目标检测模型为研究基线,结合注意力机制与可变形卷积增加特征图的全局上下文的相关性,以适应形态多变的骨病灶;通过特征融合模块促进不同尺度特征信息之间的融合,并在多个尺度特征图上分别进行骨组织病变训练和预测。结果 在DeepLesion数据集上进行实验,实验结果表明,本文网络对骨病变检测的召回率(recall)、准确率(precision)、F1分数、平均精度(average precision,AP)分别为0.85、0.613、0.712以及0.816;较对照组中性能最优的通用CT病变检测网络对骨病变检测的召回率提升0.15。结论 本文提出的网络模型对CT骨组织病变具有较好的检测效果,能够对骨组织病变判别诊断提供辅助支持,提高诊断效率,降低漏诊风险。 相似文献
11.
为提升深度卷积神经网络模型检测肺结节的效果,提出一种基于注意力机制的肺结节检测算法。通过空间和通道注意力两种不同粒度与层次的注意力因子增强,提升肺结节检测网络生成的特征映射的质量,达到提升模型性能的目的。在LUNA16公开肺部CT图像数据集上进行大量相关实验,验证了模型的可行性和算法的有效性。 相似文献
12.
新冠疫情期间正确佩戴口罩可以有效防止病毒的传播,针对公共场所存在的人员密集、检测目
标较小等加大检测难度的问题,提出一种以 YOLOv5s 模型为基础并引入注意力机制融合多尺度注意力权重的
口罩佩戴检测算法。在 YOLOv5s 模型的骨干网络中分别引入 4 种注意力机制,抑制无关信息,增强特征图的
信息表达能力,提高模型对小尺度目标的检测能力。实验结果表明,引入 CBAM 模块后较原网络 mAP 值提升
了 6.9 个百分点,在 4 种注意力机制中提升幅度最明显,而引入 NAM 模块后在损失少量 mAP 的情况下使参
数量最少,最后通过对比实验选用 GIoU 损失函数计算边界框回归损失,进一步提升定位精度,最终结果较
原网络 mAP 值提升了 8.5 个百分点。改进模型在不同场景下的检测结果证明了该算法对小目标检测的准确
率和实用性。 相似文献
13.
对于低照度图像增强过程中,因图像内容重叠且部分区域亮度差异较大导致的图像细节丢失的问题,提出一个注意力机制下的多阶段低照度图像增强网络。第一阶段利用改进的多尺度融合模块对图像进行初步增强;第二阶段利用第一阶段增强后的图像信息与本阶段的输入进行级联,并将其结果作为该阶段多尺度融合模块的输入;第三阶段利用第二阶段增强后的图像信息与该阶段的输入级联,并将其结果作为该阶段多尺度融合模块的输入。这样利用多阶段的方式完成自适应的亮度提升和细节的保留。在公开数据集LOL和SICE上的实验结果表明,相较于MSR算法、灰度直方图均衡化(HE)算法和RetinexNet等算法和网络,所提网络的峰值信噪比(PSNR)的数值提高了11.0%~28.9%,结构相似性(SSIM)的数值提高了6.8%~46.5%。所提网络利用多阶段和注意力机制实现低照度图像增强,有效解决了图像内容重叠和亮度差异大的问题,得到的图像细节更丰富,纹理更清晰,主观辨识度更高。 相似文献
14.
万思宇 《计算机工程与科学》2020,42(1):98-102
3D车辆检测是自动驾驶场景中的一个关键问题,涉及到3D目标检测与目标分类。目前的3D检测与分类网络对于所有输入的点云数据一视同仁,但在实际检测过程中,点云中不同点对于检测的重要程度可能并不相同。为了得到更好的检测结果,通过引入注意力机制来得到不同点的特征的权重,从而在回归时让部分点的特征得到更多的重视。实验表明,该算法在保证实时效率的前提下,与现有算法相比,具有更高的准确度。 相似文献
15.
基于视觉注意机制的彩色图像显著性区域提取 总被引:2,自引:0,他引:2
图像显著性区域提取是计算机视觉处理的重要步骤。结合人类视觉心理、生理模型, 提出一种基于视觉注意机制的彩色图像显著性区域提取模型。通过改进的分水岭算法对彩色图像进行预分割, 从而将原图像分成若干子区域, 在此基础上运用提出的区域化空间注意力模型对各个子区域进行显著图计算, 得到最终的显著性区域提取结果。实验结果表明, 提出的显著性区域提取算法可以很好地从彩色图像中得到与视觉注意机制相一致的结果, 且满足实时性要求, 与传统方法相比, 算法提取的区域更完整、更准确。 相似文献
16.
迷彩伪装技术能有效降低目标的视觉显著度,对迷彩目标检测任务造成巨大的挑战.在RetinaNet检测框架的基础上,针对迷彩目标特性嵌入了空间注意力和通道注意力模块,并基于定位置信得分构建了新的预测框过滤算法,有效实现了对迷彩伪装人员的检测.在扩展后的伪装人员数据集上的实验表明,该模型将检测精度提升了8.7个百分点,达到了... 相似文献
17.
针对现有行人属性识别方法模型复杂,识别性能较低的问题,提出一种端到端的行人属性识别方法。构建注意力机制修正网络,在主干网络的不同卷积层后添加注意力分支,以提取注意力特征关注属性相关空域;提出一种注意力机制辅助训练方法,将注意力分支与主网络在预测级进行损失融合,通过梯度反向传播修正主网络权重,实现主网络的有效训练;在预测阶段,利用权重修正后的主网络实现属性识别。在RAP数据集上的实验结果表明,提出方法在没有额外辅助信息、不增加主网络体积和计算量的情况下,提升了行人属性识别性能。 相似文献