首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对X光行李图像安全检测过程中存在物品高度重叠遮挡及复杂背景干扰等问题,提出了一种融合注意力机制、数据增强策略与加权边框融合算法的改进YOLOv5网络模型用于X光违禁品检测。模型在Neck部分引入卷积注意力模块加强网络对违禁品深层重要特征的提取,抑制背景干扰;训练阶段采用Mixup数据增强策略模拟带有高度重叠及遮挡物品的检测场景,加强模型复杂样本的学习能力;测试阶段采用加权边框融合算法对冗余预测框进行优化,提高模型精准预测能力。所提模型在3个大型复杂数据集SIXray、HiXray、OPIXray进行了测试,平均精度均值分别达到了89.6%、83.1%和91.6%。结果表明:所提模型能够有效提高YOLOv5检测复杂违禁品的能力,与现有诸多先进算法相比,具有较高的准确率和稳健性。  相似文献   

2.
安检是保障人民生命财产安全的第一道防线,智能安检是安检行业未来发展的必然趋势。X光安检图像存在背景复杂、违禁品尺度多样以及相互遮挡现象,导致传统的目标检测算法无法获得满意的效果。本文在一阶段目标检测网络SSD框架的基础上,提出了适用于X光安检图像多尺度违禁品检测网络——非对称卷积多视野神经网络ACMNet(Asymmetrical Convolution Multi-View Neural Network)。检测网络增加了三个模块:小卷积非对称模块(Asymmetrical Tiny Convolution Module,ATM)、空洞多视野卷积模块(Dilated Convolution Multi-View Module,DCM)、多尺度特征图融合策略(Fusion strategy of multi-scale feature map,MF)。 ATM学习到的细节特征有助于小尺度违禁品的识别;DCM通过提供局部与全局之间的上下文特征信息来解决遮挡问题;MF则是通过融合高、低层特征图以提高模型在背景干扰情况下违禁品的检测精度。在仿真实验中,采用X光安检领域公开的数据集与自建的数据集,ACMNet在精确度上取得了令人满意的效果。   相似文献   

3.
针对无人机图像中由于目标微小且相互遮挡、特征信息少导致检测精度低的问题,提出一种基于改进YOLOv7的无人机图像目标检测算法。在颈部和检测头中加入了坐标卷积,能更好地感受特征图中目标的位置信息;增加P2检测层,减少小目标特征丢失、提高小目标检测能力;提出多信息流融合注意力机制——Spatial and Channel Attention Mechanism(SCA),动态调整注意力对空间信息流和语义信息流的关注,获得更丰富的特征信息以提高捕获目标的能力;更换损失函数为SIoU,加快模型收敛速度。在公开数据集VisDrone2019上进行对比实验,改进后算法的mAP50值相比YOLOv7提高了4%,达到了52.4%,FPS为37,消融实验验证了每个模块均提升了检测精度。实验表明,改进后的算法能较好地检测无人机图像中的目标。  相似文献   

4.
针对阿尔兹海默症、病变(如脑肿瘤)和健康老化的3类脑部CT图像分类问题,本文提出了一种改进的ResNet-10卷积神经网络模型.该模型在网络的残差映射结构中加入残差混合注意力模块,解决了原模型提取的特征分辨性弱的问题,精确捕捉了脑部组织在CT图像中的位置和内容信息;此外,本文设计了全局平均池化层,简化了模型的复杂度,并...  相似文献   

5.
针对遥感图像水体分割任务,提出了一种多尺度融合注意力模块改进的UNet网络——A-MSFAM-UNet,该方法在GF-2遥感图像水体分割任务中实现了端到端高分辨率遥感图像水体分割。首先,针对以往注意力模块全局池化操作带来的局部信息不敏感问题,设计了一种多尺度融合注意力模块(MSFAM),该模块使用点卷积融合通道全局信息、深度可分离卷积弥补全局池化造成的信息丢失。MSFAM用于UNet跳跃连接后的特征融合部分重新分配特征点权重以提高特征融合效率,增强网络获取不同尺度信息的能力。其次,空洞卷积用于VGG16主干网络扩展感受野,在不损失分辨率的情况下聚合全局信息。结果表明,A-MSFAM-UNet优于其他通道注意力(SENet、ECANet)改进的UNet,在GF-2水体分割数据集上平均交并比(MIoU)、平均像素精度(MPA)和准确率(Acc)分别达到了96.02%、97.98%和99.26%。  相似文献   

6.
基于行车图像的目标检测方法为感知周围的道路环境提供了便宜、有效的解决方案,但同时也对检测效果和检测速度提出了较高要求.本文针对基于深度学习的一阶段目标检测算法YOLOv3展开研究,结合自注意力机制,在其网络深层结构中嵌入高斯掩码自注意力模块,缓解卷积操作感受野不足的缺陷,以捕捉更多的全局信息,提高算法的检测效果.实验结...  相似文献   

7.
针对普通卷积神经网络在遥感图像分割中小目标识别度不高、分割精度低的问题,提出了一种结合特征图切分模块和注意力机制模块的遥感影像分割网络AFSM-Net。首先在编码阶段引入特征图切分模块,对每个切分的特征图进行放大,通过参数共享的方式进行特征提取;然后,将提取的特征与网络原输出图像进行融合;最后,在网络模型中引入注意力机制模块,使其更关注图像中有效的特征信息,忽略无关的背景信息,从而提高模型对小目标物体的特征提取能力。实验结果表明,所提方法的平均交并比达到86.42%,相比于DeepLabV3+模型提升了3.94个百分点。所提方法充分考虑图像分割中小目标的关注度,提升了遥感图像的分割精度。  相似文献   

8.
针对低信噪比与复杂任务场景下,YOLOv8模型对红外遮挡目标和弱小目标检测能力不足的问题,提出了改进的DCS-YOLOv8模型(DCN_C2f-CA-SIoU-YOLOv8)的目标检测方法。以YOLOv8框架为基础,主干网络构建了基于可变形卷积的轻量级DCN_C2f(Deformable Convolution Network)模块,自适应调整网络的视觉感受野,提高目标多尺度特征表示能力。特征融合网络引入基于坐标注意力机制CA(Coordinate Attention)的模块,通过捕捉多目标空间位置依赖关系,提高目标的定位准确性。改进基于SIoU(Scylla IoU)的位置回归损失函数,实现预测框与真实框之间的相对位移方向匹配,加快模型收敛速度并提升检测与定位精度。实验结果表明,相较于YOLOv8-nsmlx系列模型,DCS-YOLOv8在FLIR、OTCBVS与VEDAI测试集上平均精度均值m AP@0.5平均提高了6.8%、0.6%、4.0%,分别达到86.5%、99.0%与75.6%。同时,模型的推理速度满足红外目标检测任务的实时性要求。  相似文献   

9.
由于金属表面缺陷图像的特性,有效精确分割是图像处理任务中的一大挑战.为了获得缺陷的类型、大小及位置信息,本文提出一种融合注意力机制的金属缺陷图像分割网络.该网络分为两条路径,语义信息路径主要由残差块构成的卷积网络获得特征图,采样过程中分步融合注意力机制以增强特征与背景对比度.旁路路径设计注意力机制模块获得位置信息的权重...  相似文献   

10.
为了有效地识别学生在线课堂行为,提出了一种融合全局注意力机制和时空图卷积 网络的人体骨架行为识别模型。首先在时空图卷积网络的空间图卷积网络和时间卷积网络之 间加入全局注意力模块,空间图卷积网络输出的空间特征图作为注意力模块的输入。其次引 入按时间维度的平均池化和最大池化操作,以增加模型学习全局特征信息的能力。最后用三 个加入注意力机制的时空图卷积神经网络和类激活图(class activation map,CAM),构造对遮挡数据识别能力更强 的丰富激活图卷积网络(RA-GCNv2-A)模型,并通过迁移学习实现学生在线课堂行为识别功 能。 在NTU-RGB+D和NTU-RGB+D120数据集上进行实验验证,与RA-GCNv2模型相比,在NTU-RGB +D 和NTU-RGB+D120数据集上的识别准确率分别提高了(cross-subject,CS)1.3%、(cross-view,CV)1.2%和(cross-subject,CSub)1.6%、 (cross-setup,CSet)1.4%。实验结果表明,提出的方法是一种有效的学生在线课堂 行为识别方法。  相似文献   

11.
欧静  文志诚 《现代信息科技》2023,(11):97-100+104
针对当下人脸去手势遮挡任务中常出现的结构缺失和纹理模糊等问题,文章提出一种基于边缘条件和注意力机制的两阶段修复网络——EmmNet。第一阶段网络为第二阶段细节修复提供边缘指导信息,以避免出现过度平滑等问题。第二阶段网络中的并行多扩张卷积模块可在有效扩大网络感受野的同时提高对有效像素的利用率。此外,注意力模块可促使网络生成具有全局一致性,使研究者获得符合原图特征的修复图像。实验结果表明,EmmNet在去手势遮挡任务中可以生成轮廓结构更加完整流畅,细节纹理更加清晰自然的人脸图像。  相似文献   

12.
针对低光照环境下现有的目标检测算法普遍存在检测精度较低的问题,提出一种改进YOLOv5的双通道低光照图像目标检测算法(YOLOv5_DC)。首先,通过伽马变换和叠加高斯噪声的方法合成低光照图像,扩充数据集,提高模型的泛化能力;其次,提出特征增强模块,引入通道注意力机制,融合增强图像和原始图像的低级特征,抑制噪声特征的影响,改善网络的特征提取能力;最后,在颈部网络中加入特征定位模块,增加特征图在目标区域的响应值,使网络更关注目标区域,提高网络的检测能力。实验结果表明:所提YOLOv5_DC算法实现了更高的检测精度,在低光照图像目标检测数据集ExDark*上的平均精度均值(mAP)@0.5达71.85%,较原始的YOLOv5算法,提高了1.28个百分点。  相似文献   

13.
针对水下目标检测识别精度低的问题,提出了一种基于改进YOLOv5的水下目标检测方法。通过对比多个注意力机制模块,在YOLOv5骨干网络引入了全局注意力机制模块,增强了特征提取,提高了采集特征的能力,并在YOLOv5模型上融合了自适应空间特征融合算法,实现底层特征与顶层特征融合。验证结果表明,所提算法的识别精度优于原始的YOLOv5算法,平均精度提升了8.5%,检测速度为76帧/秒。  相似文献   

14.
铸件缺陷检测是一项重要的质量管理程序。为了避免人为因素的影响,提高检测精度,对YOLOv5s6的目标检测算法进行改进,用于X射线图像的铸件缺陷检测。首先设计了一种C3CA模块用于捕获跨通道、方向感知和位置感知的信息。然后通过在骨干网络中融合多头自注意力机制来捕获局部与全局信息。最后采用Focal-EIoU Loss损失函数。实验结果表明:在相同训练条件下,改进后YOLOv5s6的AP50值达到了90.2%,F1因子达到了87.8%,相较原始模型分别提高了3.4%和2.3%,具有检测准确率高、实时性强等特点。  相似文献   

15.
目前主流的深度融合方法仅利用卷积运算来提取图像局部特征,但图像与卷积核之间的交互过程与内容无关,且不能有效建立特征长距离依赖关系,不可避免地造成图像上下文内容信息的丢失,限制了红外与可见光图像的融合性能。为此,本文提出了一种红外与可见光图像多尺度Transformer融合方法。以Swin Transformer为组件,架构了Conv Swin Transformer Block模块,利用卷积层增强图像全局特征的表征能力。构建了多尺度自注意力编码-解码网络,实现了图像全局特征提取与全局特征重构;设计了特征序列融合层,利用SoftMax操作计算特征序列的注意力权重系数,突出了源图像各自的显著特征,实现了端到端的红外与可见光图像融合。在TNO、Roadscene数据集上的实验结果表明,该方法在主观视觉描述和客观指标评价都优于其他典型的传统与深度学习融合方法。本方法结合自注意力机制,利用Transformer建立图像的长距离依赖关系,构建了图像全局特征融合模型,比其他深度学习融合方法具有更优的融合性能和更强的泛化能力。  相似文献   

16.
地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性。针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果。构建地铁场景行人数据集,标注对应标签,进行数据预处理操作。本研究在特征提取模块中加入深度残差收缩网络,将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道,削弱冗余特征信道;利用改进空洞空间金字塔池化模块,在不丢失图像信息的前提下获得多尺度、多感受野的融合特征,有效捕获图像全局上下文信息;设计了一种改进非极大值抑制算法,对目标预测框进行后处理,保留检测目标最优预测框。实验结果表明:提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度,尤其对小行人目标和密集行人目标的检测,效果提升更为显著。  相似文献   

17.
水下图像往往会因为光的吸收和散射而出现颜色退化与细节模糊的现象,进而影响水下视觉任务。该文通过水下成像模型合成更接近水下图像的数据集,以端到端的方式设计了一个基于注意力的多尺度水下图像增强网络。在该网络中引入像素和通道注意力机制,并设计了一个多尺度特征提取模块,在网络开始阶段提取不同层次的特征,通过带跳跃连接的卷积层和注意力模块后得到输出结果。多个数据集上的实验结果表明,该方法在处理合成水下图像和真实水下图像时都能有很好的效果,与现有方法相比能更好地恢复图像颜色和纹理细节。  相似文献   

18.
针对物流包裹安检图像中小目标违禁品易漏检问题,通过在感受野模块的多分支并行网络上引入卷积注意力模块,构建一种适用于小目标违禁品检测的特征提取模块。在此基础上,将构建的特征提取模块融入YOLOv5模型的主干部分,使得模型在违禁品检测的过程中聚焦于图像的重要特征。为了充分发挥所构建模块对于小目标物体的特征提取能力,采用空间深度转换模块替代原模型中的下采样模块,使得YOLOv5模型在特征提取的过程中能够尽可能地保留小目标物体的特征信息,提高对小目标违禁品的检测效果。  相似文献   

19.
铁轨轨枕表面出现的裂纹可能对轨道交通造成安全隐患。针对铁轨裂纹检测的方法存在通用性差、精度低、召回率低的问题,提出一种基于改进YOLOv5s的铁轨裂纹检测算法YOLOv5s-CBE。首先将CA注意力模块分别加入主干C3模块以及C3与SPPF之间,从通道和空间两个维度捕获通道关系和位置信息,提高YOLOv5s主干网络特征提取能力。其次,在YOLOv5s的Neck部分,使用BiFPN融合不同尺度信息,获取拥有丰富语义信息的输出特征图;同时,加权双向特征融合金字塔结构通过引入权重调整不同尺度输入特征图对输出的贡献,优化特征融合效果,减少了卷积过程中特征信息的丢失,提高了检测精度。最后,将原YOLOv5s中损失函数CIoU改为EIoU。EIoU不仅考虑了中心点距离和纵横比,而且还考虑了预测框与真实框宽度和高度的真实差异,提高了锚框的预测精度。相较于原始网络YOLOv5s,YOLOv5s-CBE铁轨裂纹检测网络在自制铁轨裂纹数据集上,模型大小相较于基础网络YOLOv5s降低了1.0 MB,精度mAP提高了3.7%,召回率由73.5%提升到76.2%,不同尺寸裂纹的漏检现象减少,具有一定的优越性和...  相似文献   

20.
智能设备对行人和车辆的目标检测对于建设智慧城市有着重要的意义。随着红外技术的发展和普及,红外成像科技具有强抗干扰和全天候的特性,被越来越多地用于解决可见光受限环境带来的问题。论文提出了一种改进YOLOv4深度学习算法对红外图像下的行人车辆进行检测。改进的YOLOv4算法加入了CA注意力机制模块,将位置信息嵌入到通道注意中,增强了对感兴趣区域的表示。此外还设计了CSP2-DBL模块,替换了原本简单的卷积模块叠加,对高分辨率特征性信息的做出了弥补。为了进一步提高网络计算速度,减少计算量,针对红外图像特性,对Head部分进行了裁剪。实验结果表明改进后的模型在FLIR红外数据集上较YOLOv4模型在mAP上提高了0.85个百分点,检测速度提升了2 f/s。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号