首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对当前YOLOv5算法检测钢材表面缺陷精度不高、速度慢等问题,提出一种基于多尺度轻量化注意力的YOLO-Steel钢材表面缺陷检测方法.首先,提出一种轻型通道注意力模块,仅需少量计算成本即可有效关注重要通道;然后,利用空洞卷积扩大感受提出一种轻型空间注意力模块,能够在空间维度上提取有价值信息;接着,提出金字塔注意力结构,利用多级池化放缩特征图在不同分辨率特征图上使用空间注意力模块学习其空间依赖信息,对多级特征图使用通道注意力模块重构其通道相关信息,改善检测效果.实验结果表明,YOLO-Steel在钢材表面缺陷数据集上平均精度均值(mAP)可达77.2%,比YOLOv5s算法提高1.8%,模型时间、空间复杂度与YOLOv5s基本持平,在保证检测速度的基础上能够有效提高精确度.  相似文献   

2.
复杂纹理瓷砖表面存在较多的低可视度小目标缺陷与严重的复杂纹理背景干扰,使应用目标检测方法时易出现较高的误检率和漏检率。为提升复杂纹理瓷砖表面缺陷检测效率,提出了基于通道与空间联合注意力的复杂纹理瓷砖表面缺陷检测方案。首先通过建模深浅层特征通道间关系设计了一种选择性特征融合方法,以提升模型对小目标缺陷的特征表达;其次,提出了通道与空间联合注意力模块,通过通道注意力和空间注意力来筛选关键特征通道和抑制纹理区域,使模型着重于学习缺陷特征以增强模型辨别缺陷与纹理的能力;最后,在复杂纹理瓷砖表面缺陷数据上进行了实验验证。实验结果表明,相较于AFF(attentional feature fusion)和CBAM(convolutional block attention module)方法,选择性特征融合方法和通道与空间联合注意力模块使模型检测性能分别提高了5.3 AP、6.32 AP。最终,实验证明了该方案分别优于现有的瓷砖检测方法YOLOv5和纹理织物缺陷检测AFAM方法1.32 AP、2.12 AP。  相似文献   

3.
为解决火焰图像检测易被周围环境干扰、火焰特征复杂等问题,提出改进型YOLOv4火焰图像实时检测模型。改进模型的激活函数;通过K-Means聚类针对火焰图像的特征调整先验框的维度;通过改进损失函数,减少模型中不必要特征的学习;引入注意力机制(通道注意力(CAB)模块和空间注意力(SAB)模块),增强模型在通道和空间的感知力。实验结果表明,改进的YOLOv4目标检测算法的FPS可达76.7,较原来提升了1.1;检测精度和召回率为82.8%、0.78,分别比原算法提高了36.56%、0.36;损失值为0.7758,比原算法降低了1.2942。  相似文献   

4.
目的 全卷积模型的显著性目标检测大多通过不同层次特征的聚合实现检测,如何更好地提取和聚合特征是一个研究难点。常用的多层次特征融合策略有加法和级联法,但是这些方法忽略了不同卷积层的感受野大小以及产生的特征图对最后显著图的贡献差异等问题。为此,本文结合通道注意力机制和空间注意力机制有选择地逐步聚合深层和浅层的特征信息,更好地处理不同层次特征的传递和聚合,提出了新的显著性检测模型AGNet(attention-guided network),综合利用几种注意力机制对不同特征信息加权解决上述问题。方法 该网络主要由特征提取模块(feature extraction module, FEM)、通道—空间注意力融合模块(channel-spatial attention aggregation module, C-SAAM)和注意力残差细化模块(attention residual refinement module,ARRM)组成,并且通过最小化像素位置感知(pixel position aware, PPA)损失训练网络。其中,C-SAAM旨在有选择地聚合浅层的边缘信息以及深层抽象的语义特征,利用通道注意力和空间注意力避免融合冗余的背景信息对显著性映射造成影响;ARRM进一步细化融合后的输出,并增强下一个阶段的输入。结果 在5个公开数据集上的实验表明,AGNet在多个评价指标上达到最优性能。尤其在DUT-OMRON(Dalian University of Technology-OMRON)数据集上,F-measure指标相比于排名第2的显著性检测模型提高了1.9%,MAE(mean absolute error)指标降低了1.9%。同时,网络具有不错的速度表现,达到实时效果。结论 本文提出的显著性检测模型能够准确地分割出显著目标区域,并提供清晰的局部细节。  相似文献   

5.
由于计算机断层扫描(Computed Tomography, CT)医学图像的大部分病灶区域面积较小,传统目标检测模型容易造成小目标病灶区的漏检和误检.针对此问题,本文提出了一种具有注意力机制的特征金字塔网络(Attention Feature Pyramid Network, AFPN),将特征提取网络的输出结果依次输入到通道注意力模块和空间注意力模块中,并与原来的特征层融合,从而在通道层次和特征点层次上对小目标病灶区分别进行特征增强,减少对病灶区的漏检.同时,本文提出了包含信心分数乘积项的损失函数,可以提高被识别错误的样本损失权重,减少对病灶区的误检.实验结果表明,本文模型在小目标病灶区的平均检测精度比3DCE(3D Context Enhanced region-based CNN)模型提高了5.2%,比MSB(Multi-Scale Booster)模型的检测精度提高了4.4%.  相似文献   

6.
目的 微光图像存在低对比度、噪声伪影和颜色失真等退化问题,造成图像的视觉感受质量较差,同时也导致后续图像识别、分类和检测等任务的精度降低。针对以上问题,提出一种融合注意力机制和上下文信息的微光图像增强方法。方法 为提高运算精度,以U型结构网络为基础构建了一种端到端的微光图像增强网络框架,主要由注意力机制编/解码模块、跨尺度上下文模块和融合模块等组成。由混合注意力块(包括空间注意力和通道注意力)引导主干网络学习,其空间注意力模块用于计算空间位置的权重以学习不同区域的噪声特征,而通道注意力模块根据不同通道的颜色信息计算通道权重,以提升网络的颜色信息重建能力。此外,跨尺度上下文模块用于聚合各阶段网络中的深层和浅层特征,借助融合机制来提高网络的亮度和颜色增强效果。结果 本文方法与现有主流方法进行定量和定性对比实验,结果显示本文方法显著提升了微光图像亮度,并且较好保持了图像颜色一致性,原微光图像较暗区域的噪点显著去除,重建图像的纹理细节清晰。在峰值信噪比(peak signal-to-noise ratio,PSNR)、结构相似性(structural similarity,SSIM)和图像感知...  相似文献   

7.
针对显著性区域突出不均匀和边缘不清晰导致显著性检测鲁棒性差等问题,提出了一种通道-空间联合注意力机制的显著性检测模型。改进了一种通道注意力机制,将特征图中的像素概率值逐像素相加以更好的获取通道中层间信息的关联性;在通道注意力机制的基础上并行融入了空间注意力机制,对特征图的空间信息进行加权获得目标突出的显著性区域;将通道注意力机制与空间注意力机制输出的两个特征图加权融合反馈至通道-空间联合注意力机制,从而得到细粒度更高的显著图。实验结果表明,该模型在公开的数据集DUTS-TE和SOD上,使用F-measure和平均绝对误差作为评估标准均优于其他同类模型。  相似文献   

8.
在自动驾驶应用场景下,将YOLOv5应用于目标检测中,性能较之前版本有明显的提升,但在高运行速度情况下检测精度仍不够高,本文提出一种基于改进YOLOv5的车辆端目标检测方法.为解决训练不同数据集时需手动设计初始锚框大小,引入自适应锚框计算.在主干网络(backbone)添加压缩与激励模块(squeeze and excitation,SE),筛选针对通道的特征信息,提升特征表达能力.为了提升检测不同大小物体时的精度,将注意力机制与检测网络融合,把卷积注意力模块(convolutional block attention module, CBAM)与Neck部分融合,使模型在检测不同大小的物体时能关注重要的特征,提升特征提取能力.在主干网络中使用空间金字塔池化SPP模块,使得模型输入可以输入任意图像高宽比和大小.在激活函数方面,进行卷积操作后使用Hardswish激活函数,应用于整个网络模型.在损失函数方面,使用CIoU作为检测框回归的损失函数,改善定位精度低和训练过程中目标检测框回归速度慢的问题.实验结果表明,改进后的检测模型在KITTI 2D数据集上测试,目标检测的精确率(preci...  相似文献   

9.
在自动驾驶领域, 由于道路背景复杂以及小目标信息缺失, 现有目标检测算法存在检测精度低的问题. 由于车载摄像头视角较为固定, 道路上的目标在图像空间中的分布具有一定的规律, 可以为自动驾驶汽车进行目标检测提供更为丰富的信息. 因此, 提出一种改进YOLOv5s的空间特征增强网络(SE-YOLOv5s). 在YOLOv5s的颈部网络中添加位置注意力模块(location attention module, LAM), 该模块能够根据道路目标在图像中的分布特征进行加权, 增强网络对目标类别位置分布的感知和定位能力. 设计一种小目标增强模块(small target enhancement module, STEM), 将浅层特征和深层特征进行融合, 可以获得更丰富的小目标语义信息和空间细节信息, 提高小目标检测效果. 实验结果表明, 改进模型对不同尺度目标检测精度均有所提高, APS提高2.8%, APM提高2.5%, APL提高2%.  相似文献   

10.
输电线通道中的火灾会对电力系统的正常运行造成极大的安全隐患,但由于山火烟雾的形状、大小和颜色变化多样导致传统图像方法检测精度较差.为了提高山火检测精度,本文提出一种基于改进DETR的输电线通道山火检测方法.首先,在特征提取阶段加入多尺度特征信息,并利用空洞卷积提高算法对底层特征的感知能力;然后,引入相对位置编码对Transformer模块中的自注意力机制进行改进;其次,利用CIOU对算法的损失函数进行调整;最后,在标注好的输电线通道山火数据集上对改进后算法进行模型训练和测试.实验结果表明,本文所提出的改进后的DETR模型平均精度可达到84.77%,与原始DETR算法相比提高了6.52%,与其它主流目标检测算法对比,本文提出的山火检测模型可有效识别输电线通道中的山火目标并达到较高的检测精度.  相似文献   

11.
针对当前交通标志检测中存在小目标检测精度低、检测实时性不高以及目标漏检等问题,在YOLOv3基础上提出了一种融合了注意力机制与上下文信息的交通标志检测方法。首先通过改进通道注意力机制的压缩方式,对特征图通道重新进行标定;然后引入空间金字塔池化模块SPP;最后增加特征映射并拼接到原特征融合网络中的小目标部分,充分利用上下文信息增强对小目标的检测。实验结果表TT100K(Tsinghua-Tencent 100K)交通标志数据集上,与YOLOv3网络相比,在每秒传输帧数(Frame Per Second,FPS)变化不大的情况下,平均精度均值和小目标的精度均值分别提升3.03%和4.59%。实验结果证明了改进网络在小目标检测和整体检测中的有效性。  相似文献   

12.
针对口罩检测模型缺少不规范佩戴分类的检测,精度高与速度快难以兼容的问题,提出一种单阶段口罩规范佩戴实时检测算法,引入轻量提取网络DM-CSP,添加多尺度注意力MCA增强提取能力;针对融合阶段深浅层特征信息不对齐问题,设计特征对齐及选择模块FAS,提出特征增强模块CTM关联特征图谱上下文信息,构建解耦通道进行图像识别,提高算法的识别精度和收敛速度。实验结果表明,改进算法检测精度达到93.2%,较主流算法YOLOv4-Tiny提高4.8%,检测速度和模型容量具有更优性能表现。  相似文献   

13.
目的 肝纤维化是众多慢性肝脏疾病的常见表现,如不及时治疗可发展为肝硬化甚至引发肝癌。肝纤维化的准确评估对临床治疗和预后评估等至关重要。目前,肝纤维化的诊断通过肝穿活检判断,有创且有并发症危险。为此,基于影像学的无创诊断方法越来越受到关注。本文提出一种基于通道注意力与空间注意力机制改进的用于肝纤维化区域的自动化分割U-Net (liver fibrosis region segmentation network based on spatial and channel attention mechanisms,LFSCA-UNet)。方法 依据Attention U-Net的改进方式,围绕U-Net的跳跃连接结构进行基于注意力的改进,在AG (attention gate)的基础上,加入以ECA (efficient channel attention)模块为实现方式的通道注意力机制,依据加入ECA的位置,LFSCA-UNet分为A、B、C共3个子型。结果 在肝数据集上与其他实验网络进行评估对比,本文提出的LFSCA-UNet网络结构平均Dice系数达到了93.33%,相比原始U-Net的Dice系数提高了0.539 6%。结论 本文方法将空间注意力机制与通道注意力机制进行结合,有效提高了肝纤维化区域的分割精度,对空间注意力模块使用通道注意力模块优化输入和输出,增加了网络的稳定性,提升了网络的整体效果。  相似文献   

14.
针对现有Deep fake检测算法中普遍存在的准确率低、可解释性差等问题,提出融合双层注意力的神经网络模型,该模型利用通道注意力捕获假脸的异常特征,并结合空间注意力聚焦异常特征的位置,充分学习假脸异常部分的上下文语义信息,从而提升换脸检测的有效性和准确性.并以热力图的形式有效地展示了真假脸的决策区域,使换脸检测模型具备...  相似文献   

15.
针对无人机航拍图像目标检测中视野变化大、时空信息复杂等问题,文中基于YOLOv5(You Only Look Once Version5)架构,提出基于图像低维特征融合的航拍小目标检测模型.引入CA(Coordinate Attention),改进MobileNetV3的反转残差块,增加图像空间维度信息的同时降低模型参数量.改进YOLOv5特征金字塔网络结构,融合浅层网络中的特征图,增加模型对图像低维有效信息的表达能力,进而提升小目标检测精度.同时为了降低航拍图像中复杂背景带来的干扰,引入无参平均注意力模块,同时关注图像的空间注意力与通道注意力;引入VariFocal Loss,降低负样本在训练过程中的权重占比.在VisDrone数据集上的实验验证文中模型的有效性,该模型在有效提升检测精度的同时明显降低复杂度.  相似文献   

16.
为解决复杂环境下道路目标检测任务中由于目标尺度变化多样、密集遮挡以及光照不均匀等导致的漏检问题,提出了一种基于YOLOv5的道路目标检测改进方法 CTC-YOLO(contextual transformer and convolutional block attention module based on YOLOv5)。针对小目标,改进网络检测头结构,增加多尺度目标检测层,提高小目标检测精度。为了充分利用输入的上下文信息,在特征提取部分引入上下文变换模块(contextual transformer networks,CoTNet),设计了CoT3模块,引导动态注意力矩阵学习,提高视觉表征能力。在Neck部分的C3模块集成卷积块注意力模型(convolutional block attention module,CBAM),以在各种复杂的场景中找到注意力区域。为进一步验证CTC-YOLO方法,采取了一些有用的策略,如模型集成位置选择和对比其他注意力机制。实验结果表明,在公开数据集KITTI、Cityscapes以及BDD100K上mAP@0.5分别达到89.6%、46.1%和57....  相似文献   

17.
为了提高混凝土结构损伤视觉检测的自动化水平,提高检测精度,提出了一种基于RetinaNet方法改进的实时目标检测网络。在网络特征提取部分引入了具有位置信息的通道注意力与多头自注意力,多头自注意力模块位于残差网络的最后一个卷积阶段,代替原有的3×3卷积层,而通道注意力则采用嵌入的方式插入到每个残差块中,使每个卷积阶段都能利用注意力机制进行权重调整。改进RetinaNet检测方法的有效性在自建的混凝土结构多类型损伤数据集上进行了验证实验,所提方法的mAP达到了85.0%,检测速度达到了21.9fps,实验结果表明,论文提出的检测方法能够有效进行实时的混凝土结构损伤检测,并且保证了检测精度。  相似文献   

18.
目前深度神经网络模型需要部署在资源受限的环境中,故需要设计高效紧凑的网络结构。针对设计紧凑的神经网络提出一种基于改进注意力迁移的模型压缩方法(KE),主要使用一个宽残差教师网络(WRN)指导一个紧凑的学生网络(KENet),将空间和通道的注意力迁移到学生网络来提升性能,并将该方法应用于实时目标检测。在CIFAR上的图像分类实验验证了经过改进注意力迁移的知识蒸馏方法能够提升紧凑模型的性能,在VOC上的目标检测实验验证了模型KEDet具有很好的精度(72.7 mAP)和速度(86 fps)。实验结果充分说明基于改进注意力迁移的目标检测模型具有很好的准确性和实时性。  相似文献   

19.
实时而准确的交通标志检测是车辆的辅助驾驶和无人驾驶的关键需求。为解决目标检测算法对小目标物体检测精确率低、检测速度慢的问题,提出一种嵌入混合注意力机制的交通标志检测算法YOLOv3-HA。该算法融合改进的通道注意力机制和子空间注意力机制,使网络模型能够对特征进行通道和空间上的注意力加权,提升网络对有效特征的表达能力并减少干扰特征的影响。采用K-Means++聚类算法对锚框进行聚类和选择,加快网络模型的收敛速度。实验表明,该算法在TT100K(Tsinghua-Tencent 100 K)数据集上的平均准确率均值达到81.0%,相比于YOLOv3算法提升了14.2%;与一些主流目标检测算法相比,YOLOv3-HA算法在准确性和实时性上达到了良好的平衡。  相似文献   

20.
针对现有目标检测模型难以应用在复杂火灾场景的问题,论文提出了基于注意力机制改进的YOLOX火灾场景检测模型,实现对火焰、烟雾以及受灾人员的检测。首先,在CSPLayer层上添加轻量级注意力模块,提升模型整体的检测性能;其次,引入通道混合技术,提高各通道间的交流能力;最后,将主干网络最后一层换为轻量级Transformer模块,强化主干网络对全局信息的抓取能力。通过在自制火灾数据集上的实验表明,T-YOLOX的mAP比基准模型(YOLOX)提高了2.24%,与CenterNet、YOLOv3相比检测精度有较大提升,证明了该算法的有效性和优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号