首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
水下光学图像存在色偏、低对比度、目标模糊的现象,导致水下目标检测时存在漏检、误检等问题。针对上述问题,提出了一种基于通道注意力与特征融合的水下目标检测算法。基于通道注意力设计了激励残差模块,将前向传播的特征信息进行自适应分配权重,以突出不同通道特征图的显著性,提高了网络对水下图像高频信息的提取能力;设计了多尺度特征融合模块,增加了大尺度特征图用于目标检测,利用其对应的小尺度感受野提高了网络对小尺寸目标的检测性能,进一步提高了网络对水下不同尺寸目标的检测精度;为提高网络对水下环境的泛化性能,设计了基于拼接和融合的数据增强方法,模拟水下目标的重叠、遮挡和模糊情况,增强了网络对水下环境的适应性。通过在公共数据集URPC上的实验,与YOLOv3、YOLOv4和YOLOv5相比,所提算法的平均精度均值分别提升5.42%,3.20%和0.9%,有效改善了水下复杂环境中不同尺寸目标漏检、误检的问题。  相似文献   

2.
显著性目标检测已经被广泛应用到图像检索、图像分割、行人重识别等领域.目前主流的显著性目标检测方法通常采用短连接加权的方式融合多级别特征信息,这种方式无法精准有效地控制信息流的传递.而且,现有的检测方法通常采用单一的特征检测,导致显著性目标区域与背景的边界不连续、易模糊.因此,本文提出一种多尺度特征提取和多级别特征融合的...  相似文献   

3.
针对图像显著性对象检测领域中多尺度特征提取不充分、对象边缘模糊等问题,提出了一个端到端的基于注意力嵌入的金字塔特征以及渐进边缘优化的显著性对象检测模型。首先,设计了由多个扩张卷积构成的注意力嵌入的密集空洞金字塔模块(AEDAPM),在不减小特征分辨率的前提下,得到丰富且有效的多级多尺度特征;其次,为了解决显著性对象边缘模糊的问题,提出了渐进边缘优化模块(SEOM),在特征恢复分辨率的过程中逐步补充空间细节信息,使模型检测出的显著对象能够拥有清晰的边缘轮廓。在DUTS-TE、ECSSD、DUT-OMRON、HKU-IS、PASCAL-S 5个显著性领域公开的数据集上与其他12种已有的先进方法在3个常用指标下进行了比较,结果表明:所提方法能够得到更加准确、边缘更加清晰的显著性结果。此外,自对比实验也充分证明了提出的注意力嵌入的密集空洞金字塔模块和渐进边缘优化模块的有效性。  相似文献   

4.
基于注意力机制和多层次特征融合的目标检测算法   总被引:1,自引:0,他引:1  
为了提高目标检测的准确率,提出一种基于注意力机制和多层次特征融合的图像目标检测算法。该算法在Cascade R-CNN模型的基础上,以RseNet50为主干网络,通过嵌入简单的注意力模块(SAM)来提高网络的判别能力;其次,利用深度可分离卷积改进特征金字塔网络(FPN),设计了多层次特征融合模块(MFFM),对多尺度特征进行融合,以丰富特征图的信息量,并对不同层次的特征图赋予相应的权重以平衡不同尺度的特征信息;最后,结合目标检测方法中的区域建议网络(RPN)结构获取目标的候选区域进行分类和回归处理,确定检测目标的位置和类别。实验结果表明,相较于Cascade R-CNN目标检测算法,该算法的检测精度提升了约2.0%。  相似文献   

5.
水果图像识别是智能采摘系统中最重要的组成部分.针对现阶段水果图像识别过程中存在的漏检和误检现象,为进一步提高识别准确率,研究了基于多尺度特征融合的水果图像识别算法.首先,为避免训练过程中出现欠拟合现象,对Fruits-360中的水果图像进行数据扩充,并进一步灰度归一化处理以减少计算量.随后采用ResNet-50作为骨干网络,并在骨干网络的基础上建立多尺度采样层,使用1×1、3×3和5×5的卷积核在拓宽网络宽度的同时进行特征提取,多尺度网络层整体增加BN层,即在每个卷积层之后都增加BN层.使在ResNet-50提取的原始特征基础上获取语义信息更加丰富的特征图.最后采用梯度下降法优化网络,得到最终的识别模型.实验结果表明,所提算法识别精度高,可准确的对水果图像经识别,识别精度高达99.4%,在相同数据集的情况下,优于目前主流算法,可为水果自动采摘技术提供帮助.  相似文献   

6.
针对现有的印刷电路板(PCB)缺陷检测识别方法存在网络模型结构复杂、误检率高等问题,提出了一种融合视觉注意力机制与双向特征加权的PCB缺陷识别方法。首先,在YOLOv5网络结构的基础上通过使用加权双向特征金字塔网络(BiFPN)来加速多尺度融合;其次,引入视觉注意力机制和替换损失函数,增加过滤冗余信息,强化模型对微小目标的提取能力。在PKU-Market-PCB数据集上的实验结果表明,文中方法对各类缺陷的检测精度高达97.4%,与原始的YOLOv5网络及其他文献方法均有显著提升,实验结果表明了该算法在对微小目标检测识别上进一步提升了性能。  相似文献   

7.
基于深度学习的小目标检测研究对于如小人脸识别、遥感图像检测等任务的优化与提升都具有极为重要的意义。但由于图像中的小目标所占像素较少,分辨率低,包含的特征信息不明显,现有方法对小目标的检测效果并不理想。针对此问题,提出一种基于反馈的特征融合网络ReFPN用于YOLOv4算法,两次利用骨干网络提取的原始特征层,加强小目标特征信息,对其进行更精确的位置回归。同时提出混合注意力机制Co-AM充分提取小目标的细节特征信息,抑制无效特征,进一步提高小目标的检测精度。实验结果表明,此文提出的方法使YOLOv4算法在MS COCO数据集上平均精度AP提高了1.9%,小目标平均精度APS提高了3.3%,检测效果优于现有小目标检测算法,证明了此文提出方法的有效性。  相似文献   

8.
针对遥感图像目标尺度变化较大、分割不够准确的问题,提出了一种融合多尺度特征注意力卷积神经网络(CNN)的图像分割方法。该方法基于卷积块注意力模块提出了改进的有效注意力模块(ECBAM)。在通道注意力模块中加入空洞卷积以降低池化操作造成的特征损失,并在通道注意力模块后添加卷积层对通道注意力特征映射进行特征融合。然后,基于ECBAM设计了一种编码解码架构的卷积神经网络模型ECBAM-CNN,其中编码器主要由卷积层、ECBAM和空洞空间金字塔池化模块组成,解码器主要由卷积层和ECBAM组成,并且采用跳跃连接将编码阶段的多尺度信息融合到解码器。实验表明,提出的方法无需预训练和后处理,与SegNet等前沿方法相比取得了更好或相近的分割准确度,在DLRSD和WHDLD测试集上的mIoU分别为67.3%和62.0%。  相似文献   

9.
针对传统目标检测算法(SSD)检测小目标精度低的问题,提出基于注意力机制与多尺度信息融合方法并将其运用于车辆检测任务.结合浅层特征图与深层特征图的优势,小目标检测分支和大中型目标检测分支的特征图采用5支路和2支路融合.在基础网络层之间加入注意力机制模块,模型会关注包含更多信息量的通道.实验结果表明,在自建车辆数据集上的均值平均精度(m AP)达到90.2%,比传统SSD算法提高了10.0%,其中小目标检测精度提高了17.9%;在PASCAL VOC 2012数据集上的类别平均精度mAP为83.1%,比主流的YOLOv5算法提高了6.4%.此外,提出算法在GTX1 660 Ti PC端的检测速度可以达到25帧/s,能够满足实时性的需求.  相似文献   

10.
针对复杂场景下目标检测与识别精度较低的问题,提出了一种基于注意力与多级特征融合的YOLOv5目标检测与识别算法。该算法在传统YOLOv5s模型的主干网络中引入双空间方向的金字塔切分注意力机制,增强对特征空间和通道信息的学习能力,同时在瓶颈网络中采用多级特征融合结构,对不同分支的特征进行融合,增加特征的丰富性,提升应对复杂场景的能力。此外,利用C3Ghost模块和深度可分离卷积分别替换C3模块和普通卷积,降低网络参数量和复杂度。结果表明:与传统的YOLOv5s算法相比,所提算法在VOC2007+2012数据集的均值平均精度高达85%,在智能零售柜商品识别数据集的均值平均精度高达97.2%,表现出较好的性能。  相似文献   

11.
雨纹分布和形状具有多样性,现有去雨算法在去雨的同时会产生图像背景模糊、泛化性能差等问题.因此,本文提出一种基于注意力机制的多尺度特征融合图像去雨方法.特征提取阶段由多个包含两个多尺度注意力残差块的残差组构成,多尺度注意力残差块利用多尺度特征提取模块提取及聚合不同尺度的特征信息,并通过坐标注意力进一步提高网络的特征提取能力.在组内进行局部特征融合,组间利用全局特征融合注意力模块更好地融合不同层次的特征,通过像素注意力使网络重点关注于雨纹区域.在仿真和真实雨像数据集上与其他现有图像去雨算法相比,本文方法的定量指标有着明显提高,去雨后的图像视觉效果较好且具有良好的泛化性.  相似文献   

12.
基于深度学习的图像修复方案在篡改后图像中遗留很少的痕迹信息给取证带来了极大的困难。目前针对深度图像修复的取证工作研究较少,并且存在篡改区域定位不准确的问题。为此,本文提出了一种动态特征融合取证网络(dynamic feature fusion forensics network, DF3Net)用于定位经过深度图像修复操作的篡改区域。首先,该网络采用不同的篡改痕迹增强方式包括SRM滤波、空间域高通滤波和频率域高通滤波将单输入图像扩展到多输入,并提出动态特征融合模块对多种输入提取有效的修复痕迹特征后进行动态的特征融合;其次,网络采用编码器-解码器架构作为基础框架,并在编码器末端增加多尺度特征提取模块以获取不同尺度的上下文信息;最后,本文还设计了空间加权的通道注意力模块用于编、解码器之间的跳跃连接,以期实现有侧重地补充损失的边界细节。实验结果表明,面对不同的深度修复方案以及不同的图像数据库,DF3Net相较于现有的图像修复取证方法均可以更准确地定位篡改区域,并且对于JPEG压缩和高斯噪声具有较强的鲁棒性。  相似文献   

13.
模型的效率在计算机视觉中变得越来越重要.本文通过研究用于火焰检测的神经网络结构,提出了几个关键的优化方案,以提高模型效率和检测效果.第一,提出一种由多卷积组合结构构建的主干网络(FIRE-Net),它能高效地从多个尺度上提取丰富的火焰特征;第二,提出一种改进的加权双向特征金字塔网络(BiFPN-mini)以快速地实现多尺度特征融合;第三,提出一种新的注意力机制(FIRE-Attention),让检测器对火焰特征更敏感.基于上述优化,本文开发出了一种全新的火焰检测器FIRE-DET,它在硬件资源有限的条件下能够取得比现有基于深度学习的火焰检测方法更高的检测效率.FIRE-DET模型在自建数据集上进行训练后,最终对火焰检测的准确率和帧率分别达到97%和85 FPS.实验结果表明,与主流算法相比,本文火焰检测模型检测性能更优.本文为解决火焰探测问题提供了一个更通用的解决方案.  相似文献   

14.
图像中阴影像素的存在会导致图像内容的不确定性,对计算机视觉任务有害,因此常将阴影检测作为计算机视觉算法的预处理步骤. 提出全新的阴影检测网络结构,通过结合输入图像中包含的语义信息和像素之间的关联,提升网络性能. 使用预训练后的深层网络ResNeXt101作为特征提取前端,提取图像的语义信息,并结合U-net的设计思路,搭建网络结构,完成特征层的上采样过程. 在输出层之前使用非局部操作,为每一个像素提供全局信息,建立像素与像素之间的联系. 设计注意力生成模块和注意力融合模块,进一步提高检测准确率. 分别在SBU、UCF这2个阴影检测数据集上进行验证,实验结果表明,所提方法的目视效果及客观指标皆优于此前最优方法所得结果,在2个数据集上的平均检测错误率分别降低14.4%和14.9%.  相似文献   

15.
水上交通场景环境复杂,通过普通光学摄像设备获取的水面图像,面临着视觉目标清晰度低、尺度多样化等问题,使得可见光视觉信号里中、小尺度目标检测相对困难。为服务于各类智慧海事应用,提出了一个旨在提高复杂水域背景下多尺度水上船舶目标检测性能的算法(multi-scale ship object detection,MS-SOD)。该算法基于当前计算机视觉技术中主流的单阶段目标检测模型框架,在其主干网络中嵌入卷积注意力模块,来优化船舶特征提取能力;在多尺度特征融合网络中引入富含细节信息的浅层特征,并使用跨阶段局部残差结构,来优化多尺度船舶特征的融合机制;同时,使用焦点损失函数,来优化模型的学习过程;并设计自适应锚框聚类算法优化先验锚框,以提高多尺度船舶目标检测能力。为验证提出算法的有效性和实效性,在构建较大规模水上船舶目标数据集的基础上,开展了广泛实验验证。结果表明:提出的算法在测试数据集上的检测准确度超过了各主流的对比方法;特别是对于大、中、小各尺度船舶目标的检测精度,相对于主流的YOLOv4算法,提出的算法分别提升了11.3%、6.0%和10.5%。  相似文献   

16.
针对行人检测算法在交通场景下应用时的遮挡问题,提出一种结合双重注意力机制的遮挡感知行人检测算法.以RetinaNet作为基础框架,在回归和分类支路分别添加空间注意力和通道注意力子网络,增强网络对于行人可见区域的关注;同时引入行人可见边界框信息对传统的回归损失函数进行优化,使其能够随着遮挡程度自适应地调节预测框贡献的权重...  相似文献   

17.
因受成像设备限制,得到的人脸图像分辨率通常较低,针对此问题提出了一种将生成对抗网络和注意力机制相结合的方法,来对人脸图像进行多尺度超分辨率重建。将深度残差网络和深度神经网络分别作为生成器和判别器,并将注意力模块与深度残差网络中的残差块相结合,重建出与高分辨率图像高度相似且难以被判别器区分的超分辨率人脸图像。实验结果证明,所提出的方法能够有效地提升人脸图像的分辨率,同时也证明了注意力机制在图像细节信息重建中的重要作用。  相似文献   

18.
针对以往剩余使用寿命(RUL)预测方法对轴承退化信息挖掘不充分、忽视不同特征贡献度差异,影响预测准确性的问题,提出基于多尺度特征与注意力机制的轴承RUL预测方法. 在多个尺度下计算轴承原始振动信号的若干时域和频域特征,作为输入特征集. 将多尺度特征集输入到网络中,以注意力模块为不同特征自适应地分配最佳权重,以卷积神经网络(CNN)模块进行深层特征提取与多尺度特征融合,通过前馈神经网络(FNN)模块映射得到RUL预测值. 通过公开的轴承数据集进行实验验证,与其他RUL预测方法相比,所提方法的预测性能更优越.  相似文献   

19.
针对现有基于注意机制的图像描述方法全局信息缺失问题,提出了一种改进的全局注意机制图像描述方法。该方法在注意机制的基础上,通过设计全局特征网络来模拟人类感知机制的全过程,对图像全局特征进行增强。将所提方法在相同数据集和网络超参数的情况下与目前最优网络进行实验对比,分析了全局信息对生成文本的影响。实验结果显示,文中提出的方法在更具挑战性的中文文本描述任务上客观评价指标优于目前最优的模型。同时,在主观评价中能够生成更准确的文本内容,也更具丰富性与多样性,接近自然语言描述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号