首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
针对轻量化目标检测模型SSD-MV2对合成孔径声呐(SAS)图像水下多尺度目标检测精度低的问题,该文提出一种新的卷积核模块-可扩张可选择模块(ESK),ESK具有通道可扩张、通道可选择和模型参数少的优点.与此同时,利用ESK模块重新设计了SSD的基础网络和附加特征提取网络,记作SSD-MV2ESK,并为其选择了合理的扩张系数和多尺度系数.在合成孔径声呐图像水下多尺度目标检测数据集SST-DET上,SSD-MV2ESK在模型参数基本相等的条件下,检测精度比SSD-MV2提升4.71%.实验结果表明,SSD-MV2ESK适用于合成孔径声呐图像水下多尺度目标检测任务.  相似文献   

2.
针对轻量化目标模型SSD-MV2对水下光学图像感兴趣目标检测精度低的问题,该文提出一种通道可选择的轻量化特征提取模块(SEB)和一种卷积核可变形、通道可选择的特征提取模块(SDB)。与此同时,利用SEB模块和SDB模块分别重新设计了SSD-MV2的基础网络和附加特征提取网络,记作SSD-MV2SDB,并为其选择了合理的基础网络扩张系数和附加特征提取网络SDB模块数量。在水下图像感兴趣目标检测数据集UOI-DET上,SSD-MV2SDB比SSD-MV2检测精度提高3.04%。实验结果表明,SSD-MV2SDB适用于水下图像感兴趣目标检测任务。  相似文献   

3.
轻量化目标检测模型SSD-MV3(Single Shot Detection-MobileNet V3)因输入图像尺寸限制无法直接检测高分辨率大尺寸合成孔径声纳(Synthetic Aperture Sonar, SAS)图像中感兴趣小目标.为此,本文提出了一种新的目标检测方法 HRSSD(High Resolution Single Shot Detection),该方法通过冗余切割确保SSD-MV3输入图像尺寸的规范以及感兴趣小目标的完整,并利用二次非极大值抑制保证检测结果的唯一.此外,提出了一种尺度、空间和通道注意力机制联合的特征提取模块,并利用该模块重新设计了SSD-MV3的基础网络和附加特征提取网络,记作SSD-MV3P(Single Shot Detection-MobileNet V3 Pro),使得SSD-MV3P能更有效的感知感兴趣小目标特征信息.实验结果表明,在感兴趣小目标检测数据集SST(Sonar Small Targets)上,SSD-MV3P的平均检测精度(mean Average Precision, mAP)比SSD-MV3提升4.39%.HRSSD实现...  相似文献   

4.
水下图像目标检测是水下智能化探测的核心技术之一,广泛应用于工业及军事领域。深度学习相关技术的突破为水下图像目标检测的发展带来了新的机遇,但是目前该领域的综述较为陈旧,并且缺乏一定的系统性和全面性。该文对基于深度学习的水下可见光图像和声呐图像目标检测研究工作进行了详细总结与分析。首先,对基于深度学习的通用目标检测算法框架进行了梳理,包含骨干网络、颈部模块、检测头部、训练算法、推理策略、数据集6项要素,并系统性地总结了每个要素存在的问题及最新研究工作;然后,调研了水下可见光图像目标检测最新进展,分别从数据集发展、模型设计、训练算法进行总结;同时,归纳并分析了水下声呐图像目标检测相关工作,包含前视、侧扫、合成孔径3种声呐。最后,结合深度学习最新研究探讨了该领域的研究趋势。  相似文献   

5.
针对常规目标检测器检测水下目标时存在特征提取困难、目标漏检等问题,提出一种改进CenterNet的水下目标检测算法。首先,使用高分辨率人体姿态估计网络HRNet代替CenterNet模型中的Hourglass-104骨干网络,降低模型参数量,提升网络推理速度;其次,引入瓶颈注意力模块,在空间维度及通道维度进行特征增强,使网络关注重要目标特征信息,提高检测精度;最后,构建特征融合模块,融合网络内部丰富的语义信息和空间位置信息,并利用感受野模块增强融合后的特征,提高网络多尺度目标检测能力。在URPU水下目标检测数据集上进行实验,与CenterNet相比,所提算法的检测精度可达77.4%,提升1.5个百分点,检测速度为7 frame/s,提升35.6%,参数量为30.4 MB,压缩84.1%,同时与其他主流目标检测算法相比具有更高的检测精度,在水下目标检测任务上更具优势。  相似文献   

6.
针对红外图像存在细节纹理特征差、对比度低、目标检测效果差等问题,基于YOLOv4(You Only Look Once version 4)架构提出了一种融合通道注意力机制的多尺度红外目标检测模型。该模型首先通过降低主干特征提取网络深度,减少了模型参数。其次,为补充浅层高分辨率特征信息,重新构建多尺度特征融合模块,提高了特征信息利用率。最后在多尺度加强特征图输出前,融入通道注意力机制,进一步提高红外特征提取能力,降低噪声干扰。实验结果表明,本文算法模型大小仅为YOLOv4的28.87%,对红外目标的检测精度得到了明显提升。  相似文献   

7.
将目标检测框架应用于水下声呐图像处理是近期的高热度话题,现有水下声呐目标检测方法多基于声呐图像的纹理特征识别不同物体,难以解决声呐图像中由于形状畸变造成的几何特征不稳定问题。为此,该文提出一种基于YOLOv3的水下物体检测模型YOLOv3F,该模型将从声呐图像中提取的纹理特征和从深度图中提取的空间几何特征相融合,利用深度图中相对稳定的空间几何特征弥补纹理特征表述能力的不足,再将融合后的特征用于目标检测。实验结果表明,所提改进模型的检测性能相较于3个基线模型在识别精度方面具有明显提升;在对单个类别的物体进行检测的情况下,与YOLOv3相比,改进模型也表现出了更出色的检测效果。  相似文献   

8.
基于深度学习的目标检测算法在水下进行检测主要存在两个困难:水下设备的存储和计算能力有限;水下图像模糊且小生物聚集。这种局限性要求水下目标检测算法要做到轻量且高效,因此现有的目标检测算法不能完全满足水下目标检测的需求。为此本文在SSD(single shot MultiBox detector)的网络框架上进行改进,设计了一种轻量化的一阶段检测模型SG-Det。一方面,借鉴GhostNet的思想,对ShuffleNetV2网络进行了重构,提出一种新的轻量化特征提取网络SGnet。此网络进一步减少了模型参数量,使模型大小更适合部署在水下设备。另一方面,网络主要是利用6个不同尺度的特征图检测不同大小的生物,为此设计了一种引入双分支注意力机制的跨尺度特征融合模块(cross-scale feature fusion module, AFF)。模块首先引入注意力机制对输入的特征在全局通道和局部通道两方面进行加权,突出有用信息,从而减少背景等无关信息的干扰。然后选取非线性化程度更高的第4层分别增强前3层的语义信息,以较小的代价使前3层在识别小物体方面有更好的表现。模型在中国水下机器人大赛提供的水下...  相似文献   

9.
针对高分辨率遥感图像中物体排布密集、尺度变化较大等特性,提出一种目标检测算法R-YOLOv5。算法在YOLOv5模型基础上首先将跨阶段局部扩张结构作用于主干网络,采用一种加强的特征提取方式,通过整合空洞卷积和密集连接,来缓解模型对密集分布目标的漏检问题;其次,在主干网络的瓶颈部分结合Transformer模块来增强特征的表达,突出目标区域;最后,引入多尺度特征融合模块,解决多尺度特征融合时存在的不一致性问题,以提高模型的检测效果。在公开的遥感图像检测数据集DIOR的实验结果表明,R-YOLOv5算法平均精度均值(mAP)达到80.6%,具有良好的检测性能。  相似文献   

10.
为解决在卫星遥感图像的多尺度目标检测中出现的背景混乱、小目标检测精度低、漏检率高等问题,提出一种用于卫星遥感图像的多尺度目标检测算法。在主干网络中使用通道和空间注意力模块,并重新设计特征融合网络,实现上采样-下采样-上采样的多重融合,并在其中加入通道权重参数,让网络更加关注重要的层次,实现不同层次特征信息的充分利用,使细节特征信息得到增强。在DIOR数据集中的实验结果表明,所提算法不仅显著提升对小目标的检测效果,而且提高对复杂场景中目标的检测精度,与YOLOv5m相比,对部分较小或者复杂的目标检测效果提升明显,精度提升4.5个百分点以上,整体精度提升3.1个百分点。  相似文献   

11.
水下图像往往会因为光的吸收和散射而出现颜色退化与细节模糊的现象,进而影响水下视觉任务。该文通过水下成像模型合成更接近水下图像的数据集,以端到端的方式设计了一个基于注意力的多尺度水下图像增强网络。在该网络中引入像素和通道注意力机制,并设计了一个多尺度特征提取模块,在网络开始阶段提取不同层次的特征,通过带跳跃连接的卷积层和注意力模块后得到输出结果。多个数据集上的实验结果表明,该方法在处理合成水下图像和真实水下图像时都能有很好的效果,与现有方法相比能更好地恢复图像颜色和纹理细节。  相似文献   

12.
针对现有图像拼接检测网络模型存在边缘信息关注度不够、像素级精准定位效果不够好等问题,提出一种融入残差注意力机制的DeepLabV3+图像拼接篡改取证方法,该方法利用编-解码结构实现像素级图像的拼接篡改定位。在编码阶段,将高效注意力模块融入ResNet101的残差模块中,通过残差模块的堆叠以减小不重要的特征比重,凸显拼接篡改痕迹;其次,利用带有空洞卷积的空间金字塔池化模块进行多尺度特征提取,将得到的特征图进行拼接后通过空间和通道注意力机制进行语义信息建模。在解码阶段,通过融合多尺度的浅层和深层图像特征提升图像的拼接伪造区域的定位精度。实验结果表明,在CASIA 1.0、COLUMBIA和CARVALHO数据集上的拼接篡改定位精度分别达到了0.761、0.742和0.745,所提方法的图像拼接伪造区域定位性能优于一些现有的方法,同时该方法对JPEG压缩也具有更好的鲁棒性。  相似文献   

13.
Within the fields of underwater robotics and ocean information processing, computer vision-based underwater target detection is an important area of research. Underwater target detection is made more difficult by a number of problems with underwater imagery, such as low contrast, color distortion, fuzzy texture features, and noise interference, which are caused by the limitations of the unique underwater imaging environment. In order to solve the above challenges, this paper proposes a multi-col...  相似文献   

14.
刘亚灵  郭敏  马苗 《光电子.激光》2021,32(12):1271-1277
针对声音事件检测中仅在时频维度使用注意力机制的局限性以及卷积层单一导致的特征提取不足问题,本文提出基于多尺度注意力特征融合的卷积循环神经网络(convolutional recurrent neural network,CRNN)模型,以提高声音事件检测性能.首先,提出多尺度注意力模块,实现对局部时频单元和全局通道特征...  相似文献   

15.
李雅倩  盖成远  肖存军  吴超  刘佳甲 《电子学报》2000,48(12):2360-2366
现有深度卷积神经网络中感受野尺度单一,无法适应目标的尺度变化和边界形变,故此本文提出了一种提取并融合多尺度特征的目标检测网络.该网络通过减少池化并在网络底层加入空间加信道压缩激励模块来突出可利用的细节信息,生成高质量的特征图;此外,在深层网络中加入可变多尺度特征融合模块,该模块具有多种尺度的感受野并可根据物体边界预测采样位置,最后通过融合多尺度特征使网络具有更强的特征表达能力并且对不同尺度实例及其边界信息更具鲁棒性.实验证明,本文结构实现了比原有结构更高的平均精度,与目前主流目标检测算法相比也具有一定优势.  相似文献   

16.
深度学习在室内人员检测领域应用广泛,但是传统的卷积神经网络复杂度大且需要高算力GPU的支持,很难实现在嵌入式设备上的部署。针对上述问题,该文提出一种基于改进YOLOv4-tiny的轻量化室内人员目标检测算法。首先,设计一种改进的Ghost卷积特征提取模块,有效减少了模型的复杂度;同时,该文通过采用带有通道混洗机制的深度可分离卷积进一步减少网络参数;其次,该文构建了一种多尺度空洞卷积模块以获得更多具有判别性的特征信息,并结合改进的空洞空间金字塔池化结构和具有位置信息的注意力机制进行有效的特征融合,在提升准确率的同时提高推理速度。在多个数据集和多种硬件平台上的实验表明,该文算法在精度、速度、模型参数和体积等方面优于原YOLOv4-tiny网络,更适合部署于资源有限的嵌入式设备。  相似文献   

17.
索引调制滤波器组多载波(FBMC-IM)水声通信系统在进行信号检测时,需要先根据均衡后子载波上承载的恢复数据判断出活跃子载波的位置。针对传统检测方法估计索引信息时计算复杂度高且准确度较低的问题,该文结合双向长短时记忆网络(BLSTM)对时序信号进行特征提取的优势,将深度学习理论引入水声信号处理的概念,提出一种基于多层BLSTM的水声通信信号索引检测方法。该方法将传统索引检测问题转化为数据驱动的多元分类问题,在提高估计性能的同时降低了计算复杂度。基于湖试测得的水声信道数据仿真验证了该方法的优越性和鲁棒性,可以作为索引调制机制下的一种通用检测手段。  相似文献   

18.
针对复杂城市监控场景中由于目标尺寸变化大、目标遮挡、天气影响等原因导致目标特征不明显的问题,该文提出一种基于注意力机制的多尺度全场景监控目标检测方法。该文设计了一种基于Yolov5s模型的多尺度检测网络结构,以提高网络对目标尺寸变化的适应性。同时,构建了基于注意力机制的特征提取模块,通过网络学习获得特征的通道级别权重,增强了目标特征,抑制了背景特征,提高了特征的网络提取能力。通过K-means聚类算法计算全场景监控数据集的初始锚框大小,加速模型收敛同时提升检测精度。在COCO数据集上,与基本网络相比,平均精度均值(mAP)提高了3.7%,mAP50提升了4.7%,模型推理时间仅为3.8 ms。在整个场景监控数据集中,mAP50达到89.6%,处理监控视频时为154 fps,满足监控现场的实时检测要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号