首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
刘颖  孙海江  赵勇先 《液晶与显示》2023,(11):1455-1467
针对复杂场景下红外图像中弱小目标像素占比少、特征细节不明显致使目标特征提取困难、检测准确率低的问题,提出了一种基于注意力机制的复杂背景下红外弱小目标检测方法。该方法以YOLOv5网络为基础,设计SimAMC3注意力机制模块,优化网络的特征提取层;设计目标检测头,通过增加特征融合层来改变其开始进行特征提取的深度,获得新的弱小目标检测层,使浅层特征层更好地保留弱小目标的空间信息;改进预测框筛选方式,提高距离相近或重叠目标的检测精度。实验选取了两个SIRST红外弱小目标图像数据集,对其进行标注并训练。实验结果表明,改进后的算法与原YOLOv5算法相比,平均精度均值(mAP)分别提升了4.8%和7.1%,在不同复杂背景下均可有效检测出红外弱小目标,体现了良好的鲁棒性和适应性,可以有效应用于复杂背景中的红外弱小目标检测。  相似文献   

2.
足球运动在全世界范围内拥有广泛的受众和巨大的市场,利用计算机视觉技术对足球比赛视频进行目标检测,自动识别出球员、足球的位置,可以为进一步的跟踪提供良好的基础,对球队、对转播都有很大的帮助.本文提出了基于注意力机制的神经网络足球视频目标检测方案,通过搭建使用注意力机制的深度神经网络,并在足球相关数据集上进行训练,实现了对...  相似文献   

3.
针对无人机在电力巡检过程中存在的待识别部件背景复杂、轮廓特征不清晰、各类部件尺寸相差较大等问题,提出一种改进的YOLOv4算法对电力关键部件进行识别。首先搭建深度可分离卷积残差块(M-Resblock-body),用其代替原特征提取网络中的部分普通卷积残差块,在不降低特征提取能力的情况下减少参数量,加快模型的推理速度。然后引入自适应调节感受野网络(SKNet),对输入的感受野进行自适应调节,捕获不同尺度的目标,通过合理分配特征通道的权重来对特征进行有效的表达,提高模型检测精度。最后为了增强模型的泛化能力,对训练集进行一系列数据增强。实验结果表明,改进后的YOLOv4算法在测试集上精度比原始网络提高8.85%,速度提升2.24 frame/s,能够有效实现电力巡检中关键部件的识别及缺陷检测。  相似文献   

4.
对于低信噪比下的弱小目标检测,传统的检测算法采用恒虚警(CFAR)的方式定位目标的位置,但其难以设置合适的阈值,无法很好地应对该类目标的检测。针对上述问题,本文提出VU?Net检测方法。该方法首先对雷达回波数据进行处理,得到目标回波的距离?多普勒(RD)矩阵。然后将RD矩阵输入到所提出的网络框架,通过U?Net实现雷达信号的编码与解码,获取RD矩阵中具有辨别性的深度语义特征,实现逐单元的目标位置预测。同时,该网络中引入自注意力模块实现对雷达信号的关系建模,从而提取更加丰富的目标回波特征,提升网络的抗噪性能。实验结果表明,所提方法的检测性能在低信噪比场景下具有较强的鲁棒性,能够实现对弱目标的有效检测。  相似文献   

5.
6.
7.
张伟  刘娜  江洋  李清都 《电子科技》2022,(10):45-50
针对人工分拣垃圾效率低、任务重和环境恶劣等问题,文中提出了基于YOLO的目标检测方法来实现垃圾检测与分类。通过制作特定数据集,使用K-means聚类算法以及Mish激活函数对模型进行调整。根据卷积神经网络的特性,通过在YOLO模型的每个检测头前嵌入CBAM注意力模块,结合PANet增强特征集成能力来提升小目标检测的精度。实验结果表明,文中提出的垃圾检测与分类方法能够准确快速地识别垃圾。相较于YOLOv4,文中所提模型在垃圾数据集上的map值提升了2.81%,其中Cans的识别精度可达94.56%,PlasticBottle的精度提升了6.36%。  相似文献   

8.
李宇豪  吕晓琪  谷宇  张明  李菁 《激光技术》2021,45(6):722-728
为了解决人脸检测存在小目标人脸携带的特征信息少且相对较为模糊,导致检测难度较高的问题,采用将尺度不变人脸检测器(S3FD)网络与通道和空间注意力机制相结合的网络作为主干,在通道和空间上建立了特征之间的权重关系,强化特征提取能力,将原本S3FD所输出的特征图经扩大感受野后进行上采样,使得上一层特征图的输出包含了下一层特征图的特征。结果表明, widerface数据集的3个不同等级的验证集的平均精准率分别为95.0%,93.7%,86.4%,与原S3FD相比分别提高了1.3%,1.2%,0.5%。本文中提出的算法在人脸检测中具有较好的检测效果。  相似文献   

9.
针对红外和可见光目标检测方法存在的不足,将深度学习技术与多源目标检测相结合,提出了一种基于自适应注意力机制的目标检测方法。该方法首先以深度可分离卷积为核心构建双源特征提取结构,分别提取红外和可见光目标特征。其次,为充分互补目标多模态信息,设计了自适应注意力机制,以数据驱动的方式加权融合红外和可见光特征,保证特征充分融合的同时降低噪声干扰。最后,针对多尺度目标检测,将自适应注意力机制结合多尺度参数来提取并融合目标全局和局部特征,提升尺度不变性。通过实验表明,所提方法相较于同类型目标检测算法能够准确高效地在复杂场景下实现目标识别和定位,并且在实际变电站设备检测中,该方法也体现出更高的泛化性和鲁棒性,可以有效辅助机器人完成目标检测任务。  相似文献   

10.
针对安全帽佩戴检测任务中的小目标密集导致的遮挡和难以检测等问题,提出了一种基于YOLOX和transformer的安全帽佩戴检测算法。首先使用融合了CNN和transformer的网络swin Csp进行特征提取,提升模型获取全局上下文信息的性能;然后采用简化的重复加权双向特征金字塔网络BiFPN,使算法更好地融合不同尺度的特征;最后在neck和YOLO head的连接部分加入CBAM注意力机制,加强安全帽特征与位置信息的关联程度,进一步增强网络的性能和鲁棒性。基于SHWD数据集进行实验,结果表明,算法在hat类上提高了0.99%的精度,在两种类型的召回率上分别有3.16%和1.7%的提升,在mAP方面则有1.79%的提升,有效实现了快速且精度较高的安全帽佩戴检测。  相似文献   

11.
由于高光谱图像存在较高的数据维数,会给分类过程带来一些困难。为了提高分类的准确率,提出了一种使用3D卷积联合注意力机制的高光谱图像分类方法。首先,将中心像素与周围相邻的其它像素进行配对,可以通过配对构成多组新的像素对,充分利用了像素之间的邻域相关性。接着,将像素对放入3D卷积联合注意力机制网络框架中进行分类,它能够对高光谱图像中的特征进行选择性的学习。最后,通过投票策略获得像素标签。实验是在两个真实的高光谱图像数据集上进行。结果表明,所提出的方法充分挖掘了高光谱图像的光谱空间特征,能有效地提高分类精度。  相似文献   

12.
针对脑电信号的非平稳性、时变复杂和分类准确率较低的问题,以及传统机器学习方法在提取复杂特征方面的不足,提出了一种基于维度注意力机制的多尺度时空卷积神经网络分类模型(DIMS-CNN),旨在提高分类准确率,以更好地适用于实际应用场景。首先,对数据进行带通滤波和去伪迹,并进行了降采样和通道选择等预处理;随后,将经过处理的数据输入构建的时空卷积模型中,为了进一步增强网络的特征提取能力,加入了时序和通道的多维度注意力机制以及正则化技术;对于数据量不足的问题,采用了频带互换的方法进行数据增强,且提高了模型的泛化性能。分别在HGD数据集和实验室自采集数据集上进行验证,获得了90.97%和90.21%的平均分类准确率,发现所提方法在分类准确率上有显著提高。  相似文献   

13.
基于深度学习的目标检测算法相较于传统的目标检测算法,对复杂场景的稳健性更强,是当前研究的热点方向。根据基于深度学习的目标检测算法的流程特点将其分为两阶段目标检测算法和单阶段目标检测算法,着重介绍了部分经典算法所解决的问题及其优缺点,梳理了其在工业界的应用情况,对其存在的问题进行了讨论,对未来可能的发展趋势进行了展望。  相似文献   

14.
针对SSD(Single Shot MultiBox Detector)目标检测算法对小目标检测能力不足的问题,提出一种引入视觉机制和多尺度语义信息融合的VFF-SSD(Vision Feature Fusion SSD)改进算法。为了增大浅层网络的感受野提高特征提取能力,首先在SSD浅层特征层中加入视觉机制,然后利用改进PANet(Path Aggregation Network)多尺度特征融合网络与深层特征增强网络得到新的特征层,旨在增强浅层网络的语义信息并加强深层特征的特征表达能力,最后应用注意力机制模块提高对重要信息的学习能力。实验结果表明,在PASCAL VOC2007测试集检测的mAP(Mean Average Precision)值达到81.1%,对数据集中小目标的mAP值较原SSD提高了6.6%。  相似文献   

15.
为了解决自然场景文本检测中由于文本实例分布随机、形态与尺度多样造成的检测难题,设计了一种基于注意力机制特征融合与增强的自然场景文本检测算法。利用注意力机制对有效特征提取的优势,在模型的解码融合阶段设计并引入了一种基于注意力的特征融合模块(Attention-based Feature Fusion Module, AFFM),利用空间和通道注意力分别为高层特征和低层特征引入更丰富的细节和全局信息,进一步提高了检测的准确率;设计了联合注意力特征增强模块(Joint Attention Feature Enhancement Module, JAM),利用卷积对级联后的特征在不同通道之间、空间位置间的联系建模,并生成联合特征权重mask对级联特征做加权,从而提高信息的表征能力,有效减少误检与漏检。在Total-Text和ICDAR2015两个数据集上对模型做评估,测试结果表明,该方法的F1综合指标分别达到了85.1%和87.6%,均优于当前主流算法。  相似文献   

16.
提出一个新的基于轻量级注意力机制的网络框架。在YOLOv3主干网络的基础上,使用深度卷积和点卷积代替标准卷积设计特征提取网络,加快模型的训练,提高检测的速度,然后引入注意力机制模块进行模型速度和精度的权衡,最后通过增加多尺度提取更多网络层的特征信息,同时使用K-means++聚类算法进一步优化网络参数。实验结果表明,该方法可以显著提高人脸检测模型的性能,在Wider Face数据集上可以达到94.08%的准确率和83.97%的召回率,且平均检测时间只需0.022 s,相比原始YOLOv3算法提高了4.45倍。  相似文献   

17.
近年来,视觉里程计广泛应用于机器人和自动驾驶等领域,传统方法求解视觉里程计需基于特征提取、特征匹配和相机校准等复杂过程,同时各个模块之间要耦合在一起才能达到较好的效果,且算法的复杂度较高.环境噪声的干扰以及传感器的精度会影响传统算法的特征提取精度,进而影响视觉里程计的估算精度.鉴于此,提出一种基于深度学习并融合注意力机...  相似文献   

18.
针对工业生产复杂环境下,工件跟踪鲁棒性差且精确度低的问题,本文提出了一种基于重叠最大化精确跟踪算法(accurate tracking by overlap maximization,ATOM)的多注意力融合工件跟踪算法。该算法采用ResNet50为骨干网络,首先融入多注意力机制,使得网络更关注目标工件的关键信息;其次,使用注意力特征融合(attentional feature fusion,AFF)模块融合深层特征与浅层特征,更好地保留目标工件的语义与细节信息,以适应工业生产复杂多变的环境;最后将骨干网络第3层和第4层特征送入CSR-DCF分类器中,对得到的响应图进行融合,用以获取目标工件的粗略位置,通过状态估计网络获取精确目标框。实验表明,本文算法在OTB-2015数据集上的成功率(Success)与准确率(Precision)分别达到67.9%和85.2%;在VOT-2018数据集上的综合评分达到0.434,具有较高的精度和鲁棒性;在CCD工业相机拍摄的目标工件序列上,进一步验证了本文算法能高效应对工件跟踪过程中的常见挑战。  相似文献   

19.
岳冰莹  陈亮  师皓  盛青青 《信号处理》2022,38(1):128-136
近年来,深度学习方法在合成孔径雷达(SAR)图像目标检测中得到了广泛的应用.船舶出现在近海、港口、岛礁、远洋等各种场景中,同时海洋环境复杂多变,使得船舶目标检测很难排除混乱背景的干扰.对于大纵横比、任意方向、密集分布的目标,精确定位变得更加复杂.本文基于深度学习的方法提出用于SAR图像目标检测的改进RetinaNet模...  相似文献   

20.
进行单光子发射计算机断层成像(single-photon emission computed tomography, SPECT)骨显像检查时,为减少给病人带来的辐射伤害,医师常会减轻辐射剂量,导致骨显像信噪比、分辨率较低,严重影响诊断以及病灶自动检测效果。为提升骨显像质量,提出了一种基于U-Net的两阶段SPECT骨显像降噪方法。首先,设计了一种U-Net噪声估计网络来快速估计每张骨显像的噪声水平,为主干降噪网络提供噪声先验知识。其次,主干降噪网络同样以U-Net为基础框架,同时结合多尺度特征融合、通道-空间注意力机制结构来增强网络的噪声特征提取能力,预测出噪声图。最后,通过残差学习得到降噪骨显像。同时,为解决使用均方误差(mean square error,MSE)损失函数的重建图像过于平滑的问题,设计了一种复合损失函数,保留骨显像的原有细节信息。实验中,向训练集中的骨显像施加不同噪声水平进行数据扩充,并且采用迁移策略解决模型过拟合问题。结果表明,与目前主流算法相比,所提出的降噪方法能够有效降低骨显像噪声,并且保留病灶细节特征。此外,通过盲降噪能够改善原骨显像质量、提升病灶自动分割...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号