首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对不同光照条件下的小目标交通标志检测存在的不易检测、错检等问题,提出了一种融合坐标注意力机制和双向加权特征金字塔(BiFPN)的YOLOv5s交通标志检测方法。首先,在特征提取网络中融入坐标注意力机制,提升网络对重要特征的关注程度,增加模型在不同光照条件下的检测能力;其次,在特征融合网络中使用BiFPN,提升模型的特征融合能力,改善对小目标交通标志的检测能力;最后,考虑到真实框与预测框之间的方向匹配问题,将CIoU损失函数改为SIoU损失函数,进一步提升模型的检测性能。在GTSDB数据集上进行验证,与原始模型相比,平均精度均值(mAP)提升了3.9%,推理时间为2.5 ms,能够达到实时检测的标准。  相似文献   

2.
无人机采集输电线路航拍图像由于其特殊性,往往背景复杂多变,检测目标存在尺度不一及部分遮挡等问题容易造成检测过程中误检、漏检。本文从特征融合角度出发,提出基于注意力特征融合YOLOv5模型的输电线路金具检测方法。首先,在主干提取网络中引入了具有自注意力机制的AFF-Transformer模块更好的捕获全局信息和上下文信息,提高主干网络特征提取能力。其次,通过在特征融合过程中使用通道空间注意力避免了关键信息丢失。最后,利用双向加权特征融合机制使得模型更有效的将浅层特征和深层特征进行融合,以上改进有效缓解了金具在密集状态下的误检、漏检等问题。通过在自建输电线路金具数据集上进行实验,结果表明:本文提出的方法在原YOLOv5模型的基础上准确率提升了2.7%,模型召回率提高了1.5%,针对于小目标,以及漏检、误检等问题有了较好的改善。  相似文献   

3.
针对平板陶瓷膜表面缺陷实时检测时存在检测准确率较低的问题,本文提出了一种融合坐标注意力和自适应特征的YOLOv5陶瓷膜缺陷检测方法。通过在原有YOLOv5模型的主干网络中加入坐标注意力机制,建立位置信息和通道之间的关系,从而更准确地获取感兴趣区域。在原始网络的预测网络中融入自适应特征融合机制,提高模型对多尺度缺陷的检测能力。将空洞空间卷积池化金字塔模块替换原始网络中的空间金字塔池化模块,提高卷积核视野获取更多的有用信息。实验结果表明:本文模型平均精度为97.8%,检测帧数为32 FPS,平均精度与原始YOLOv5模型相比提高了5.5%。本文提出的模型在满足平板陶瓷膜缺陷的实时检测条件下,提高了模型的检测准确率,对推动平板陶瓷膜缺陷检测的发展具有一定的参考价值。  相似文献   

4.
在道路交通摩托车事故中,未佩戴头盔是导致骑乘人员受到致命伤害的主要原因。针对目前头盔检测中由于黑色头发、帽子和头盔的颜色和形状相似存在误检和漏检问题,提出了一种具有三重注意力机制和双向跨尺度特征融合的摩托车头盔检测算法。首先,在YOLOV5s的主干网络中引入三重注意力机制,提取了不同维度之间的语义依赖,消除了通道和权重的间接对应关系,通过关注相似样本的差异从而提升检测精度。其次,采用EIOU边框损失函数优化对遮挡和重叠目标的检测效果。最后,在特征金字塔中采用加权双向特征金字塔网络结构,实现高效的双向跨尺度连接和加权特征融合,增强了网络特征提取能力。实验结果表明,改进算法实现了98.7%的mAP@0.5、94.0%的mAP@0.5:0.95,与原算法相比,改进算法的mAP@0.5提升了3.9%以及mAP@0.5:0.95提升了7.6%,具有更高的精度和更强的泛化能力。  相似文献   

5.
为了解决矿井复杂环境下,缺陷特征提取不充分问题,融合特征增强和级联注意力机制提出一种快速智能的罐道缺陷识别算法RDM-YOLOv5,旨在解决人工巡检效率低的现状。首先,为了提高主干网络特征图信息表征能力,设计特征增强模块RLKM,它通过重参数化大内核卷积增强主干网络对目标特征的提取能力,并且有效降低模型参数量;然后,经过主干网络提取到高低层级特征后,由设计的级联注意力机制DCAM进一步挖掘缺陷目标的深层语义信息,显著增强小目标的特征信息;最后,为提升检测精度的同时保障检测网络的轻量化,在特征增强网络中引入轻量级卷积GSConv,在保持模型检测准确性的同时降低计算成本。实验结果表明,相较于YOLOv5s, RDM-YOLOv5的检测精度和速度分别提高3.7%、11.4%,模型参数量减少15.4%。它能基本满足实际应用中精准识别和快速定位罐道表面缺陷的需求。  相似文献   

6.
利用无人机对高压输电线路巡检,并基于计算机视觉技术对巡检数据中的故障目标进行自动、准确检测是输电线路巡检领域中的重要研究方向,同时也是一个极具挑战性的课题。针对复杂巡检环境中待检测目标存在多尺度特性以及部分遮挡造成传统算法难以准确检测问题,提出一种基于注意力机制与跨尺度特征融合的YOLOv5输电线路故障检测算法。首先,搭建YOLOv5检测网络,为了抑制复杂背景干扰,在其基础上引入空间与通道卷积注意力模型,以增强待检测故障目标的显著度;然后,将原始YOLOv5检测框架Neck中的FPN+PAN结构改为BiFPN结构,从而使目标多尺度特征能够有效融合;其次,为了解决待检测目标特征表达能力不足造成漏检和误检的问题,设计多尺度与同尺度特征的自适应加权融合模块,以增强检测网络对遮挡情况下故障目标的检测能力。最后,为了验证提出算法的有效性,利用某巡检部门近4年无人机巡检数据对算法进行验证。结果表明,提出的算法能够对复杂环境中输电线路上的多尺度故障目标实现精确检测,其平均检测精度可达96.8%。  相似文献   

7.
针对传统水下图像检测方式易受水中光线、复杂环境的影响,造成水下目标识别精度不高,泛化性较差的问题,提出了一种改进YOLOv5s的水下目标检测算法。首先引入了Double MSRCR算法,解决了水下物体清晰度低,特征模糊的问题。在网络结构方面,主干网络引入C_VAN模块,提升了神经网络特征提取能力;其次在颈部网络中,引入RFB_S感受野,增强神经网络的多尺度适应能力;最后引入NAMAttention空间与通道注意力机制,增强网络上下文特征的表达能力。所提方法相较于Faster-RCNN检测精确度提高了6.5%,相较于YOLOv4检测精确度提高了4.1%,相较于YOLOv5s检测精确度提高2.7%,检测速度提升了56.34 fps,证明了方法适用于实时水下检测任务。  相似文献   

8.
针对煤矿电力设备缺陷检测精度低的问题,提出了一种基于改进YOLOv5s的煤矿电力设备缺陷检测的方法。该方法主要包括3个方面的改进:首先,提出了一种多分支的坐标注意力模块,增强了模型获得缺陷区域信息的能力;其次,提出了一种特征融合网络模块,通过将主干网络和颈部网络之间非相邻的特征信息进行跨层连接,进一步增强了模型的特征表达及融合能力;最后,提出了一种快速空间金字塔池化平均池化模块,并将其嵌入颈部网络的路径融合网络之间,以提升网络浅层定位信息传递到深层的能力。实验结果表明,改进YOLOv5s模型的mAP@0.5提升了3.1%,F1分值提升了3%,满足煤矿电力设备缺陷的检测需求且具有更高的检测精度。  相似文献   

9.
为了提高疲劳驾驶检测过程中面部特征识别的连续检测性和鲁棒性,降低车载终端的配置需求,设计了一种轻量化的人脸检测跟踪方法用于驾驶员疲劳检测。首先,采用MobileNetv3-Small作为面部特征提取主干轻量化网络模型,引入简单无参数注意力模块(simple, parameter-free attention module, SimAM)和深度超参数化卷积(depthwise over-parameterized convolutional, DOConv)构建特征映射和轻量化特征增强模块深度优化和关注人脸区域信息。然后融合DeepSort进行连续分类跟踪,优化面部遮挡对检测性能的影响。接着将人脸特征检测和关键点结合,根据单位时间内眼睛闭合时间百分比(percentage of eyelid closure over the pupil over time, PERCLOS)疲劳阈值、连续闭眼帧数和打哈欠总数判别疲劳驾驶。实验结果表明,模型的平均精度均值和查全率达到了98.9%和97.2%,提高了1.8%和6.3%;同时,浮点运算量仅为基准模型的28.3%,模型体积仅为7 MB。最终得出...  相似文献   

10.
针对裂缝检测现有方法精度低、噪声多和细节丢失等问题,设计了一种基于并行提取和注意力融合网络的裂缝检测算法。首先,利用不同深度的多尺度卷积并联神经网络提取裂缝场景的高、低级特征;然后,为了提高检测精度,针对裂缝场景的特征,结合像素注意力机制对裂缝场景的高、低级特征进行有效融合,得到用于裂缝检测的有效融合特征;最后,利用非线性映射进行裂缝检测结果输出。实验结果表明,所提算法能够获得高精度检测结果的有效特征,裂缝检测结果细节更加清晰,且有监督学习方式在很大程度上消除了检测结果的噪声干扰,得到了视觉效果更佳的检测结果;所提算法在精确率和召回率等定量指标评价中同样具有良好的表现,裂缝检测精确率达到85%。  相似文献   

11.
手和工具的交互是区分车间人员作业行为的关键信息。为防止泵件装配工序错漏,达到实时监测的目的,提出基于空间特征融合的车间作业工具检测算法。首先,为了提高对目标的定位能力和检测精度,基于帧差法分割前景中的手部运动区域,获得具有运动空间特征的纹理图像,结合装配过程的RGB图像构成目标检测网络的双通道输入。设计空间感知模块实现双通道输入的空间特征融合,获得全局空间信息。利用特征增强模块融合全局空间信息和深层语义信息,加强显著位置的特征响应。然后,采用ESNet(enhance shuffleNet)重构主干网络,基于深度可分离卷积实现多尺度特征提取,提高检测速度。最后,针对图像背景中局部元素变化问题,采用CutOut数据增强方法,提高模型抗干扰能力。实验结果表明,本文所提算法有效降低了误检率,较传统YOLOv5s的mAP提高6.4%,能够快速准确检测车间人员作业时使用的工具。  相似文献   

12.
一种基于特征融合的点特征目标跟踪算法   总被引:8,自引:2,他引:6  
联合目标的颜色和纹理特征,构造了由目标的颜色和纹理特征联合表示的特征点目标表示模型,利用Mahalanobis距离构造特征点匹配函数,利用自适应kalman滤波(AKF)算法预测特征点在下一帧图像中的位置,通过特征点匹配准确定位目标,达到实时、准确跟踪的目的。实验表明,该方法对于光线变化,目标形状相似以及目标被部分遮挡时的跟踪是有效和稳健的。  相似文献   

13.
行人重识别在交通管理、寻找走失人口等范畴用途较广。现有算法难以处理人体姿势改变、遮挡和特征不对齐的问题,提出一种姿势引导和特征融合的行人重识别算法。所提出的算法包括3个分支,包括全局分支、基于姿势估计引导的全局分支、局部对齐分支。全局分支提取行人的全局特征,可以捕捉行人的粗粒度信息以及整体的上下文关系。基于姿势估计引导的全局分支利用姿势估计网络引导模型关注行人的全局可见区域,降低遮挡物对行人识别的干扰。局部对齐分支利用姿势估计算法构成对齐的局部特征,同时区分可见的局部区域,以降低遮挡以及姿势变化的影响。通过多分支结构,将局部特征和全局特征融合,以加强特征的多元化,增强模型的鲁棒性。最终,利用交叉熵和软边界三元损失进行模型训练。Market-1501和DukeMTMC-ReID数据集上的测试结果效验了所提算法的可行性,其间,DukeMTMC-ReID数据集的Rank-1、mAP各达成了91.2%、81.8%,具有较佳的实用性。  相似文献   

14.
为实现遭受重大火灾等灾害后,对伤员皮肤烧伤自动化分级,加快诊断效率,提出提出一种用于皮肤烧伤分类的轻量化模型BI-YOLOv5算法。替换Swish激活函数,提高模型收敛能力及检测效率;使用K-means++算法对anchors聚类分析,增强对不同尺度目标的适应能力;修改特征提取网络,提取多个尺度的特征信息,建立多尺度特征融合网络,提高模型对深层特征信息的利用率,提高小面积烧伤的识别精度。实验结果表明,BI-YOLOv5算法在检测并区分不同烧伤类别及环境干扰下烧伤检测有较高的精度和效率,mAP达到97.6,对比YOLOv5提升8.4个百分点。  相似文献   

15.
CT血管造影(computed tomography angiography,CTA)作为一种无创、检测精确较高的辅助诊断方法,尚急需能有效消除冠脉目标附近干扰噪声并寻求可全自动快速准确追踪目标的新算法以大幅减轻医生阅片压力、辅助其进行可靠诊断与治疗.提出了一种特征融合的误差最小平方和(minimum output s...  相似文献   

16.
为了提高 CenterNet 无锚框目标检测网络的目标检测能力,提出一种基于注意力特征融合和多尺度特征提取网络的改 进 CenterNet 目标检测网络。 首先,为了提升网络对多尺度目标的表达能力,设计了自适应多尺度特征提取网络,利用空洞卷积 对特征图进行重采样获取多尺度特征信息,并在空间维度上进行融合;其次,为了更好地融合语义和尺度不一致的特征,提出了 一种基于通道局部注意力的特征融合模块,自适应地学习浅层特征和深层特征之间的融合权重,保留不同感受域的关键特征信 息。 最后,通过在 VOC 2007 测试集上对本文算法进行验证,实验结果表明,最终算法的检测精度达到 80. 94%,相较于基线算法 CenterNet 提升了 3. 82%,有效提升了无锚框目标检测算法的最终性能  相似文献   

17.
针对传统人体行为识别算法不能有效抑制空间背景信息,网络间缺乏信息交互,以及无法对全局时间相关性进行建模的问题,提出一种基于分割注意力的特征融合卷积神经网络-双向长短时记忆网络(CNN-Bi-LSTM)人体行为识别算法。首先以一定采样率采样30帧图像,通过分割注意力网络提取图像的深度特征,并引入特征融合机制增强不同卷积层间的信息交互;然后将深度特征输入到Bi-LSTM网络对人体动作的长时时间信息建模,最后使用Softmax分类器对识别结果进行分类。相较于传统双流卷积网络,该算法在UCF101和HMDB51数据集上的准确率分别提高了6.6%和10.2%,有效提高了识别准确率。  相似文献   

18.
针对城市街景数据集中存在小目标和大量长条形状物体,分割难度大,虽然目前编码解码结构的网络能细化分割结果,但大多数都没有充分利用空间和上下文信息,因此本文提出一种基于像素注意力特征融合的语义分割算法。首先以ResNet50作为骨干网络,利用空洞空间卷积池化金字塔和条状池化进行初步特征融合,获得多尺度特征的同时规避无用信息;然后利用像素融合注意力模块,聚合上下文信息并恢复空间信息,最后利用注意力特征细化模块消除冗余信息。该算法在CamVid数据集上进行实验,结果表明该算法在验证集上能达到75.22%的mIoU,在测试集上也能达到67.21%。相比于DeepLabv3+网络分别提升了2.51%和2.86%。  相似文献   

19.
针对行星齿轮箱振动信号相互耦合和故障诊断不准确等问题,提出一种基于特征融合与深度残差网络(ResNet)的行星齿轮箱故障诊断方法。首先,对采集到的行星轮裂纹、磨损,太阳轮断齿及复合故障等模拟故障振动信号应用多维集成经验模态分解(MEEMD)和VMD进行分解,分别筛选确定有效分量。然后,将筛选出的有效特征进行融合,分别应用传统卷积神经网络(CNN)和深度残差网络对其进行分类识别。结果发现,深度残差网络,分类准确度更高,可达95%以上。最后,应用深度残差对特征融合前后数据的分类准确度进行了比较。融合前准确度最高只达91.16%,低于融合的97.18%。可见,该方法对行星齿轮箱耦合振动信号的处理和故障诊断非常有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号