共查询到20条相似文献,搜索用时 62 毫秒
1.
为了提高Tiny YOLOV3目标检测算法在行人检测任务中的准确率,对该算法进行了研究改进。首先对Tiny YOLOV3的特征提取网络进行深化,增强网络特征提取能力;然后在预测网络的两个检测尺度分别加入通道域注意力机制,对特征图的不同通道赋予不同的权重,引导网络更多关注行人的可视区域;最后,改进激活函数和损失函数并采用K-means聚类算法重新选择初始候选框。实验结果表明,改进后Tiny YOLOV3算法的准确率在VOC2007行人子集上达到77%,较Tiny YOLOV3提高8.5%,在INRIA数据集上达到92.7%,提高2.5%,运行速度分别达到每秒92.6帧和31.2帧。本文方法提高了行人的检测精度,保持了较快的检测速度,满足实时性运行需求。 相似文献
2.
车辆检测是智能交通、无人驾驶等系统得以实现的重要支撑性技术。低精度或低速度的车辆检测器应用受限,因此提出了一种快速准确的车辆检测器。首先,前端特征提取网络VGG16由MobileNetV3_Large替代,减少了参数量和计算量,并增加了对高维特征的提取能力;其次,利用特征金字塔思想构建双向加权融合网络,有效融合不同尺度的特征,获取多维度的车辆特征;最后在特征提取层引入高效通道注意力,重新标定不同特征通道的重要性,进一步提高模型性能。与SSD相比,所提出的模型在KITTI数据集和BDD 100 K数据集上分别将平均精度提高了7.50%和3.50%,并具有实时检测能力(超过40 fps),在检测精度和速度方面有更好的平衡,说明了方法的有效性。 相似文献
3.
利用无人机对高压输电线路巡检,并基于计算机视觉技术对巡检数据中的故障目标进行自动、准确检测是输电线路巡检领域中的重要研究方向,同时也是一个极具挑战性的课题。针对复杂巡检环境中待检测目标存在多尺度特性以及部分遮挡造成传统算法难以准确检测问题,提出一种基于注意力机制与跨尺度特征融合的YOLOv5输电线路故障检测算法。首先,搭建YOLOv5检测网络,为了抑制复杂背景干扰,在其基础上引入空间与通道卷积注意力模型,以增强待检测故障目标的显著度;然后,将原始YOLOv5检测框架Neck中的FPN+PAN结构改为BiFPN结构,从而使目标多尺度特征能够有效融合;其次,为了解决待检测目标特征表达能力不足造成漏检和误检的问题,设计多尺度与同尺度特征的自适应加权融合模块,以增强检测网络对遮挡情况下故障目标的检测能力。最后,为了验证提出算法的有效性,利用某巡检部门近4年无人机巡检数据对算法进行验证。结果表明,提出的算法能够对复杂环境中输电线路上的多尺度故障目标实现精确检测,其平均检测精度可达96.8%。 相似文献
4.
铁路周边危岩落石侵入铁路限界内会严重危害旅客生命财产与铁路行车安全。针对传统检测方法对复杂动态环境识别误检高、小目标识别准确率较低等问题,提出一种基于视频的铁路落石侵限检测深度学习方法。首先,融合混合注意力模块,增强网络对与背景相似落石检测能力。其次,改进YoloX部分网络结构为双向特征金字塔网络,加强了不同层级特征的相互交流,提升小目标识别能力。同时采集大量不同场景模拟落石数据,构建模拟落石数据集,并在训练中使用Mosaic数据增强方法,增强方法的泛化能力。实验结果表明,本文方法随着改进模块的添加,识别精度不断提高。对比多种主流目标检测方法,取得了最高识别准确度,不同大小目标识别稳定,证明了本文算法在实际铁路场景的应用价值。 相似文献
5.
针对不同光照条件下的小目标交通标志检测存在的不易检测、错检等问题,提出了一种融合坐标注意力机制和双向加权特征金字塔(BiFPN)的YOLOv5s交通标志检测方法。首先,在特征提取网络中融入坐标注意力机制,提升网络对重要特征的关注程度,增加模型在不同光照条件下的检测能力;其次,在特征融合网络中使用BiFPN,提升模型的特征融合能力,改善对小目标交通标志的检测能力;最后,考虑到真实框与预测框之间的方向匹配问题,将CIoU损失函数改为SIoU损失函数,进一步提升模型的检测性能。在GTSDB数据集上进行验证,与原始模型相比,平均精度均值(mAP)提升了3.9%,推理时间为2.5 ms,能够达到实时检测的标准。 相似文献
6.
当前的研究中密集场景行人检测精度较低,为提高检测精度,提出一种基于YOLOv5网络的改进方法V-YOLO,采用加权双向特征金字塔网络(bi-directional feature pyramid network, BiFPN)改进原始网络中的路径聚合网络(path aggregation network, PANet),加强多尺度特征的融合能力,提高对行人目标的检测能力。为了保留更多的特征信息,提高主干网络的特征提取能力,添加残差结构VBlock;引入SKNet(select kernel networks)注意力机制,动态融合不同感受野的特征图,提高对不同行人特征的利用率。使用CrowdHuman数据集进行训练和测试,实验结果表明,所提出算法比原始网络的精确度、召回率和平均精度值分别提高1.8%、2.3%和2.6%,验证了所提出算法能有效的提高密集场景下行人目标检测的准确率。 相似文献
7.
针对传统云检测方法对特殊场景识别效果较差而造成的边缘信息丢失和薄云、碎云误判等问题,提出了一种基于多尺度特征融合与混合注意力的高精度云检测MSHA-DeepLab算法。首先,在原始DeepLabV3+算法的基础上引入注意力模块,提高重要特征权重,增强网络对局部特征的感受能力。其次,使用深度可分离卷积提取不同尺度的语义信息,减少网络参数量。最后,进行逐级上采样和特征融合,减少特征信息丢失。选择多种方法与改进算法对比,使用不同场景、不同波段组合的数据集进行测试。结果表明,改进后算法的精确率达到了86.376 9%,召回率达到了85.895 9%,特异性达到了96.915 6%,交并比达到了82.846 7%,精确度达到了94.600 8%,相比原始算法和其他方法有明显提高。验证了提出算法能在不同条件下实现高精度的云检测。 相似文献
8.
9.
针对钢材表面缺陷种类多,背景干扰强且尺度变化多样导致的检测效率低、精度差的问题,提出了一种钢材表面缺陷检测算法CBE YOLOv5。在YOLOv5算法基础上进行改进,通过主干采用坐标注意力机制,加强对目标的关注,提高特征提取能力;用BiFPN作为特征提取网络,给出有效的特征对应权重,以充分融合不同尺度的特征,并通过EIOU来计算模型损失,使模型能更精确的回归。在公开数据集NEU DET上的实验结果表明,CBE YOLOv5算法mAP为755%,较YOLOv5提高了38%,检测速度也高于一些常见的目标检测算法,能够更准确、更快速地检测到钢材表面的缺陷。 相似文献
10.
针对平板陶瓷膜表面缺陷实时检测时存在检测准确率较低的问题,本文提出了一种融合坐标注意力和自适应特征的YOLOv5陶瓷膜缺陷检测方法。通过在原有YOLOv5模型的主干网络中加入坐标注意力机制,建立位置信息和通道之间的关系,从而更准确地获取感兴趣区域。在原始网络的预测网络中融入自适应特征融合机制,提高模型对多尺度缺陷的检测能力。将空洞空间卷积池化金字塔模块替换原始网络中的空间金字塔池化模块,提高卷积核视野获取更多的有用信息。实验结果表明:本文模型平均精度为97.8%,检测帧数为32 FPS,平均精度与原始YOLOv5模型相比提高了5.5%。本文提出的模型在满足平板陶瓷膜缺陷的实时检测条件下,提高了模型的检测准确率,对推动平板陶瓷膜缺陷检测的发展具有一定的参考价值。 相似文献
11.
手和工具的交互是区分车间人员作业行为的关键信息。为防止泵件装配工序错漏,达到实时监测的目的,提出基于空间特征融合的车间作业工具检测算法。首先,为了提高对目标的定位能力和检测精度,基于帧差法分割前景中的手部运动区域,获得具有运动空间特征的纹理图像,结合装配过程的RGB图像构成目标检测网络的双通道输入。设计空间感知模块实现双通道输入的空间特征融合,获得全局空间信息。利用特征增强模块融合全局空间信息和深层语义信息,加强显著位置的特征响应。然后,采用ESNet(enhance shuffleNet)重构主干网络,基于深度可分离卷积实现多尺度特征提取,提高检测速度。最后,针对图像背景中局部元素变化问题,采用CutOut数据增强方法,提高模型抗干扰能力。实验结果表明,本文所提算法有效降低了误检率,较传统YOLOv5s的mAP提高6.4%,能够快速准确检测车间人员作业时使用的工具。 相似文献
12.
番茄产量受到病害、天气等因素的影响,其中番茄生长过程中叶片的病害问题是影响番茄产量的最关键因素。然而,在叶片病害检测领域,现有模型普遍存在泛化能力不足以及小病斑漏检率高等问题。提出一种改进的番茄病害早期检测算法,通过对YOLOv5s网络进行多方面的优化来改善这些问题,同时保持模型轻量化。首先,采用Mosaic 9数据增强技术,强化了模型对小病斑的检测能力,增加了图像背景的复杂度,提高了模型的泛化能力;其次,使用GSConv和Slim-Neck网络,在保持模型准确性的前提下轻量化模型,降低计算负担;同时,使用SimAM注意力机制更准确地捕捉叶片上的小病斑特征,从而降低漏检率;此外,为了进一步增强多尺度目标的检测能力,引入自适应空间特征融合,有效地整合不同尺度的特征,提升了多尺度目标,特别是小目标的检测准确性。实验结果表明:该模型在叶片病害早期检测方面表现出色,对叶霉、早疫、晚疫以及健康叶片四种番茄病害的早期平均识别准确率、召回率、F1分数及mAP分别达到了0.951%、0.918%、0.934%、0.948%。可见该方法对于小病斑具有较好的检测性能,改善了模型泛化能力不足及小病斑检测过程中的漏检问题,进一步提高了检测效果。 相似文献
13.
为了提高 CenterNet 无锚框目标检测网络的目标检测能力,提出一种基于注意力特征融合和多尺度特征提取网络的改
进 CenterNet 目标检测网络。 首先,为了提升网络对多尺度目标的表达能力,设计了自适应多尺度特征提取网络,利用空洞卷积
对特征图进行重采样获取多尺度特征信息,并在空间维度上进行融合;其次,为了更好地融合语义和尺度不一致的特征,提出了
一种基于通道局部注意力的特征融合模块,自适应地学习浅层特征和深层特征之间的融合权重,保留不同感受域的关键特征信
息。 最后,通过在 VOC 2007 测试集上对本文算法进行验证,实验结果表明,最终算法的检测精度达到 80. 94%,相较于基线算法
CenterNet 提升了 3. 82%,有效提升了无锚框目标检测算法的最终性能 相似文献
14.
随着深度学习理论的不断进步,端到端的立体匹配网络在自动驾驶和深度传感等领域取得了显著的成果。然而,最先进的立体匹配算法仍然无法精确恢复物体的边缘轮廓信息。为了提高视差预测的精度,在本研究中,提出了一种基于边缘检测与注意力机制的立体匹配算法。该算法从立体图像对中学习视差信息,并支持视差图和边缘图的端到端多任务预测。为了充分利用二维特征提取网络学习到的边缘信息,本算法提出了一种全新的边缘检测分支和多特征融合匹配代价卷。结果表明,基于本文模型的边缘检测方案有助于提高视差估计的精度,所获取的视差图在KITTI 2015测试平台上的误匹配率为1.75%,与金字塔立体匹配网络相比,视差图的精度提高了12%,且运行时间减少约20%。 相似文献
15.
针对复杂环境中动作识别易受到光照变化、目标旋转,遮挡等导致目标位置不精确,目标漂移以及识别错误等问题,提出了一种基于双特征融合与自适应提升的动作识别算法。首先,基于时空上下文(spatio-temporal context,STC)机制,通过时空上下文关系与视觉系统特性来提取图像序列特征,降低光照变化、遮挡对行为动作的影响;同时,利用卷积神经网络(convolution neural network,CNN)来处理图像序列,分别获得STC特征与CNN特征;其次,引入主成分分析算子,定义双特征融合规则,对获得STC特征与CNN特征进行组合,形成一种更准确、完整的特征表示;然后,通过得到的新特征,利用自适应提升算法(adaptive boosting algorithm,ABA)进行分类训练,完成对行为动作决策判断。在Weizmann、Hollywood数据集上测试表明,相对于当前常用的动作识别方法,所提算法对各种行为动作具有更高的识别精度与鲁棒性,更能适应复杂背景和动作变化。所提算法具有较高的人体动作识别精度,在视频监测、人机交互等领域具有一定的应用价值。 相似文献
16.
针对图片中小目标携带信息少、尺度变化大等检测难点,本文以YOLOv5s为框架,提出一种特征融合的小目标动态实时检测模型(HCD-YOLOv5s)。针对模型下采样易造成小目标信息丢失、深层网络位置信息表达不足等问题,从浅层中新增检测小目标的检测头;本文针对特征融合造成的特征混淆等问题,设计一种特征融合方式CCAT,减少检测层位置信息与语义信息的丢失;针对检测任务与数据分布不同适应的激活函数不一致,设计DConv模块,分离回归任务与检测任务,实现模型的动态检测。本文在VisDrone数据集上对模型进行消融实验,3个模块相互促进。选取不同输入尺寸的图片对模型进行速度与精度测试。在YOLOv5s的基础上HCD-YOLOv5s的mAP50提高了10.2%,检测精度与参数量明显优于YOLOv5m, FPS达到90。最后在DOTA-v1.0上进行实验验证,mAP50、mAP分别提升了1.8%与2.0%,证明本文提出的HCD-YOLOv5s在小目标检测上有更佳的性能。 相似文献
17.
无人机采集输电线路航拍图像由于其特殊性,往往背景复杂多变,检测目标存在尺度不一及部分遮挡等问题容易造成检测过程中误检、漏检。本文从特征融合角度出发,提出基于注意力特征融合YOLOv5模型的输电线路金具检测方法。首先,在主干提取网络中引入了具有自注意力机制的AFF-Transformer模块更好的捕获全局信息和上下文信息,提高主干网络特征提取能力。其次,通过在特征融合过程中使用通道空间注意力避免了关键信息丢失。最后,利用双向加权特征融合机制使得模型更有效的将浅层特征和深层特征进行融合,以上改进有效缓解了金具在密集状态下的误检、漏检等问题。通过在自建输电线路金具数据集上进行实验,结果表明:本文提出的方法在原YOLOv5模型的基础上准确率提升了2.7%,模型召回率提高了1.5%,针对于小目标,以及漏检、误检等问题有了较好的改善。 相似文献
18.
针对裂缝检测现有方法精度低、噪声多和细节丢失等问题,设计了一种基于并行提取和注意力融合网络的裂缝检测算法。首先,利用不同深度的多尺度卷积并联神经网络提取裂缝场景的高、低级特征;然后,为了提高检测精度,针对裂缝场景的特征,结合像素注意力机制对裂缝场景的高、低级特征进行有效融合,得到用于裂缝检测的有效融合特征;最后,利用非线性映射进行裂缝检测结果输出。实验结果表明,所提算法能够获得高精度检测结果的有效特征,裂缝检测结果细节更加清晰,且有监督学习方式在很大程度上消除了检测结果的噪声干扰,得到了视觉效果更佳的检测结果;所提算法在精确率和召回率等定量指标评价中同样具有良好的表现,裂缝检测精确率达到85%。 相似文献
19.
针对航拍图像目标尺度小、背景复杂、漏检和误检严重,提出了一种基于位置感知和跨层特征融合的航拍小目标检测算法DC-YOLOv8s。DC-YOLOv8s新增小目标检测层,增强对小目标尺度的敏感性,提高检测精度。为了减少特征信息的丢失,设计了跨层特征融合模块,充分融合小目标浅层语义信息和深层语义信息,丰富特征表示。改进C2f结构,结合可变性卷积设计了基于位置感知融入残差的感受野注意力模块,适应航拍小目标形状的变化,快速提取感受野特征,降低漏检和误检率。最后使用基于注意力机制的动态检测头在尺度感知、空间感知、任务感知方面提高复杂场景下小目标的定位性能。实验表明,在VisDrone2019数据集上,DC-YOLOv8s在P、R、mAP上相较于YOLOv8s分别提高了7.2%、7.5%、9.1%,显著提高了小目标检测的性能,FPS为71帧,满足实时性要求。在VOC2007+2012上进行模型泛化性实验验证,效果优于其他经典算法。 相似文献
20.
为了解决目前车道线检测过程中特征融合不充分、检测精确度低和鲁棒性差的问题, 本文提出一种融合多分支结构和注意力机制的车道线检测模型 (fusion of multi-branch structure and attention mechanism network,FMANet), 图像编码部分采用多分支结构和注意力机制, 并选择 swish 作为激活函数, 图像解码部分采用跳跃连接结构, 实现跨层特征融合。 本文利用TuSimple 公开数据集对 FMANet 模型进行评估与验证, 实验结果表明, 本文所提的 FMANet 模型的 mAP 指标接近 97. 25%, 车道线检测精确度达到 98. 15%, 此外,通过 CULane 数据集验证 FMANet 模型在不同场景下的检测具有更好的鲁棒性。 相似文献