首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
YOLOv4目标检测算法主干网络庞大且参数量和计算量过多,难以部署在算力和存储资源有限的移动端嵌入式设备上。提出一种改进的YOLOv4目标检测算法,使用轻量化的ShuffleNet V2网络作为主干特征提取网络,更换模型激活函数及扩大卷积核,同时将YOLOv4网络中的普通卷积替换为深度可分离卷积,降低算法参数量、计算量和模型占用空间。在ShuffleNet V2网络结构的改进过程中分析并剪裁其基本组件,利用2个3 × 3卷积核级联的方式增强网络感受野,并使用Mish激活函数进一步提升网络检测精度和模型推理速度。在GPU平台和VisDrone 2020数据集上的实验结果表明,与YOLOv4算法相比,改进的YOLOv4算法在牺牲1.8个百分点的检测精度情况下,提高了27%的检测速度,压缩了23.7%的模型容量,并且能够充分发挥ZYNQ平台并行高速数据处理及低功耗的优势。  相似文献   

2.
王程  刘元盛  刘圣杰 《计算机工程》2023,49(2):296-302+313
行人检测在无人驾驶环境感知领域具有重要应用。现有行人检测算法多数只关注普通大小的行人目标,忽略了小目标行人特征信息过少的问题,从而造成检测精度低、应用于嵌入式设备中实时性不高等情况。针对该问题,提出一种小目标行人检测算法YOLOv4-DBF。引用深度可分离卷积代替YOLOv4算法中的传统卷积,以降低模型的参数量和计算量,提升检测速度和算法实时性。在YOLOv4骨干网络中的特征融合部分引入scSE注意力模块,对输入行人特征图的重要通道和空间特征进行增强,促使网络学习更有意义的特征信息。对YOLOv4颈部中特征金字塔网络的特征融合部分进行改进,在增加少量计算量的情况下增强对图像中行人目标的多尺度特征学习,从而提高检测精度。在VOC07+12+COCO数据集上进行训练和验证,结果表明,相比原YOLOv4算法,YOLOv4-DBF算法的AP值提高4.16个百分点,速度提升27%,将该算法加速部署在无人车中的TX2设备上进行实时测试,其检测速度达到23FPS,能够有效提高小目标行人检测的精度及实时性。  相似文献   

3.
传统的煤矸图像检测方法需要人工提取图像特征,准确率不高,实用性不强。现有基于改进YOLO的煤矸目标检测方法在速度和精度方面有所提升,但仍不能很好地满足选煤厂带式输送机实时智能煤矸分选需求。针对该问题,在YOLOv5s模型基础上进行改进,构建了YOLOv5s-SDE模型,提出了基于YOLOv5s-SDE的带式输送机煤矸目标检测方法。YOLOv5s-SDE模型通过在主干网络中添加压缩和激励(SE)模块,以增强有用特征,抑制无用特征,改善小目标煤矸检测效果;利用深度可分离卷积替换普通卷积,以减少参数量和计算量;将边界框回归损失函数CIoU替换为EIoU,提高了模型的收敛速度和检测精度。消融实验结果表明:YOLOv5sSDE模型对煤矸图像的检测准确率达87.9%,平均精度均值(mAP)达92.5%,检测速度达59.9帧/s,可有效检测煤和矸石,满足实时检测需求;与YOLOv5s模型相比,YOLOv5s-SDE模型的准确率下降2.3%,mAP提升1.3%,参数量减少22.2%,计算量下降24.1%,检测速度提升6.4%。同类改进模型对比实验结果表明,YOLOv5s-STA与YOLOv5s-Gho...  相似文献   

4.
为了进一步提高多尺度目标检测的速度和精度,解决小目标检测易造成的漏检、错检以及重复检测等问题,提出一种基于改进YOLOv3的目标检测算法实现多尺度目标的自动检测。首先,在特征提取网络中对网络结构进行改进,在残差模块的空间维度中引入注意力机制,对小目标进行关注;然后,利用密集连接网络(DenseNet)充分融合网络浅层信息,并用深度可分离卷积替换主干网络中的普通卷积,减少模型的参数量,提升检测速率。在特征融合网络中,通过双向金字塔结构实现深浅层特征的双向融合,并将3尺度预测变为4尺度预测,提高了多尺度特征的学习能力;在损失函数方面,选取GIoU(Generalized Intersection over Union)作为损失函数,提高目标识别的精度,降低目标漏检率。实验结果表明,基于改进YOLOv3(You Only Look Once v3)的目标检测算法在Pascal VOC测试集上的平均准确率均值(mAP)达到83.26%,与原YOLOv3算法相比提升了5.89个百分点,检测速度达22.0 frame/s;在COCO数据集上,与原YOLOv3算法相比,基于改进YOLOv3的目标检测算法在mAP上提升了3.28个百分点;同时,在进行多尺度的目标检测中,算法的mAP有所提升,验证了基于改进YOLOv3的目标检测算法的有效性。  相似文献   

5.
针对YOLOv4网络模型参数量大,难以在资源有限的设备平台上运行的问题,提出一种对YOLOv4轻量化的车辆和行人检测网络。以MobileNetV1为主干网络,将PANet和YOLO Head结构中的标准卷积替换成深度可分离卷积,减少模型参数量;同时利用跨深度卷积结合不同膨胀率的空洞卷积构建特征增强模块,改善不同预测层对车辆和行人尺度变化的适应能力,提高网络的检测精度。实验结果表明,上述网络模型大小为45.28MB,检测速度为44FPS,相比YOLOv4模型大小减少81.44%,检测速度提升91.30%,在PASCAL VOC2007测试集上,检测精度达到86.32%,相比MobileNetV1-YOLOv4原网络提高1.29%的精确度,能够满足实时高效的检测要求。  相似文献   

6.
针对当前YOLOv4目标检测算法网络模型庞大、特征提取不充分且易受光线环境影响的缺点,提出了一种优化了特征提取网络和一般卷积块的轻量化YOLOv4-Lite网络模型。使用改进的MobileNetv3替换原有的主干特征提取网络,减小了网络模型的参数量,提高了检测精度。提出了使用深度可分离卷积块代替原网络中的普通卷积块,使得模型的参数量进一步降低。结合了标签平滑、学习率余弦退火衰减算法,新增了SiLU激活函数代替MobileNetv3浅层网络的ReLU激活函数,优化了模型的收敛效果。优化了Mosaic数据增强方法,提升了模型的鲁棒性。在人脸口罩佩戴任务中与原算法相比,牺牲了1.68%的mAP,但在检测效率(FPS)上提升约180%。  相似文献   

7.
基于改进YOLOv4算法的轻量化网络设计与实现   总被引:2,自引:0,他引:2  
在嵌入式设备上进行目标检测时易受能耗和功耗等限制,使得传统目标检测算法效果不佳。为此,对YOLOv4算法进行优化,设计YOLOv4-Mini网络结构,将其特征提取网络由CSPDarkNet53改为MobileNetv3-large并进行INT8量化处理,其中网络结构利用PW和DW卷积操作代替传统卷积操作以大幅减少计算量。采用SE模块为通道施加注意力机制,激活函数层运用h-swish非线性激活函数,在保证精度的情况下降低网络计算量。同时,通过量化感知训练将权重转为INT8类型,以实现模型轻量化,进一步降低网络参数量和计算量,从而在嵌入式设备上完成无人机数据集的目标检测任务。在NVIDIA Jetson Xavier NX设备上进行测试,结果显示,YOLOv4-MobileNetv3网络的mAP为34.3%,FPS为30,YOLOv4-Mini网络的mAP为32.5%,FPS为73,表明YOLOv4-Mini网络能够在低功耗、低能耗的嵌入式设备上完成目标实时检测任务。  相似文献   

8.
针对当前YOLOv4目标检测网络结构复杂、参数多、训练所需的配置高以及实时检测每秒传输帧数(FPS)低的问题,提出一种基于YOLOv4的轻量化目标检测算法ML-YOLO。首先,用MobileNetv3结构替换YOLOv4的主干特征提取网络,从而通过MobileNetv3中的深度可分离卷积大幅减少主干网络的参数量;然后,用简化的加权双向特征金字塔网络(Bi-FPN)结构替换YOLOv4的特征融合网络,从而用Bi-FPN中的注意力机制提高目标检测精度;最后,通过YOLOv4的解码算法来生成最终的预测框,并实现目标检测。在VOC2007数据集上的实验结果表明,ML-YOLO算法的平均准确率均值(mAP)达到80.22%,与YOLOv4算法相比降低了3.42个百分点,与YOLOv5m算法相比提升了2.82个百分点;而ML-YOLO算法的模型大小仅为44.75 MB,与YOLOv4算法相比减小了199.54 MB,与YOLOv5m算法相比,只高了2.85 MB。实验结果表明,所提的ML-YOLO模型,一方面较YOLOv4模型大幅减小了模型大小,另一方面保持了较高的检测精度,表明该算法可以满足移动端或者嵌入式设备进行目标检测的轻量化和准确性需求。  相似文献   

9.
针对移动端目标检测算法需要模型参数量与计算量更少、推理速度更快和检测效果更好以及目标检测算法对于小目标误检、漏检及特征提取能力不足等问题, 提出一种基于YOLOv5改进的轻量化目标检测算法. 该算法使用轻量级网络MobileNetV2作为目标检测算法的骨干网络降低模型的参数量与计算量, 通过使用深度可分离卷积结合大卷积核的思想降低网络的计算量与参数量, 并提升了小目标的检测精度. 使用GhostConv来替换部分普通卷积, 进一步降低参数量与计算量. 本文算法在VOC竞赛数据集, COCO竞赛数据集两份数据集上均进行了多次对比实验, 结果表明本文算法相比于其他模型参数量更小、计算量更小、推理速度更快以及检测精度更高.  相似文献   

10.
在硬件平台受限条件下,为提高智能车的性能,权衡实时识别交通标志的精度和速度,在YOLOv5的基础上,提出了针对嵌入式边缘设备的智能车交通标志识别的YOLOv5s_ghost_bi_sa算法。使用GhostConv替代部分普通卷积,在减少卷积结构参数的同时提高网络的拟合能力;添加置换注意力机制(Shuffle Attention, SE),在空间注意力与通道注意力的基础上加入了特征分组与通道置换,提高对小目标的关注度;采用加权双向特征金字塔网络结构,加强特征融合。由华为ModelArts平台协同Hilens_kit设备收集制作数据集,实验结果表明:针对数据集大图像中的小目标采用双向跨尺度连接,将表层特征与深层特征融合配合注意力机制增加重要特征的权重,从而提高算法对于小目标检测的精度,YOLOv5s_ghost_bi_sa算法的mAP0.5达到98.8%,召回率达到0.979%,模型大小仅为11.6MB,Hilens_kit平台上预测速度为62帧/秒。在相同的测试环境下与原YOLOv5s算法相比,精度高出0.8%,浮点运算量下降58%,模型体积压缩4.6倍,预测速度提升2.7倍。YOLOv5s_ghost_bi_sa算法可以有效地实现智能车交通标志的实时识别。  相似文献   

11.
针对现有基于深度学习的电铲检测方法未能很好地平衡检测速度与检测精度的问题,提出了一种改进YOLOv7模型,并将其用于矿用电铲检测。该模型以YOLOv7模型为基础,在主干网络中采用轻量化GhostNet网络进行特征提取,在颈部网络中采用轻量级GSConv替换部分普通卷积,以减少模型参数量和计算量,提高模型检测速度;考虑到轻量化改进后模型参数量减少对特征信息提取能力的影响,在不增加计算量的前提下,对颈部网络进行进一步改进,在扩展高效层聚合网络(ELAN)中嵌入坐标注意力机制(CA),同时利用双向特征金字塔网络(BiFPN)改进路径聚合网络(PANet),以提高网络对特征信息的提取能力,进而有效提高模型检测精度。实验结果表明,与YOLOv7模型相比,改进YOLOv7模型的参数量减少了75.4%,每秒浮点运算次数减少了82.9%,检测速度提高了24.3%;相较于其他目标检测模型,改进YOLOv7模型在检测速度和检测精度方面取得了良好的平衡,满足在露天煤矿场景下对电铲进行实时、准确检测的需求,为嵌入到移动设备中提供了有利条件。  相似文献   

12.
为解决YOLOv4在目标检测任务中检测速度低、模型参数多等问题,提出一种改进YOLOv4的目标检测算法。将YOLOv4主干网络中的CSPDarknet53替换成Mobilenet用以增强YOLOv4的特征提取网络,PANet原有的3×3标准卷积被深度可分离卷积取代,以降低计算负荷,从而提高识别速度,减少模型参数。然后使用K-means+〖KG-*3〗+算法对由8565张图像组成的数据集进行anchor维度聚类,以提升算法精度。同时,搭建行人口罩佩戴及人体测温拍摄系统用以在人群密集场所中执行疫情防控任务。在保证YOLOv4-Mobilenet网络精度的前提下,相较于原算法FPS提升200%、模型参数减少82%。改进后的模型平均每秒可检测67张图片,可以胜任实际应用中的口罩佩戴检测任务,结果表明该模型检测效果好、鲁棒性较强。  相似文献   

13.
为有效解决遥感图像目标检测算法在复杂背景下的检测效果不佳的问题,提出一种改进YOLOv4的目标检测算法。设计一种跨阶段残差结构,替换原主干网络的简单残差结构,降低模型参数量和计算负担;引入CBAM注意力机制,加强CSP模块间有效特征交互;使用跨阶段分层卷积模块重构特征融合阶段对深层特征图的处理方式,防止网络退化和梯度消失;采用Mish激活函数,增强融合网络对非线性特征的提取能力。在RSOD、DIOR数据集上的实验结果表明,改进YOLOv4算法的测试mAP相比原YOLOv4算法分别高出4.5%、7.3%,其检测速度分别达到48 fps、45 fps,在保证实时性的同时检测精度有较大提升。  相似文献   

14.
针对YOLOv4模型在目标检测过程中参数量和计算量较大而导致实时性不佳的问题,提出了一种轻量化模型L-YOLOv4(Light YOLOv4)。该模型以YOLOv4特征金字塔结构和多尺度检测为基础,对模型结构进行了整体的优化和改进,采用MobileNetV2网络代替主干特征提取网络,同时用深度可分离卷积替换加强特征提取网络的普通卷积,从而达到减少网络参数量的目的。实验时对UA-DETRAC车辆数据集进行了基于旋转不变性下的数据增强,以缩小图像预测框与真实框之间的误差。多模型对比实验结果表明,L-YOLOv4模型相较于其他常用的轻量级检测模型有着更小的参数量和更快的FPS,与YOLOv4模型相比,参数量减少了83.21%,FPS增加了11帧,并减少了车辆漏检情况。  相似文献   

15.
随着深度学习的发展,神经网络模型的体积越来越大,伴随而来的是参数量与计算量的增多,但实际安全帽检测环境下需要把网络模型部署在算力有限的移动端或嵌入式设备中,而这些设备无法支持复杂的计算量。针对这个问题,提出了一种适合部署在移动设备的轻量级目标检测网络HourGlass-YOLO(HG-YOLO)。以YOLOv5为基础模型,基于Inverted Resblock结构重构了新的主干特征提取网络HourGlass;并使用通道剪枝技术,对BatchNormalization(BN)层进行稀疏训练,将权值较小的通道进行删减,在保证精度的情况下,减少模型的参数;融合卷积层和BN层来加快在CPU上的推理速度。实验结果表明HG-YOLO在保证精度的情况下,将YOLOv5模型的体积压缩87%、浮点数减少86%、参数量降低89%,相比SSD在检测速度上快了8.2倍,更适合实际工业场景中的部署。  相似文献   

16.
为了实现准确、高效的麦穗计数,提出一种基于改进YOLOv5模型的麦穗检测算法。在YOLOv5的特征增强部分添加卷积块注意力模块,提高模型对特征的表达能力,使其更加关注待检测目标的位置信息。此外,结合GhostNet模块,达到有效降低模型的参数量并提升算法性能的效果。改进后的算法在Global Wheat2020数据集上能达到92.3%的检测精度,相对于原来的YOLOv5s在精度上提高了1.3个百分点,同时检测速度也获得17.6%的提升,在麦穗检测中表现出了更优秀的性能。  相似文献   

17.
针对将深度学习用于工件检测环境中计算资源受限的问题,提出了一种基于改进YOLOv4的工件表面缺陷检测方法。首先,使用轻量化网络模型MobileNetV2替换YOLOv4原有的主干特征提取网络,并使用深度可分离卷积替换掉YOLOv4中使用的3×3标准卷积,大幅减小模型的参数规模,提升模型的检测速度;其次,提出一种图像预处理方法,在输入检测网络前定位并裁取出图像中工件的区域;最后,由于YOLOv4已有的Mosaic数据增强方法在自制VOC数据集上表现不佳,引入一种新的数据增强方法以防止训练过程产生过拟合现象。实验结果表明,该方法对工件缺陷的检测精度达到90.63%,检测速度为每秒34.56帧,相较于原始YOLOv4模型,模型规模减小82.1%,检测精度提升了2%,检测速度提升了150%;与SSD和Faster R-CNN等模型相比较,该模型在检测速度和检测精度上有着出色的综合表现,能够针对工件银面缺陷进行高效的检测。  相似文献   

18.
针对复杂施工环境下的安全帽佩戴检测模型存在误检和漏检问题,基于YOLOv5s实验,提出一种改进型目标检测算法SH-YOLO,用于检测施工现场中安全帽的佩戴情况。SH-YOLO方法基于YOLOv5s,在Backbone层嵌入SimAM注意力机制,在Backbone与Neck连接处使用SPPFCSPC方法来减少原模型的计算量和参数量。在自制的安全帽数据集上进行对比实验,结果表明,SHYOLO对安全帽的检测精度AP分别达到95.4%,较YOLOv5s分别提升6.7%,同时保持较低的参数量和较高的帧速。  相似文献   

19.
综采工作面关键设备及人员的准确检测是实现煤炭智能化开采信息感知的重要环节。传统目标检测算法通过人工提取特征实现目标检测,易受环境影响,不具有普适性。基于卷积神经网络的目标检测算法可以自适应地提取深层信息,但复杂环境下检测精度不高、网络参数多、计算量大。针对上述问题,提出了一种改进YOLOv4模型,并将其应用于综采工作面目标检测。为准确从综采工作面复杂环境中检测到目标,在CSPDarkNet53网络中融入残差自注意力模块,保证参数共享及高效局部信息聚合的同时增强全局信息获取能力,提升图像关键目标特征表达能力,进而提高目标检测精度;为适应综采工作面目标检测高效性需求,引入深度可分离卷积替代传统卷积,以减少模型参数量和计算量,有利于模型的工业部署,提高目标检测速度。实验结果表明,与YOLOv3、CenterNet及YOLOv4模型相比,改进YOLOv4模型平均精度均值最高,达92.59%,且在参数量、计算量、检测精度上具有更优的平衡,可在煤尘干扰、光照不均、目标运动等复杂环境下对目标准确检测。  相似文献   

20.
YOLOv4-Tiny目标检测网络算法存在参数多和计算量大等问题,无法部署在资源有限的平台上。提出一种基于GhostNet残差结构的主干轻量级目标检测网络算法YOLO-GhostNet。该算法采用GhostNet结构将普通卷积分成两步,即使用较少的卷积核生成一部分特征图,对生成的特征图通过简单计算获得另一部分特征图,并将两组特征图进行拼接,以减少计算所需资源与参数量。通过GhostNet构建残差结构的YOLO-GhostNet算法在经过批量归一化层优化后模型尺寸只有2.18 MB,较YOLOv4-Tiny算法模型尺寸减小90%。YOLO-GhostNet算法在GPU加速环境下平均处理图片速度比YOLOv4-Tiny算法提高24%,CPU处理速度比YOLOv4-Tiny加快56%。实验结果表明,该算法在饮料测试集中的平均精确度均值达到79.43%,相比YOLOv4-Tiny算法,其在精度无损失情况下能够大幅降低网络计算量和参数量,同时加快推理速度,更适合部署于资源算力不足的嵌入式设备。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号