首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
基于深度学习的目标检测算法因其模型复杂度和对计算能力的要求,难以部署在移动设备等低算力平台上。为了降低模型的规模,提出一种轻量级目标检测算法。该算法在自顶向下的特征融合的基础之上,通过添加注意力机制构建特征金字塔网络,以达到更细粒度的特征表达能力。该模型以分辨率为320×320的图像作为输入,浮点运算量只有0.72 B,并在VOC数据集上取得了74.2%的mAP,达到了与传统单阶段目标检测算法相似的精度。实验数据表明,该算法在保持了检测精度的同时显著降低了模型运算量,更适合低算力条件下的目标检测。  相似文献   

3.
针对自然场景文本检测中存在的文本检测信息缺失、漏检的问题,提出了嵌入注意力机制的自然场景文本检测方法。利用Faster-RCNN目标检测网络和特征金字塔网络(FPN)作为基本框架;在区域建议网络(RPN)中嵌入注意力机制并依据文本的特点改进锚点(anchor)的设置,精确了文本候选区域;重新设定损失函数的作用范围。实验结果表明,该方法有效地保证文本检测信息的完整性,较之现有方法明显地提高了文本检测的召回率和准确率,能够应用于文本检测的实际任务中。  相似文献   

4.
在驾驶场景中,针对行人间的遮挡和尺度多变现象导致的检测精度较低、模型参数量过大和难以部署到移动端等问题,提出了一种基于YOLOv5s模型的轻量级实时行人检测模型LPD-YOLO。首先,在特征提取部分采用MES Net替换原主干网络,并在主干网络中嵌入注意力模块SA,增强网络特征提取能力;其次,在特征融合部分采用DS-ASFF结构改进原PANet,使其充分融合不同尺寸的特征图;然后,采用GS卷积代替特征融合网络中的部分标准卷积,在不影响精度的条件下,进一步减少模型参数量和计算量;最后,在预测部分使用OTA标签分配策略结合α-IOU改进原损失函数,加速模型收敛。实验结果表明,该模型相较于YOLOv5s,参数量减少了81.2%,浮点运算量降低了46.3%,模型大小减小了75.8%,检测精度提高了3.3%。单幅图像检测速度达到了13.2 ms,更好地满足了驾驶场景下密集行人的实时检测要求。  相似文献   

5.
注意力机制越来越受到关注,许多研究已经分别证明了通道注意力和空间注意力对于提升模型性能的有效性,但现有算法通常忽略了如何将这两种信息更好地结合起来。对此,通过将通道注意力、空间注意力和全局提取的特征信息有效结合,提出了一种新的移动网络注意力机制,称之为双分支融合注意力机制,并将双分支融合注意力机制应用到轻量级网络上进行实验。实验结果表明,引入双分支融合注意力机制的模型在CIFAR-100和ImageNet-100数据集上的准确率相较于原始模型均有明显提升,且浮点计算量和参数量并未显著增加。  相似文献   

6.
针对现有建筑物检测模型检测精度低下,模型体积较大,导致遥感图像检测速度和精度无法平衡,不利于后期部署等问题,提出一种基于YOLOv4优化的轻量级遥感图像建筑物检测模型。利用轻量化网络GhostNet替换CSP DarkNet53进行特征提取;借鉴稠密连接思想,提出了Dense-PANet特征融合模块;将ECA注意力机制引入Ghost模块,替换特征融合颈部网络的传统卷积。实验结果表明,提出的模型与YOLOv4相比,牺牲少量检测速度,但是平均精度提高了0.96个百分点,召回率提升了1.08个百分点,模型体积降低了71.39%,浮点计算量降低了76.60%,能有效满足遥感图像建筑物检测的需求。  相似文献   

7.
对于钢铁制造业、煤矿行业及建筑行业等高危行业来说,施工过程中佩戴安全帽是避免受伤的有效途径之一.针对目前安全帽佩戴检测模型在复杂环境下对小目标和密集目标存在误检和漏检等问题,提出一种改进YOLOv5的目标检测方法来对安全帽的佩戴进行检测.在YOLOv5的主干网络中添加坐标注意力机制(coordinate attenti...  相似文献   

8.
为了满足锂离子电池电极缺陷检测精度与实时性的需求,解决电极图像背景噪声复杂、缺陷微小且对比度低等问题,提出一种基于注意力机制与多尺度特征融合的电极缺陷YOLO检测算法.在YOLOv4的基础上,首先,将SE(squeeze-and-excitation)注意力模块嵌入特征提取主干网络中,区分feature map中不同通道的重要性,强化目标区域的关键特征,提高网络的检测精度;其次,加入融合空洞卷积的池化金字塔(ASPP)结构,增大网络感受野的同时最大程度地保留多尺度特征信息,提高算法对小目标的检测性能;然后,设计一种多尺度稠密特征金字塔,在三尺度特征图的基础上增加一个浅层特征,采用稠密连接的方式融合特征,提升浅层细节特征与高级语义信息的融合能力,增强对微小缺陷特征的提取;最后,采用$ K $-means++算法聚类先验框,引入focal loss损失函数增大小目标样本的损失权重,有效提高网络学习的收敛速度.实验结果表明,所提算法较原YOLOv4模型的mAP值提升6.42%,较其他常用算法综合性能上有着较大的优势,可较好地满足实际工业生产的实时监测需求.  相似文献   

9.
目的 在图像语义分割中,细节特征和语义特征的融合是该领域的一个难点。一些在特定网络架构下设计的专用融合模块缺乏可扩展性和普适性,自注意力虽然可以实现全局的信息捕获,但不能实现不同特征的融合,其他的注意力机制在进行掩码计算时缺少可解释性。本文根据特征图之间的关联度进行建模,提出一种互注意力机制驱动的分割模块。方法 该模块获取不同阶段的细节特征图和语义特征图,建立细节特征图上任一点和语义特征图之间的关联模型,并在关联模型的指导下对语义特征图上的特征进行聚合,作为细节特征图上该特征点的补充,从而将语义特征图上的信息融合到细节特征图上,并进一步采用相同的操作将细节特征图上的信息融合到语义特征图上,实现来自不同阶段特征图的相互融合。结果 选取5个语义分割模型进行实验,实验结果表明,在使用替换方式对BiSeNet V2(bilateral segmentation network)进行修改之后,浮点运算量、内存占用量和模型参数数量分别下降了8.6%,8.5%和2.6%,但是平均交并比却得到了提升。在使用插入方式对另外4个网络进行修改后,所有网络的平均交并比全部得到了不同程度的提高。结论 本文提出的互注意力模块可普遍提升模型的语义分割准确度,实现不同网络模型的即插即用,具有较高的普适性。  相似文献   

10.
实时目标检测算法YOLOv3的检测速度较快且精度良好,但存在边界框定位不够精确、难以区分重叠物体等不足。提出了Attention-YOLO算法,该算法借鉴了基于项的注意力机制,将通道注意力及空间注意力机制加入特征提取网络之中,使用经过筛选加权的特征向量来替换原有的特征向量进行残差融合,同时添加二阶项来减少融合过程中的信息损失并加速模型收敛。通过在COCO和PASCAL VOC数据集上的实验表明,该算法有效降低了边界框的定位误差并提升了检测精度。相比YOLOv3算法在COCO测试集上的mAP@IoU[0.5:0.95]提升了最高2.5 mAP,在PASCAL VOC 2007测试集上达到了最高81.9 mAP。  相似文献   

11.
沈文祥  秦品乐  曾建潮 《计算机应用》2019,39(12):3496-3502
针对室内人群目标尺度和姿态多样性、人头目标易与周围物体特征混淆的问题,提出了一种基于多级特征和混合注意力机制的室内人群检测网络(MFANet)。该网络结构包括三部分,即特征融合模块、多尺度空洞卷积金字塔特征分解模块以及混合注意力模块。首先,通过将浅层特征和中间层特征信息融合,形成包含上下文信息的融合特征,用于解决浅层特征图中小目标语义信息不丰富、分类能力弱的问题;然后,利用空洞卷积增大感受野而不增加参数的特性,对融合特征进行多尺度分解,形成新的小目标检测分支,实现网络对多尺度目标的定位和检测;最后,用局部混合注意力模块来融合全局像素关联空间注意力和通道注意力,增强对关键信息贡献大的特征,来增强网络对目标和背景的区分能力。实验结果表明,所提方法在室内监控场景数据集SCUT-HEAD上达到了0.94的准确率、0.91的召回率和0.92的F1分数,在召回率、准确率和F1指标上均明显优于当前用于室内人群检测的其他算法。  相似文献   

12.
在易燃易爆场合火灾控制中火焰极速检测意义重大,其对算法实时性、准确度、抗干扰性有较高要求。为此提出一种基于改进YOLOv4-tiny轻量化抗干扰火焰检测深度网络。引入类火目标图像与真实火焰图像并通过Mosaic数据增强方式建立鲁棒性火焰检测数据集;对YOLOv4-tiny骨干网络采用深度可分离卷积进行改进,使得原网络更加轻量化;在特征金字塔网络FPN(feature pyramid network)中融合多尺度特征提高网络对多层特征的学习表示能力,并引出多检测头以适应火焰爆发过程中不同尺度火焰的精准检测;在FPN中引入ECA(efficient channel attention)通道注意力机制进一步提高检测精度。实验结果表明,提出的YOLOv4-tiny-L4参数量仅为4.22 MB,准确率高达94.1%,执行时间仅为46 ms,满足火焰快速检测基本要求。  相似文献   

13.
目的 遥感图像目标检测在国防安全、智能监测等领域扮演着重要的角色。面对遥感图像中排列密集且方向任意分布的目标,传统水平框目标检测不能实现精细定位,大型和超大型的目标检测网络虽然有强大表征学习能力,但是忽略了模型准确率与计算量、参数量之间的性价比,也满足不了实时检测的要求,庞大的参数量和计算量在模型部署上也非常受限,针对以上问题,设计了一种轻量级的旋转框遥感图像目标检测模型(YOLO-RMV4)。方法 对原MobileNetv3网络进行改进,在特征提取网络中加入性能更好的通道注意力机制模块(efficient channel attention,ECA),并且对网络规模进行适当扩展,同时加入路径聚合网络(path aggregation network,PANet),对主干网络提取特征进行多尺度融合,为网络提供更丰富可靠的目标特征。网络检测头中则采用多尺度检测技术,来应对不同尺寸的目标物体,检测头中的角度预测加入了环形圆滑标签(circular smooth label,CSL),将角度回归问题转换为分类问题,从而使预测角度和真实角度之间的距离可以衡量。结果 将提出的检测模型在制备的AV...  相似文献   

14.
新冠疫情期间正确佩戴口罩可以有效防止病毒的传播,针对公共场所存在的人员密集、检测目 标较小等加大检测难度的问题,提出一种以 YOLOv5s 模型为基础并引入注意力机制融合多尺度注意力权重的 口罩佩戴检测算法。在 YOLOv5s 模型的骨干网络中分别引入 4 种注意力机制,抑制无关信息,增强特征图的 信息表达能力,提高模型对小尺度目标的检测能力。实验结果表明,引入 CBAM 模块后较原网络 mAP 值提升 了 6.9 个百分点,在 4 种注意力机制中提升幅度最明显,而引入 NAM 模块后在损失少量 mAP 的情况下使参 数量最少,最后通过对比实验选用 GIoU 损失函数计算边界框回归损失,进一步提升定位精度,最终结果较 原网络 mAP 值提升了 8.5 个百分点。改进模型在不同场景下的检测结果证明了该算法对小目标检测的准确 率和实用性。  相似文献   

15.
目的 深度卷积网络在图像超分辨率重建领域具有优异性能,越来越多的方法趋向于更深、更宽的网络设计。然而,复杂的网络结构对计算资源的要求也越来越高。随着智能边缘设备(如智能手机)的流行,高效能的超分重建算法有着巨大的实际应用场景。因此,本文提出一种极轻量的高效超分网络,通过循环特征选择单元和参数共享机制,不仅大幅降低了参数量和浮点运算次数(floating point operations,FLOPs),而且具有优异的重建性能。方法 本文网络由浅层特征提取、深层特征提取和上采样重建3部分构成。浅层特征提取模块包含一个卷积层,产生的特征循环经过一个带有高效通道注意力模块的特征选择单元进行非线性映射提取出深层特征。该特征选择单元含有多个卷积层的特征增强模块,通过保留每个卷积层的部分特征并在模块末端融合增强层次信息。通过高效通道注意力模块重新调整各通道的特征。借助循环机制(循环6次)可以有效提升性能且大幅减少参数量。上采样重建通过参数共享的上采样模块同时将浅层与深层特征进放大、融合得到高分辨率图像。结果 与先进的轻量级网络进行对比,本文网络极大减少了参数量和FLOPs,在Set5、Set14、B100、Urban100和Manga109等基准测试数据集上进行定量评估,在图像质量指标峰值信噪比(peak signal to noise ratio,PSNR)和结构相似性(structural similarity,SSIM)上也获得了更好的结果。结论 本文通过循环的特征选择单元有效挖掘出图像的高频信息,并通过参数共享机制极大减少了参数量,实现了轻量的高质量超分重建。  相似文献   

16.
针对虚假评论识别任务中传统离散模型难以捕捉到整个评论文本的全局语义信息的问题,提出了一种基于层次注意力机制的神经网络模型。首先,采用不同的神经网络模型对评论文本的篇章结构进行建模,探讨哪种神经网络模型能够获得最好的篇章表示;然后,基于用户视图和产品视图的两种注意力机制对评论文本进行建模,用户视图关注评论文本中用户的偏好,而产品视图关注评论文本中产品的特征;最后,将两个视图学习的评论表示拼接以作为预测虚假评论的最终表示。以准确率作为评估指标,在Yelp数据集上进行了实验。实验结果表明,所提出的层次注意力机制的神经网络模型表现最好,其准确率超出了传统离散模型和现有的神经网络基准模型1至4个百分点。  相似文献   

17.
目的 针对现有肺结节检测算法存在的因肺部计算机断层扫描(computed tomography,CT)图像肺结节与周边组织复杂性导致结节本身结构差异性不明显的问题,以及特征提取网络多次下采样造成图像分辨率降低进而导致检测结果差、仅使用网络顶层特征图进行预测造成图像空间信息丢失进而导致小结节漏检等问题,提出了一种基于注意力机制和特征金字塔的肺结节检测算法。方法 根据语义与空间特征补偿机制以及卷积神经网络中网络深度所提取特征的信息量不同,在以ResNet为骨干网络的特征提取网络中设计通道—空间注意力机制,尽可能同时获取含有较多上下文语义以及空间位置信息的特征信息。在网络预测部分设计特征金字塔网络,将高维带有丰富语义信息的特征图与低维带有位置信息的特征图融合进行多尺度预测,增强网络对于小结节以及近血管结节等非显著性目标的检测性能。结果 在LUNA16(lung nodule analysis 16)数据集上进行十折交叉验证显示,当平均假阳性个数为25.99时敏感度达到了97.13%,与基准方法相比,敏感度提高了2.53%,平均假阳性降低了28.54,实现了高敏感度低假阳性;在0.125、0.25、0.5、1、2、4、8这7个假阳率点的敏感度平均值为0.854,其中在每个扫描4次和8次假阳性时敏感度分别达到了0.940和0.951,其效果优于主流的结节检测方法。结论 提出的结节检测模型,可以提高对3~10 mm小结节、近血管结节等非显著性目标的检测性能,并具有较低的假阳率。  相似文献   

18.
针对目前边缘检测模型复杂度高、参数量大、识别边缘精度及效率不高的问题,提出了一种轻量级边缘检测神经网络。首先,通过MP模块将原图像分成同等维度的小块并进行位置编码,以增强边缘像素点之间的联系;再经过MGC中的多组卷积操作提取图像不同区域特征进行融合,减少冗余信息;最后通过多次的反卷积上采样调整输出图片的分辨率尺寸,输出预测边缘图。最终的网络只有125 KB的参数,在BIPED和MDBD数据集上进行实验,验证模型检测边缘的综合能力。相比于当前最先进的轻量级边缘检测方法LDC,在BIPED数据集上的测试结果表明,指标ODS(optimal dataset scale)仅低了0.9%,模型参数量则降低了81.5%,FPS提高了89.0%。在保持细粒度识别边缘的同时,可以满足实际任务中的需求。  相似文献   

19.
目的 特征融合是改善模糊图像、小目标以及受遮挡物体等目标检测困难的有效手段之一,为了更有效地利用特征融合来整合不同网络层次的特征信息,显著表达其中的重要特征,本文提出一种基于融合策略优选和双注意力机制的单阶段目标检测算法FDA-SSD(fusion double attention single shot multibox detector)。方法 设计融合策略优化选择方法,结合特征金字塔(feature pyramid network, FPN)来确定最优的多层特征图组合及融合过程,之后连接双注意力模块,通过对各个通道和空间特征的权重再分配,提升模型对通道特征和空间信息的敏感性,最终产生包含丰富语义信息和凸显重要特征的特征图组。结果 本文在公开数据集PASCAL VOC2007(pattern analysis, statistical modelling and computational learning visual object classes)和TGRS-HRRSD-Dataset(high resolution remote sensing detection)上进行对比...  相似文献   

20.
针对现有网络在检测高分辨率交通标志图片时速度过慢、精确度较低等问题,提出一种轻量化交通标志检测网络。在MobileNetv3-Large基础上对YOLOv4网络的骨干部分进行优化,针对数据集的特点舍弃部分耗时层,更改第8层和第14层的输出通道数,并改进基础模块中通道域注意力网络的注意力机制,使输出的权重数值能更准确地表征特征的重要程度。在检测头前加入基于弱语义分割的动态增强附件,利用其输出作为空间权重分布来矫正激活区域,以避免提取能力下降导致误检、漏检问题,最终构成YOLOv4-SLite网络。采用滑窗剪裁的方法对高分辨率图片进行训练和预测,从而减少训练时间及增加样本的多样性。在TT100K交通标志数据集上的实验结果表明,相较于YOLOv4基准网络,YOLOv4-SLite网络的mAP@0.5仅下降了0.2%,但模型大小减少了96.5%,响应速度提升了227%,精确度与速度的平衡效果达到了预期。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号