首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 83 毫秒
1.
罗月童  江佩峰  段昶  周波 《计算机科学》2021,48(10):233-238
基于深度学习的目标检测算法广泛应用于工业检测,RetinaNet算法因兼具速度与精度两方面的优势而备受关注,但对于小于32×32像素的小目标,该算法的检测精度不能满足工业检测的要求.为此,文中以增强小目标的训练为基本思路,针对RetinaNet算法进行了如下改进:在采样阶段,将低层特征图P2添加到FPN中,以确保小目标...  相似文献   

2.
目前基于深度学习算法的目标检测技术在合成孔径雷达(SAR)图像船舶检测中取得了显著的成果,然而仍存在着小目标船舶和近岸密集排列船舶检测效果差的问题。针对上述问题,提出了基于改进RetinaNet的船舶检测算法。在传统RetinaNet算法的基础上,首先,将特征提取网络残差块中的卷积改进为分组卷积,以增加网络宽度,从而提高网络的特征提取能力;其次,在特征提取网络的后两个阶段加入注意力机制,让网络更加专注于目标区域,从而提升目标检测能力;最后,将软非极大值抑制(Soft-NMS)加入到算法中,降低算法对于近岸密集排列船舶检测的漏检率。在高分辨率SAR图像数据集(HRSID)和SAR船舶检测数据集(SSDD)上的实验结果表明,所提改进算法对于小目标船舶和近岸船舶的检测效果得到了有效提升,与当前优秀的目标检测模型Faster R-CNN、YOLOv3和CenterNet等相比,在检测精度和速度上更加优越。  相似文献   

3.
人群计数技术以估计人群图片或视频中的人数为目标,可以有效预防人群踩踏事故的发生,广泛应用于安防预警、城市规划及大型集会管理等领域。然而,由于人群尺度变化、背景干扰、人群分布不均、遮挡和透视效应等因素的影响,单幅图片的人群计数仍是一项非常具有挑战性的任务。针对人群计数中多尺度变化和背景干扰问题,提出一种抗背景干扰的多尺度人群计数算法。以VGG16网络结构为基础,引入特征金字塔构建多尺度特征融合骨干网络解决人群多尺度变化问题,设计Double-Head-CC结构对融合后的特征图进行前景背景分割和密度图预测以抑制背景干扰。基于密度图的局部相关性和多任务学习,定义多重损失函数和多任务联合损失函数进行网络优化。在ShanghaiTech、UCF-QNRF和JHU-CROWD++数据集上进行训练和评测,实验结果表明,该算法能够很好地预测人群密度分布和人群数量,具有较高的准确性,且鲁棒性强、泛化性能良好。  相似文献   

4.
针对传统目标检测模型参数量巨大,制约算法部署与模型推理实时性的问题,提出一种基于改进RetinaNet检测模型的轻量化实时目标检测网络。使用MobileNet-V2代替RetinaNet模型中的ResNet骨干网络,降低整体模型的参数量;设计锚框引导采样机制,基于特征金字塔输出特征层生成感兴趣区域掩码,减少背景区域冗余锚框,降低后处理过程中的计算复杂度;引入GFocalLossV2损失函数统计预测边框分布特征,优化预测边框质量以及提升分类准确度。该模型在自制多类别工件数据集WP和Pascal VOC公开数据集上进行验证实验,改进模型的检测准确率分别达到99.5%、80.5%,检测速度分别达到39.8 FPS、38.3 FPS。实验结果表明,该轻量级目标检测模型能够实现实时检测,同时保证了检测精度。  相似文献   

5.
露骨病害是水泥路面常见的病害之一,会严重影响路面使用年限和行车安全性能.因此,及时对露骨病害进行检测与修复十分重要.针对传统的人工检测方法检测精度不高且检测效率低的问题,本文提出一种基于改进RetinaNet模型的水泥路面露骨病害检测方法.首先对人工和检测车采集露骨病害图像进行滤波、去噪等预处理操作,构建模型训练数据集...  相似文献   

6.
于敏  屈丹  司念文 《计算机工程》2022,48(8):249-257
针对经典一阶段目标检测算法RetinaNet难以充分提取不同阶段特征、边界框回归不够准确等问题,提出一个面向目标检测的改进型RetinaNet算法。在特征提取模块中加入多光谱通道注意力,将输入特征中的频率分量合并到注意力处理中,从而捕获特征原有的丰富信息。将多尺度特征融合模块添加到特征提取模块,多尺度特征融合模块包括1个路径聚合模块和1个特征融合操作,路径聚合模块通过搭建自底向上的路径,利用较浅特征层上精确的定位信号增强整个特征金字塔的信息流,特征融合操作通过融合来自每个阶段的特征信息优化多阶段特征的融合效果。此外,在边界框回归过程中引入完全交并比损失函数,从边界框的重叠面积、中心点距离和长宽比这3个重要的几何因素出发,提升回归过程的收敛速度与准确性。在MS COCO数据集和PASCAL VOC数据集上的实验结果表明,与RetinaNet算法相比,改进型RetinaNet算法在2个数据集上的平均精度分别提高了2.1、1.1个百分点,尤其对于MS COCO数据集中较大目标的检测,检测精度的提升效果更加显著。  相似文献   

7.
不同型号手机的主板图像具有多分辨率的成像模式,使缺陷元件是多尺度的。常规缺陷检测方法主要有图像融合方法和提取统计模型的方法,但这些方法的鲁棒性仍需要提高。针对该问题,提出了一种自动检测网络模型,即RetinaNet目标检测器。首先使用特征金字塔网络(FPN)提取缺陷元件的多尺度特征分类和位置,然后引入MobileNetV2以压缩和加速RetinaNet模型,最后使用焦点损失解决类不平衡和难以检测样本对损失贡献程度的问题。实验结果表明, RetinaNet能有效地检测不同尺度的缺陷元件,具有很高的检测精度;与其他目标检测器相比,RetinaNet实现了超过95%的平均精度(mAP)。这些结果表明了本文所提模型的有效性。  相似文献   

8.
移动端计算力不足和存储有限导致车辆信息检测模型精度不高、速度较慢。针对这一问题,提出一种基于RetinaNet改进的车辆信息检测算法。首先,开发新的车辆信息检测框架,将特征金字塔网络(FPN)模块的深层特征信息融合进浅层特征层,以MobileNet V3为基础特征提取网络;其次,引入目标检测任务的直接评价指标GIoU指导定位任务;最后,使用维度聚类算法找出Anchor的较好尺寸并匹配到相对应的特征层。与原始RetinaNet目标检测算法的对比实验表明,所提算法在车辆信息检测数据集上的精度有10.2个百分点的提升。以MobileNet V3为基础网络时平均准确率均值(mAP)可达97.2%且在ARM v7设备上单帧前向推断用时可达100 ms。实验结果表明,所提方法能够有效提高移动端车辆信息检测算法性能。  相似文献   

9.
针对高铁无砟轨道板表面裂缝尺度差异大、裂缝类别不平衡等问题,提出了基于改进RetinaNet的裂缝检测方法。为了缓解下采样与特征金字塔横向连接压缩而导致的细微信息丢失的问题,利用多级特征金字塔融合ResNet-50主干网络中提取的不同层次的深浅特征,实现了图像特征信息的充分表达;为了解决检测过程中表面裂缝的分类和定位置信度之间不匹配的问题,提出自适应锚点学习使锚点与网络模型同时进行优化,提高了对小尺度裂缝的检测精度;为了缓解裂缝类别不平衡对检测性能的影响,引入焦点损失函数(Focal Loss)作为分类损失函数,并在其中添加类平衡权重项因子,提升了对小类别裂缝的检测精度。实验结果表明,改进RetinaNet检测网络对高铁无砟轨道板不同类别的裂缝均获得了较好的效果,平均检测精度(mAP)达到72.58%,较之原始RetinaNet检测网络提高了3.60个百分点,有效实现了对不同尺度裂缝的准确检测。  相似文献   

10.
由于单张图片人群计数存在严重的人群遮挡和尺度变化问题,导致人群计数算法性能明显下降。为此,提出一种基于特征金字塔网络对图片进行人群计数的算法,并给出能够处理任意图片分辨率的全卷积网络。将特征金字塔网络应用到人群计数中,通过逐层融合网络中不同尺度的特征图来解决图片中的上述问题。在人群计数数据库ShanghaiTech上对网络模型进行训练和性能评测,结果表明,与当前主流的人群计数算法相比,该算法具有更高的鲁棒性和准确性。  相似文献   

11.
12.
蝴蝶是一种对栖息地敏感的昆虫,自然环境中的蝴蝶种类分布反映了区域生态系统平衡和生物多样性.专家鉴别蝴蝶种类耗时耗力,计算机视觉技术为野外环境中蝴蝶种类自动识别提供了可能.针对野外环境下的蝴蝶图像特征,提出2种新的硬注意力机制,DSEA(direct squeeze-and-excitation with global average pooling)和DSEM(direct squeeze-and-excitation with global max pooling),改进经典目标检测算法RetinaNet,并引入可变形卷积增强RetinaNet对蝴蝶形变的建模能力,实现野外环境下蝴蝶种类自动识别.以mAP(mean average precision)目标检测指标评价模型性能,通过实验结果可视化,分析影响模型性能的关键因素.实验结果显示,提出的改进RetinaNet对自然环境下的蝴蝶识别任务具有很不错的效果, 特别是基于DSEM的RetinaNet;分布平衡的训练集可以提升提出模型的泛化性能;样本的结构相异性是影响模型性能的关键因素.  相似文献   

13.
现实场景中人群尺度的巨大差异给密集人群计数算法带来了巨大的挑战,因此提出一种基于尺度融合的密集人群计数算法.首先对密度图构建算法进行优化,利用多个头部检测器获取稀疏人群的部分头部尺度,并用径向基差值进行补全,在人群密集区域辅之以距离自适应的人群密度图生成算法,生成更为精确的人群密度图.其次利用移动翻转瓶颈卷积模块设计尺度融合的人群密度图回归神经网络,并加入膨胀卷积模块进一步提升人体头部边缘特征提取能力.最后,通过将人群区域和非人群区域进行区分对人群密度图回归神经网络损失函数进行优化.在实验部分,将该算法在多个数据集上与多个同类算法进行了充分的对比实验与消融实验,实验结果表明提出的方法能够显著提升密集人群计数算法的准确性.  相似文献   

14.
针对移动端目标检测算法需要模型参数量与计算量更少、推理速度更快和检测效果更好以及目标检测算法对于小目标误检、漏检及特征提取能力不足等问题, 提出一种基于YOLOv5改进的轻量化目标检测算法. 该算法使用轻量级网络MobileNetV2作为目标检测算法的骨干网络降低模型的参数量与计算量, 通过使用深度可分离卷积结合大卷积核的思想降低网络的计算量与参数量, 并提升了小目标的检测精度. 使用GhostConv来替换部分普通卷积, 进一步降低参数量与计算量. 本文算法在VOC竞赛数据集, COCO竞赛数据集两份数据集上均进行了多次对比实验, 结果表明本文算法相比于其他模型参数量更小、计算量更小、推理速度更快以及检测精度更高.  相似文献   

15.
徐龙壮  彭力  朱凤增 《计算机工程》2021,47(1):239-245,254
针对基于局部特征的行人重识别方法在行人错位和姿态变化时识别精度较低的问题,提出一种采用多任务金字塔重叠匹配特征的重识别方法。在训练阶段,使用改进的ResNes50作为主干网络提取特征图,将其切分组合形成金字塔重叠匹配网络,获得全局特征向量并经全局平均池化得到包含多尺度特征的多个局部特征向量,联合使用Softmax损失函数、三元组损失函数和中心损失函数学习全局和局部特征向量,并利用特征归一化层减少损失函数学习目标冲突的影响。在推理阶段,将多个局部特征向量融合为一个新特征向量进行相似性匹配,以获取更好的匹配结果。在Market1501、DukeMTMC-reID和CUHK03数据集上的实验结果表明,与PSE、MultiScale等主流重识别方法相比,该方法重识别精度更高,提取的特征具有较好的鲁棒性和识别度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号