首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
姜敏  王力  王冬冬 《软件》2020,(2):57-61,74
针对行人检测中检测速度慢,不能实现实时性检测的问题,提出一种改进的SSD(Single Shot MultiBox Detector)行人检测算法。改进网络通过调整基础网络中卷积层的数量,去除冗余的卷积层,降低模型复杂度,提高检测速度;不同尺度特征图进行预测之前加入残差块,进一步提取特征,提高准确率。提取PASCAL VOC数据集中的行人图像和INRIA数据集形成混合数据集进行训练,增加模型泛化性,实验证明本方法拥有较高的精度和较快的速度,具有良好的泛化性,满足实时性要求。  相似文献   

2.
针对SSD当前存在的小目标漏检以及误检问题,结合反卷积与特征融合思想,提出hgSSD模型。将原SSD特征层反卷积后与较浅层特征结合,实现复杂场景下小目标行人检测。为了保留浅层网络特征,提高算法实时性,节省计算资源,hgSSD模型基础网络使用VGG16,而非更深层的ResNet101。为了加强对小目标的检测,将VGG16中的Conv3_3改进为特征层加入训练。融合后的网络相对于SSD较为复杂,但基本保证实时性,且成功检测到大部分SSD网络漏检的小目标,检测精度相比于SSD模型也有提升。在选择框置信度得分阈值为0.3的情况下,基本检测到SSD漏检小目标。在VOC2007+2012中相对于SSD行人检测的Average Precision值从0.765提升为0.83。  相似文献   

3.
伍鹏瑛    张建明    彭建    陆朝铨   《智能系统学报》2019,14(2):306-315
针对真实场景下的行人检测方法存在漏检、误检率高,以及小尺寸目标检测精度低等问题,提出了一种基于改进SSD网络的行人检测模型(PDIS)。PDIS通过引出更底层的输出特征图改进了原始SSD网络模型,并采用卷积神经网络不同层输出的抽象特征对行人目标分别做检测,融合多层检测结果,提升了小目标行人的检测性能。此外,针对数据集样本多样性能有效地提升检测算法的泛化能力,本文采集了不同光照、姿态、遮挡等复杂场景下的行人图像,对背景比较复杂的INRIA行人数据集进行了扩充,在扩增的行人数据集上训练的PDIS模型,提高了在真实场景下的行人检测精度。实验表明:PDIS在INRIA测试集上测试结果达到93.8%的准确率,漏检率低至7.4%。  相似文献   

4.
黄凤琪  陈明  冯国富 《计算机工程》2021,47(10):269-275,282
针对YOLO目标检测算法存在边界框定位不准确及对小目标检测精度低的问题,提出一种改进的YOLO目标检测算法dcn-YOLO。使用k-means++算法聚类出更符合数据集尺寸的锚盒,以降低初始点对聚类结果的影响并加快网络训练收敛速度。构建残差可变形卷积模块res-dcn,分别采用将其嵌入YOLO第一特征提取头模块中和替换3个YOLO特征提取头模块的方式,构建两种改进的dcn-YOLO算法,使网络可以自适应地学习特征点的感受野,从而对不同尺寸和形状的目标提取更有效的特征,提高检测精度。在VOC数据集上的实验结果表明,该算法能有效提高目标检测精度,mAP达到82.6%,相比YOLO、SSD、Faster R-CNN,分别高出了2.1、5.2、9.4个百分点。  相似文献   

5.
针对现有传动设备在线监测算法存在的检测精度地、效率差等问题,提出一种基于改进SSD网络模型的在线检测算法。先对故障集进行预处理,通过滤波调制、共振解调等环节滤除原始故障集的噪声干扰;以VGG-16为基础设计了SSD网络结构,同时增加了辅助卷积层和预测层;对SSD网络模型进行改进,引入了注意力机制模块和特征增强模块,改善模型各层的数据共享性能同时提高了模型的数据训练效率;基于通道拼合方式对故障数据进行多尺度特征融合,并优化SSD模型的各层金字塔结构,以更好的匹配先验框及选择最佳的损失函数。实验结果显示,提出算法的传动设备故障检测率达到98.8%,同时算法的检测效率也优于现有算法。  相似文献   

6.
针对现有单阶段目标检测算法锚点框特征表达不足影响检测精度的问题,提出了一种增强锚点框特征表达的算法,其包含注意力机制模块和部件感知模块.首先,注意力机制模块根据各个锚点框的不同属性自适应地提供不同的特征表达.然后,部件感知模块准确地提取各个锚点框内部的判别性部件特征以作为各个锚点框进行预测所需的特有特征.将所提设计与现有SSD算法结合并在多个公开的目标检测数据集上进行实验,结果表明,所提算法能够显著提高单阶段目标检测算法的精度并维持实时运行速度(14 ms);进一步地,在扩展实验上的结果表明,所提算法也能够改善生成的区域建议框的召回率及两阶段目标检测算法的精度.  相似文献   

7.
针对经典的单阶段多目标检测算法SSD对小目标物检测效果差的问题,提出DF-SSD算法,其核心技术贡献包括基于反卷积与特征融合的方法和改进后的先验框尺寸计算算法.反卷积与特征融合能够增加浅层特征层的语义信息.改进后的先验框尺寸计算引入了数据集的特点,能有效利用每一个先验框进行训练和预测.改进后的方法DF-SSD与基于SS...  相似文献   

8.
朱繁  王洪元  张继 《计算机应用》2019,39(11):3210-3215
针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2:5)使12种anchors适应图像中行人的尺寸;然后,结合细粒度图像识别技术,实现行人的高定位精度;其次,采用全卷积网络(FCN)分割前景对象,并进行像素预测获得行人的局部掩码(上半身、下半身),实现对行人的细粒度检测;最后,通过学习行人的局部特征获得行人的整体掩码。为了验证改进算法的有效性,将其与当前具有代表性的目标检测方法(如更快速的区域卷积神经网络(Faster R-CNN)、YOLOv2、R-FCN)在同数据集上进行对比。实验结果表明,改进的算法提高了行人检测的速度和精度,并且降低了误检率。  相似文献   

9.
目的 为了有效解决传统行人检测算法在分辨率低、行人尺寸较小等情境下检测精度低的问题,将基于区域全卷积网络(region-based fully convolutional networks,R-FCN)的目标检测算法引入到行人检测中,提出一种改进R-FCN模型的小尺度行人检测算法。方法 为了使特征提取更加准确,在ResNet-101的conv5阶段中嵌入可变形卷积层,扩大特征图的感受野;为提高小尺寸行人检测精度,在ResNet-101中增加另一条检测路径,对不同尺寸大小的特征图进行感兴趣区域池化;为解决小尺寸行人检测中的误检问题,利用自举策略的非极大值抑制算法代替传统的非极大值抑制算法。结果 在基准数据集Caltech上进行评估,实验表明,改进的R-FCN算法与具有代表性的单阶段检测器(single shot multiBox detector,SSD)算法和两阶段检测器中的Faster R-CNN(region convolutional neural network)算法相比,检测精度分别提高了3.29%和2.78%;在相同ResNet-101基础网络下,检测精度比原始R-FCN算法提高了12.10%。结论 本文提出的改进R-FCN模型,使小尺寸行人检测精度更加准确。相比原始模型,改进的R-FCN模型对行人检测的精确率和召回率有更好的平衡能力,在保证精确率的同时,具有更大的召回率。  相似文献   

10.
针对遥感图像在复杂背景下小目标检测精度较低的问题,提出一种基于双注意力机制模型的SSD检测算法。该算法在前端特征提取网络中引入双注意力机制模型,强化低层特征图中小目标的有效特征信息并抑制冗余的语义信息,实现自适应特征学习;并在空间注意力模型中引入空洞卷积,保证卷积核感受野的同时减少了网络参数。引入Focal loss损失函数作为改进算法的分类损失函数,改善网络在训练过程中样本失衡的问题,增加正样本与难样本在训练时的权重比例,提升算法的检测性能。对遥感图像数据集NWPU VHR-10进行检测的结果表明,本文的改进算法在保证检测速度的同时提高了检测精度。与传统SSD算法相比,改进SSD算法的mAP提高了2.25个百分点,达到79.65%。  相似文献   

11.
陈乔松  弓攀豪 《计算机应用研究》2020,37(7):2202-2205,2226
针对行人检测方法未能充分利用卷积网络浅层特征的问题,改进Faster R-CNN框架,提出了一种基于自适应特征卷积网络的行人检测方法。该方法有两处改进:a)设计了SFCM模块,用于提取卷积神经网络浅层细节特征;b)引用挤压与激励操作设计了AFCM模块,用于筛选检测所需的强辨识力行人特征。此外,利用公开的Caltech和INRIA行人数据集,通过在基准框架中逐一添加SFCM和AFCM模块训练行人检测器,验证了所提模块的有效性,并对比了主流行人检测算法。实验结果显示,所提方法的误检率分别降到了9.13%和9.46%,具有更优的检测性能。  相似文献   

12.
提出基于YOLOV3和DenseNet相结合的轻量化行人检测算法。加入HSV图像处理模块强化行人特征,利用卷积神经网络提取行人特征,通过k均值聚类算法筛选预测框,借鉴特征金字塔的思想做高低层特征融合和预测,利用Dense Block结构对网络轻量化进行完善,在国际广泛使用的行人数据集上进行一系列实验。实验结果表明,检测速度比现有的优秀目标检测模型YOLOV3提升了8倍,模型大小为YOLOV3的1/107,所提方法在测试集上的实时性和准确率都有所提高。  相似文献   

13.
道路车辆实时检测是计算机视觉领域中的研究热点问题。针对道路车辆检测算法存在检测精度低、速度慢等问题,提出了一种基于改进YOLOv3的道路车辆目标检测方法。通过改进Darknet53骨架网络构建了有30个卷积层的卷积神经网络,在减少网络成本的同时提高了检测速度;根据道路车辆宽高比固定的特点,利用k-means聚类方法选取锚点预测边界框,提高了检测速度与精度。实验结果表明,提出的方法在标准数据集KITTI上的平均精度达到了90.08%,比传统的YOLOv3提高了0.47%,检测速度达到了76.04 f/s,明显优于传统的YOLOv3算法。同时将该方法应用于车辆行驶动态数据集,能够实现针对视频中道路车辆的实时检测。  相似文献   

14.
针对交通标志图像中目标物较小,SSD(单次多框检测)模型对其检测精度不佳的问题,提出一种基于SSD模型改进的卷积网络算法.在原SSD特征层基础上加入低层特征图,并将低层邻近特征图进行融合,实现不同特征层的多元信息分类预测与位置回归.对SSD默认框的大小选取进行k-means聚类分析,调整原有默认框比例,加快模型收敛.通过不同数据集进行验证,实验结果表明,该算法表现出较好的检测效果,同时满足实时性的要求.  相似文献   

15.
目的 在基于深度学习的目标检测模型中,浅层特征图包含更多细节但缺乏语义信息,深层特征图则相反,为了利用不同深度特征图的优势,并在此基础上解决检测目标的多尺度问题,本文提出基于卷积核金字塔和空洞卷积的单阶段目标检测模型。方法 所提模型采用多种方式融合特征信息,先使用逐像素相加方式融合多层不同大小的特征图信息,然后在通道维度拼接不同阶段的特征图,形成具有丰富语义信息和细节信息的信息融合特征层作为模型的预测层。模型在锚框机制中引入卷积核金字塔结构,以解决检测目标的多尺度问题,采用空洞卷积减少大尺寸卷积核增加的参数量,合理地降低锚框数量。结果 实验结果表明,在PASCAL VOC2007测试数据集上,所提检测框架在300×300像素的输入上检测精度达到79.3% mAP(mean average precision),比SSD(single shot multibox detector)高1.8%,比DSSD(deconvolutional single shot detector)高0.9%。在UCAS-AOD遥感数据测试集上,所提模型的检测精度分别比SSD和DSSD高2.8%和1.9%。在检测速度上,所提模型在Titan X GPU上达到21帧/s,速度超过DSSD。结论 本文模型提出在两个阶段融合特征信息并改进锚框机制,不仅具有较快的检测速度和较高的精度,而且较好地解决了小目标以及重叠目标难以被检出的问题。  相似文献   

16.
行人检测技术在智能交通系统、智能安防监控和智能机器人等领域均表现出了极高的应用价值,已经成为计算机视觉领域的重要研究方向之一。得益于深度学习的飞速发展,基于深度卷积神经网络的通用目标检测模型不断拓展应用到行人检测领域,并取得了良好的性能。但是由于行人目标内在的特殊性和复杂性,特别是考虑到复杂场景下的行人遮挡和尺度变化等问题,基于深度学习的行人检测方法也面临着精度及效率的严峻挑战。本文针对上述问题,以基于深度学习的行人检测技术为研究对象,在充分调研文献的基础上,分别从基于锚点框、基于无锚点框以及通用技术改进(例如损失函数改进、非极大值抑制方法等)3个角度,对行人检测算法进行详细划分,并针对性地选取具有代表性的方法进行详细结合和对比分析。本文总结了当前行人检测领域的通用数据集,从数据构成角度分析各数据集应用场景。同时讨论了各类算法在不同数据集上的性能表现,对比分析各算法在不同数据集中的优劣。最后,对行人检测中待解决的问题与未来的研究方法做出预测和展望。如何缓解遮挡导致的特征缺失问题、如何应对单一视角下尺度变化问题、如何提高检测器效率以及如何有效利用多模态信息提高行人检测精度,均是值得进一步...  相似文献   

17.
针对桥梁裂缝固有特征及检测过程的局限性,引入基于卷积神经网络的YOLOv3单阶段目标检测算法,并对YOLOV3网络的多尺度预测模块进行改进,充分利用浅层特征,提升小裂缝检测精度.通过聚类算法对数据集进行聚类,得到适用于桥梁裂缝特征的先验框尺寸.数据集方面引入生成对抗网络对桥梁裂缝数据集进行扩增.实验结果表明,在相同数据集和迭代次数下,改进YOLOv3网络裂缝检测精度可达0.9302,比原YOLOv3提高0.0137.  相似文献   

18.
为提升大坝安全运维的效率,大坝缺陷目标检测模型有助于辅助巡检人员进行缺陷检测。大坝缺陷几何形状多变,而采用传统卷积方式进行特征提取的单点多盒检测器(SSD)模型无法适应缺陷的几何变换。针对上述问题,提出可变形卷积单步多框检测器(DFSSD)模型。首先将原始SSD的主干网络VGG16中的标准卷积替换为可变形卷积,用于处理缺陷的几何变换,并且通过学习卷积偏移量来提升模型的空间信息建模能力;其次针对不同特征的尺寸,改进先验框比例,从而提高模型对条形特征的检测精度与模型的泛化能力;最后为解决训练集正负样本不均衡的问题,采用改进的非极大值抑制(NMS)算法来优化学习效果。实验结果表明:DFSSD模型较基准模型SSD在大坝缺陷图像上的平均检测精度提升了5.98%。相较于基于区域的更快卷积神经网络(Faster R-CNN)和SSD模型,DFSSD模型在大坝缺陷目标检测精度提升上有较好的效果。  相似文献   

19.
为了提高对中小占比手势识别的准确性与稳定性,提出了一种多尺度卷积特征融合的SSD(single shot multibox detector)手势识别方法。该方法突出表现在两大方面,其一,在原始的SSD算法的多尺度卷积检测方法基础上,引入了不同卷积层的特征融合思想,经过空洞卷积下采样操作与反卷积上采样操作,实现网络结构中的浅层视觉卷积层与深层语义卷积层的融合,代替原有的卷积层用于手势识别,以提高模型对中小目标手势的识别精度;其二,为了解决正负样本不均衡导致分类性能差的问题,提出一种改进的损失函数,以提升模型对目标手势的分类能力。在手势识别公开的数据集上的实验结果表明,与SSD和Faster R-CNN等识别方法相比,能够在保持较高的手势检测精度的同时,又具有较好的鲁棒性与检测速度。  相似文献   

20.
针对目前行人检测算法计算量过大和对小尺度行人检测精度不高的问题,提出了一种基于深度卷积神经网络特征层融合的小尺度行人检测方法,设计了一种包含9个卷积层的深度神经网络架构.在进行行人检测时,首先,对输入图像进行分块预处理操作,避免损失原始图像的视觉信息;然后,将网络不同层的卷积特征进行融合,提升行人特征的区分能力和表达能力,进而提升行人检测的精度,在保证检测精度的同时有效降低网络的复杂度.在INRIA、Caltech等公共行人数据集上的实验结果表明,所提出的行人检测方法能够有效检测小尺度的行人,且网络架构的参数量更少,检测速度更快,能得到更高精度的行人检测结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号