首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 265 毫秒
1.
姜敏  王力  王冬冬 《软件》2020,(2):57-61,74
针对行人检测中检测速度慢,不能实现实时性检测的问题,提出一种改进的SSD(Single Shot MultiBox Detector)行人检测算法。改进网络通过调整基础网络中卷积层的数量,去除冗余的卷积层,降低模型复杂度,提高检测速度;不同尺度特征图进行预测之前加入残差块,进一步提取特征,提高准确率。提取PASCAL VOC数据集中的行人图像和INRIA数据集形成混合数据集进行训练,增加模型泛化性,实验证明本方法拥有较高的精度和较快的速度,具有良好的泛化性,满足实时性要求。  相似文献   

2.
为了提高目标检测算法的实时性,提出了一种基于反残差块的轻量级目标检测方法,并将其用于行人检测。利用深度可分离卷积减少模型的参数量和卷积过程的计算量;在深度可分离卷积的基础上构造反残差块,提取高维特征。采用多尺度预测和特征融合相结合的方法,更好地利用深层特征图的语义信息,使得模型对图像中小尺度的行人目标有较好的表征能力。运用K-means聚类方法对INRIA数据集中样本进行聚类分析。通过对比试验表明:改进后的YOLOv3方法在INRIA数据集上能够有效地检测小尺度的目标,与原方法相比在精度上提升了4.26%、召回率提升5%且检测每张图片所需的时间减少了33.6%。  相似文献   

3.
伍鹏瑛    张建明    彭建    陆朝铨   《智能系统学报》2019,14(2):306-315
针对真实场景下的行人检测方法存在漏检、误检率高,以及小尺寸目标检测精度低等问题,提出了一种基于改进SSD网络的行人检测模型(PDIS)。PDIS通过引出更底层的输出特征图改进了原始SSD网络模型,并采用卷积神经网络不同层输出的抽象特征对行人目标分别做检测,融合多层检测结果,提升了小目标行人的检测性能。此外,针对数据集样本多样性能有效地提升检测算法的泛化能力,本文采集了不同光照、姿态、遮挡等复杂场景下的行人图像,对背景比较复杂的INRIA行人数据集进行了扩充,在扩增的行人数据集上训练的PDIS模型,提高了在真实场景下的行人检测精度。实验表明:PDIS在INRIA测试集上测试结果达到93.8%的准确率,漏检率低至7.4%。  相似文献   

4.
针对深度卷积神经网络随着卷积层数增加而导致网络模型难以训练和性能退化等问题,提出了一种基于深度残差网络的人脸表情识别方法。该方法利用残差学习单元来改善深度卷积神经网络模型训练寻优的过程,减少模型收敛的时间开销。此外,为了提高网络模型的泛化能力,从KDEF和CK+两种表情数据集上选取表情图像样本组成混合数据集用以训练网络。在混合数据集上采用十折(10-fold)交叉验证方法进行了实验,比较了不同深度的带有残差学习单元的残差网络与不带残差学习单元的常规卷积神经网络的表情识别准确率。当采用74层的深度残差网络时,可以获得90.79%的平均识别准确率。实验结果表明采用残差学习单元构建的深度残差网络可以解决网络深度和模型收敛性之间的矛盾,并能提升表情识别的准确率。  相似文献   

5.
改进的卷积神经网络在行人检测中的应用   总被引:1,自引:0,他引:1  
针对当前行人检测方法计算量大,行人特征提取复杂,检测结果易受复杂背景影响等问题,提出一种改进的卷积神经网络(convolutional neural network,CNN)模型。该模型在传统CNN基础上加入选择性注意层,模拟人眼的选择性注意功能,过滤复杂背景,突出行人特征。分别采用LBP(local binary pattern)纹理处理和梯度处理对选择性注意层进行训练,对比训练结果得到最优模型。分别在INRIA、NICTA和Daimler行人数据集上进行实验,结果表明,该模型在行人检测中准确率明显优于传统CNN、HOG+SVM、Haar+SVM、PCA+SVM,在INRIA、NICTA和Daimler行人数据集上的准确率分别达到了96.14%、96.64%和99.78%。  相似文献   

6.
提出基于YOLOV3和DenseNet相结合的轻量化行人检测算法。加入HSV图像处理模块强化行人特征,利用卷积神经网络提取行人特征,通过k均值聚类算法筛选预测框,借鉴特征金字塔的思想做高低层特征融合和预测,利用Dense Block结构对网络轻量化进行完善,在国际广泛使用的行人数据集上进行一系列实验。实验结果表明,检测速度比现有的优秀目标检测模型YOLOV3提升了8倍,模型大小为YOLOV3的1/107,所提方法在测试集上的实时性和准确率都有所提高。  相似文献   

7.
针对YOLO v3模型定位目标边界框不够精确等问题,提出一种改进的YOLO算法.该算法在网络的残差模块中通过并行地引入通道注意力及空间注意力来提取关键目标特征,对多尺度预测与动物种类预测的方法做了新的设计.为证实算法效果,采集大量的原始图像数据,建立青藏高原地区牦牛、藏系羊和马等畜牧业动物图像数据集.数据集上新模型训练...  相似文献   

8.
针对自动驾驶场景下行人检测任务中对中、小尺寸目标和被遮挡目标的检测需求,以及现有深度学习模型的不足,提出基于ResNet34_D的改进YOLOv3模型:通过改进残差网络的卷积块结构提出ResNet34_D,并作为YOLOv3的主干网络以降低模型尺寸和训练难度;在ResNet34_D的3个尺度卷积特征图之后,增加SPP层和DropBlock模块以提高模型的泛化能力;基于K-means聚类算法确定自适应的多尺度锚框尺寸,提高对大、中、小3种尺寸行人目标的检测能力;引入DIoU损失函数,提高对被遮挡目标的识别能力.所提出模型的消融实验验证了各个改进部分在提高模型检测准确率上的有效性.实验结果表明,所提出的基于ResNet34_D的改进YOLOv3模型具有较好的准确率和实时性,在BDD100K-Person数据集上的AP50达到69.8%,检测速度达到130 FPS.由所提出方法与现有目标检测方法的对比实验可知,所提出方法对小目标和遮挡目标的误检率更低,速度更快,具有一定的实际应用价值.  相似文献   

9.
针对现有网络入侵检测系统对网络行为检测准确率较低、实时性较差、泛化性能较低的问题,利用深度学习具有良好分类性能及强泛化能力等优点,设计基于增益率算法和卷积神经网络算法的网络入侵检测模型。采用增益率筛选数据集数据特征,在保证入侵检测准确率的同时,缩短卷积神经网络训练时间。实验结果表明,该模型相比其他基于机器学习的入侵检测模型具有较高的准确率和较强的泛化能力,同时优化卷积神经网络训练方式,保证准确率的同时使神经网络训练时间减少了77%。  相似文献   

10.
针对输电线路无人机巡检图像中绝缘子自爆缺陷目标小而难以精准检测的问题,提出一种基于Faster R-CNN和改进的YOLO v3级联双模型的绝缘子自爆缺陷检测算法。首先,利用无人机巡检图像构建绝缘子串缺陷数据集,并对训练图像样本进行翻转预处理,增加样本数量,提高模型泛化能力,避免过拟合;然后,利用Faster R-CNN检测图像中的绝缘子串,再将检测到的绝缘子串图像送入改进的YOLO v3网络进行自爆缺陷的定位。改进的YOLO v3网络是在YOLO v3基础上借鉴FPN的思想,增加特征提取层并进行特征融合,充分利用深层特征和浅层特征;同时采用CIoU Loss函数作为损失函数,以解决边界框宽高比尺度信息。实验结果表明,本文算法在所构建的绝缘子缺陷数据集上的检测准确率达到91.2%,相比Faster R-CNN或YOLO v3等单模型检测算法提升了3.31个百分点以上,能有效实现无人机巡检中绝缘子自爆缺陷的检测,为输电线路智能化巡检故障诊断提供方法支持。  相似文献   

11.
基于深度卷积神经网络的行人检测   总被引:1,自引:0,他引:1  
行人检测一直是目标检测研究与应用中的热点。目前行人检测主要通过设计有效的特征提取方法建立对行人特征的描述,然后利用分类器实现二分类。卷积神经网络作为深度学习的重要组成,在图像、语音等领域得到了成功应用。针对人工设计的特征提取方法难以有效表达复杂环境下行人特征的问题,提出采用多层网络构建深度卷积神经网络实现对行人检测的方法。系统分析了卷积神经网络层数、卷积核大小、特征维数等对识别效果的影响,优化了网络参数。实验结果表明该方法对于行人检测具有很高的识别率,优于传统方法。  相似文献   

12.
为了解决YOLO系列目标检测算法存在的精度与计算成本不均衡、模型泛化性不足的问题,提出了可满足不同光照场景下目标检测需求的高精度快速的车辆与行人检测模型YOLO-Day Night and Fast(YOLO-DNF)。文中结合当下主流检测模型所使用的卷积神经网络分析卷积结构与网络深度对于主干网络特征提取能力和计算成本的影响,针对网络不同层次选取卷积结构Arrow-Block与CSP-Block搭建网络并通过量化堆叠单元的计算成本确定网络深度,提出低计算成本、高特征提取能力的ACNet网络。此外分析了白天与夜间图像的亮度差异,引入了HSV域扰动并提出亮度处理的数据增强策略,提升了模型的夜间检测精度,改善了模型泛化性不足的问题。实验结果表明:YOLO-DNF模型在SODA10M数据集仅含白天图像的训练集中训练后以每秒24.36帧的检测速率达到32.8%的全时段mAP检测精度,检测精度与速度超过目前主流检测模型。其中夜间精度达到了27.7%,扩展了模型的检测应用场景。  相似文献   

13.
SSD(single shot multi-box detector)是目前广泛应用于行人检测的神经网络算法,为了提高其检测精度和检测速度,对SSD算法进行了有效改进(改进后的算法称为XSSD-P)。选择Xception网络作为XSSD-P算法的骨干网络并重新选择用于预测的特征层;根据行人外形尺寸的特征设计了多尺度卷积核和基础锚框,并将二者耦合,基础锚框通过调节自身大小得到锚框(anchors)用于位置回归;再使用深度可分离卷积代替常规卷积在特征图上进行预测,实现了行人的有效检测。在INRIA数据集、VOC数据集和COCO数据集上进行检测精度对比测试,与SSD以及其他主流算法相比,XSSD-P算法在行人检测方面拥有更高的检测精度,并在Caltech行人数据集和MIT行人数据集中验证了XSSD-P算法的泛化性能。在检测速度方面,与SSD算法相比,XSSD-P算法的检测速度高出30 FPS,提高了42.86%。实验结果表明,XSSD-P的检测精度和检测速度均优于SSD算法。  相似文献   

14.
针对煤矿井下环境恶劣、光照差、背景混杂、行人模糊、行人多尺度等问题,提出了一种改进的Faster RCNN煤矿井下行人检测方法,使用深度卷积神经网络代替传统的手工设计特征方式自动地从图片中提取特征。利用深度学习通用目标检测框架Faster RCNN,以Faster RCNN算法为基础,对候选区域网络(Region Proposals Network,RPN)结构进行了改进,提出了一种“金字塔RPN”结构,来解决井下行人存在的多尺度问题;同时算法中加入了特征融合技术,将不同卷积层输出的特征图进行融合,增强煤矿井下模糊、遮挡和小目标行人的检测性能。实验结果表明:改进的Faster RCNN可以有效解决井下行人检测问题,在井下行人数据集上获得了90%的检测准确率,并在公测数据集VOC 07上对改进算法进行了验证。  相似文献   

15.
针对目前普通卷积神经网络(CNN)在表情和性别识别任务中出现的训练过程复杂、耗时过长、实时性差等问题,提出一种深度可分卷积神经网络的实时人脸表情和性别识别模型。首先,利用多任务级联卷积网络(MTCNN)对不同尺度输入图像进行人脸检测,并利用核相关滤波(KCF)对检测到的人脸位置进行跟踪进而提高检测速度。然后,设置不同尺度卷积核的瓶颈层,用通道合并的特征融合方式形成核卷积单元,以具有残差块和可分卷积单元的深度可分卷积神经网络提取多样化特征,并减少参数数量,轻量化模型结构;使用实时启用的反向传播可视化来揭示权重动态的变化并评估了学习的特征。最后,将表情识别和性别识别两个网络并联融合,实现表情和性别的实时识别。实验结果表明,所提出的网络模型在FER-2013数据集上取得73.8%的识别率,在CK+数据集上的识别率达到96%,在IMDB数据集中性别分类的准确率达到96%;模型的整体处理帧率达到80 frame/s,与结合支持向量机的全连接卷积神经网络方法所得结果相比,有着1.5倍的提升。因此针对数量、分辨率、大小等差异较大的数据集,该网络模型检测快,训练时间短,特征提取简单,具有较高的识别率和实时性。  相似文献   

16.
目标检测的任务是从图像中精确且高效地识别、定位出大量预定义类别的物体实例。随着深度学习的广泛应用,目标检测的精确度和效率都得到了较大提升,但基于深度学习的目标检测仍面临改进与优化主流目标检测算法的性能、提高小目标物体检测精度、实现多类别物体检测、轻量化检测模型等关键技术的挑战。针对上述挑战,本文在广泛文献调研的基础上,从双阶段、单阶段目标检测算法的改进与结合的角度分析了改进与优化主流目标检测算法的方法,从骨干网络、增加视觉感受野、特征融合、级联卷积神经网络和模型的训练方式的角度分析了提升小目标检测精度的方法,从训练方式和网络结构的角度分析了用于多类别物体检测的方法,从网络结构的角度分析了用于轻量化检测模型的方法。此外,对目标检测的通用数据集进行了详细介绍,从4个方面对该领域代表性算法的性能表现进行了对比分析,对目标检测中待解决的问题与未来研究方向做出预测和展望。目标检测研究是计算机视觉和模式识别中备受青睐的热点,仍然有更多高精度和高效的算法相继提出,未来将朝着更多的研究方向发展。  相似文献   

17.
考虑到现有的基于检测的多目标跟踪算法多会出现因目标漏检或数据关联算法冗余而造成的目标ID频繁切换、跟踪轨迹断开等问题,提出了无人车驾驶场景下的多目标车辆与行人跟踪算法.首先,选取CenterNet网络作为目标检测器,并用嵌入了1×1卷积和SE-Net的Res2Net来替代网络原有的残差单元,以提升网络对空间信息和通道信息的提取能力,提高目标检测器性能.接着,用孪生网络来提取目标所在区域的特征,进行关联概率度量,再用匈牙利算法对相邻帧目标进行关联.最后,用区域推荐网络设计的辅助跟踪器对漏检或消失又出现的目标进行持续跟踪,并将可靠的跟踪结果合并到轨迹中.实验结果表明,与已有的方法对比,所提方法在KITTI跟踪基准数据集上对于车辆与行人的跟踪具有竞争力.  相似文献   

18.
目的 行人检测是目标检测中的一个基准问题,在自动驾驶等场景有着较大的实用价值,在路径规划和智能避障方面发挥着重要作用。受限于现实的算法功耗和运行效率,在自动驾驶场景下行人检测存在检测速度不佳、遮挡行人检测精度不足和小尺度行人漏检率高等问题,在保证实时性的前提下设计一种适合行人检测的算法,是一项挑战性的工作。方法 本文旨在解决自动驾驶场景中耗时长、行人遮挡和小尺度行人检测结果精度低的问题,提出了一种尺度注意力并行检测算法(scale-aware and efficient object detection,Scale-aware EfficientDet):在特征提取与检测中使用了EfficientDet的主干网络,保证算法效率和功耗的平衡;在行人遮挡方面,为了提高模型对遮挡现象的检测精度,引入了可以增强行人与其他物体之间特征差异的损失函数;在提高小目标行人检测精度方面,采用scale-aware双路网络算法来增加对小目标行人的检测精度。结果 本文选择Caltech行人数据集作为对比数据集,选取YOLO(you only look once)、YOLOv3、SA-FastRCNN(scale-aware fast region-based convolutional neural network)等算法进行对比,在运行效率方面,本文算法在连续输入单帧图像的情况下达到了35帧/s,多图像输入时达到了70帧/s的工作效率;在模型精度测试中,本文算法也略胜一筹。本文算法应用于2020年中国智能汽车大赛中,在安全避障环节皆获得满分。结论 本文设计的尺度感知的行人检测算法,在EfficientDet高性能检测器的基础上,通过结合损失函数、scale-aware双路子网络的改进,进一步提升了本文检测器的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号