首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
近年来基于深度卷积神经网络的目标检测算法已经成为了主流,Faster R-CNN就是一种主流的目标检测算法。在Faster R-CNN卷积神经网络的基础上,使用DIoU来评价预测框和真实框的距离。针对Faster R-CNN小目标检测效果不好的缺陷,将原算法中的候选区域池化RoI Pooling改进为检测更为精确的区域特征聚集方式RoI Align。此外还改进了原算法中锚框的非极大值抑制方法,增加了算法的平均检测率。最后在公开数据集MS COCO、PASCAL VOC 2007、PASCAL VOC 2012上进行对比训练,在PASCAL VOC 2007测试集上进行验证。实验结果表明改进后的目标检测算法能够有效提高原Faster R-CNN算法的目标检测率。  相似文献   

2.
借鉴目标识别领域的快速区域卷积神经网络(Fast RCNN),提出了基于Faster RCNN的行人检测方法,利用CNN提取图像特征,通过聚类和构建区域建议网络(RPN)提取可能含有行人的区域,利用检测网络对目标区域进行判别和分类,并在INRIA数据集中进行了测试验证。实验结果表明:相比基于可变形的组件模型(DPM)的行人检测方法,提出的方法,在测试集上检测准确度达到92. 7%,相比现有的其他方法,其检测效果更好。  相似文献   

3.
面向多尺度目标检测的改进Faster R-CNN算法   总被引:2,自引:0,他引:2  
由于多尺度目标检测中图像目标尺度差异性大,基于单层次特征提取的目标检测算法或者导致小目标特征提取丢失、扭曲,或者导致大目标特征提取冗余度过高,检测效果不理想.为此,基于Faster R-CNN思想,提出一种多尺度目标检测算法.首先采用多层次提取特征策略提取多尺度目标特征;然后统计目标真实框大小与纵横比,设置锚点规格;最后采用多通道方法生成多尺度目标候选框.基于PASCAL VOC数据集的实验结果表明,该算法总体漏检率为9.7%,平均精度的均值为75.2%,检测性能较当前主流的多尺度目标检测算法有一定的提高.  相似文献   

4.
鉴于目标检测中的物体外观会根据其基本形状及不同的姿势和视角而有很大的差异,对Faster R-CNN算法进行研究并提出一种多通道检测算法.根据图像宽高比给生成的Ro I分配由3个通道组成的网络进行训练和测试,通过最小化正则函数R(W)和3对损失函数之和L(W)来优化网络,3个通道共享fc6层来提高检测性能并节省内存空间.为验证算法的有效性,在多个数据集和自己拍摄的图像上进行实验验证,实验结果表明,在PASCALVOC2012数据集中改进算法平均精度为78.8%,相比其它相关算法在不同程度上有所提高.  相似文献   

5.
针对人工和传统自动化算法检测发动机零件表面缺陷中准确率和效率低下,无法满足智能制造需求问题,提出了一种基于深度学习的检测算法.以Faster R-CNN深度学习算法为算法框架,引入聚类理论来确定anchor方案,通过对比k-meansII和CURE聚类算法生成anchor对检测结果的影响,提出了基于聚类生成anchor方案的Faster R-CNN的零件表面缺陷检测算法,并引入多级ROI池化层结构,减少ROI池化过程中取整带来的偏差,实现高效并准确检测零件表面缺陷的目的.通过设计缺陷图像数据采集方案,建立了3种缺陷零件数据集,并验证了算法的性能.实验结果表明,该算法将缺陷检测的均值平均精度mAP从原算法的54.7%提高到97.9%,检测速度最快达到4.9 fps,能够满足智能制造的生产需求.  相似文献   

6.
随着科学技术的不断发展,人工智能技术也逐渐应用于日常教学之中。设计了一种基于表情识别的课堂状态检测分析方法,该方法通过实时检测学生的表情信息和学生在课堂中的专注率指标检测课堂状态。其中,表情信息的获取算法以深度学习技术为背景,卷积神经网络技术为基础,建立了表情识别模型。该模型以残差网络ResNet18为主干网络,并添加了注意力机制作为辅助模块进一步引导表情特征融合过程,提高了模型的泛化能力和识别准确性。所设计的课堂状态检测方法能够高效地检测和记录学生的上课状态,为老师了解授课质量和改变授课方式提供一个有力的参考依据。  相似文献   

7.
针对基于深度学习的静态人脸图像表情识别方法进行研究,首先介绍了深度学习的原理,并归纳了目前公开且常用的面部表情数据集;然后介绍了基于深度学习的表情识别的三个步骤,归纳了图像预处理和表情分类的主要方法,重点总结了目前性能较好用来提取特征的深度学习框架以及这些方法的基本原理和优劣势比较;最后指出了目前面部表情识别存在的问题和未来可能的发展趋势。  相似文献   

8.
面部表情识别方法综述   总被引:2,自引:0,他引:2  
介绍了表情识别难点及研究现状;重点阐述了不同的人脸表情特征提取方法和基于分类器的表情识别方法,并对各种方法进行了简单的分析比较;最后针对鲁棒性的需求,给出了人脸表情识别未来要研究的重点内容。  相似文献   

9.
10.
为了预防烟雾病引发的并发症威胁患者生命,需要对烟雾病进行及时有效的诊断。本文提出了一种改进的Faster RCNN算法用于烟雾病检测。首先,提取颈内动脉数字减影血管造影(Digital subtraction angiography,DSA)图像,并进行数据增强,训练集、验证集和测试集之比为6∶2∶2。使用ResNet101网络作为特征提取网络,避免血管特征在卷积和池化过程中产生模糊或丢失;结合区域生成网络(Region proposal network, RPN),定位烟雾病病灶的位置;再将Faster RCNN模型中的ROI Pooling替换为ROI Align进行特征映射,避免由量化带来的误差影响。本文采用平均精度(Average precision,AP)作为算法检测性能的评估指标,所用方法对正常样本和烟雾病样本检测的AP分别为99.23%和89.39%。实验结果表明,该方法可以实现烟雾病的快速有效检测,可在复杂的血管网中准确检测烟雾病病灶的位置,为烟雾病辅助诊断提供一定的技术支持。  相似文献   

11.
针对煤矿井下环境恶劣、光照差、背景混杂、行人模糊、行人多尺度等问题,提出了一种改进的Faster RCNN煤矿井下行人检测方法,使用深度卷积神经网络代替传统的手工设计特征方式自动地从图片中提取特征。利用深度学习通用目标检测框架Faster RCNN,以Faster RCNN算法为基础,对候选区域网络(Region Proposals Network,RPN)结构进行了改进,提出了一种“金字塔RPN”结构,来解决井下行人存在的多尺度问题;同时算法中加入了特征融合技术,将不同卷积层输出的特征图进行融合,增强煤矿井下模糊、遮挡和小目标行人的检测性能。实验结果表明:改进的Faster RCNN可以有效解决井下行人检测问题,在井下行人数据集上获得了90%的检测准确率,并在公测数据集VOC 07上对改进算法进行了验证。  相似文献   

12.
针对利用Faster RCNN识别绝缘子图像过程中定位不够准确的问题,提出一种注意力机制和Faster RCNN相结合的绝缘子识别方法。在特征提取阶段引入基于注意力机制的挤压与激励网络(Squeeze-and-Excitation Networks,SENet)结构,使模型能够关注与目标相关的特征通道并弱化其他无关的特征通道;根据绝缘子的特点,对区域建议网络(region proposal network,RPN)生成锚点(anchor)的比例和尺度进行调整;在全连接层运用注意力机制对周围建议框的特征向量赋予不同权重并进行融合,更新目标建议框的特征向量。实验结果表明:与传统的Faster RCNN算法相比,改进后的算法能够较好地识别出绝缘子。  相似文献   

13.
徐代  岳璋  杨文霞  任潇 《计算机应用》2020,40(5):1315-1321
为了进一步提高对拼接、缩放旋转、复制粘贴三种主要篡改手段的识别准确率,增强算法普适性,提出了一个基于三向流特征提取的卷积神经网络篡改图像识别系统。首先,分别根据图像局部彩色不变量特性比较特征子块相似度,根据噪声相关性比较篡改区域边缘的噪声相关系数,以及根据图像重采样痕迹计算子块标准偏差对比度,完成了对图像RGB流、噪声流和信号流的特征提取;然后,通过多线性池化,结合改进的分段AdaGrad梯度算法,实现了特征降维和参数自适应更新;最后,通过网络训练和分类,完成了对拼接、缩放旋转、复制粘贴这三种主要的图像篡改手段的识别与相应的篡改区域的定位。为衡量所提模型的效果,在VOC2007和CIFAR-10两个数据集上进行了实验。在约9000张图像上的实验结果表明,该模型对拼接、缩放旋转、复制粘贴这三种篡改手段均能进行较准确的识别与定位,识别率分别为0.962、0.956和0.935。与对照文献的双向流特征提取方法相比,该模型的识别率分别提高了1.050%、2.137%、2.860%。三向流特征提取模型丰富了卷积神经网络对图像的特征信息采集,提高了网络的学习性能与识别精度,同时改进的梯度算法通过分段控制参数学习率的下降速度,降低了过拟合,减少了收敛震荡,提高了收降速度,实现了算法的优化设计。  相似文献   

14.
针对已有安全帽佩戴检测算法对部分遮挡、尺寸不一和小目标存在检测难度大、准确率低的问题,提出了基于改进的Faster RCNN和多部件结合的安全帽佩戴检测方法。在原始Faster RCNN上运用多尺度训练和增加锚点数量增强网络检测不同尺寸目标的鲁棒性,并引入防止正负样本不均衡的在线困难样本挖掘策略,然后对检测出的佩戴安全帽工人和安全帽等采用多部件结合方法剔除误检目标。实验表明,相比于原始Faster RCNN,检测准确率提高了7%,对环境的适应性更强。  相似文献   

15.
纺织工业是我国的支柱型产业.在布匹生产过程中,布匹瑕疵是影响布匹质量的关键因素.目前纺织服装生产企业主要通过传统的人工肉眼检测布匹瑕疵,成本高、效率低,且漏检率与误检率高.本研究针对布匹数据集中类别数量不均匀的特点,对数据进行增强.在布匹瑕疵类别识别上,采用Faster RCNN模型,并针对布匹数据集中瑕疵目标小的特点...  相似文献   

16.
传统的分拣作业无法伴随工作环境的变化进行相应的调整,针对此种不足,出现了基于机器视觉的分拣机器人的相关研究,通过将图像处理和特征工程技术引入视觉模块,使得分拣系统能适时的调整.不同于这些方法,本研究基于实验室的工业分拣系统,将深度学习方法应用其中.通过将Faster RCNN检测算法引入视觉模块并对区域提取网络RPN进行相关改进,加快Faster RCNN模型的检测过程,使得该系统满足工业的实时性要求.Faster RCNN作为一种端到端的方法,能自动对输入图像生成更具表达力的特征,对相应目标提取相应特征,这避免了人工设计特征,它的特征自动生成能力使其能适用于各种场景,这提升了工业分拣机器人的环境适应能力.  相似文献   

17.
目标检测方法甚高速卷积神经网络(Faster Region-based Convolutional Neural Network,Faster RCNN)在训练过程中存在负样本远多于正样本的问题,即数据集不平衡问题。针对该问题,提出了一个综合定位误差和分类误差的判别函数用于判别难正样本,基于该函数和难负样本挖掘提出了改进的自助采样法,并提出了基于该自助采样的 “五步训练法”用于训练Faster RCNN。与传统的Faster RCNN训练方法相比,五步法加强了对难样本的学习,提高了网络泛化能力,减少了误判;训练出的模型在Pascal VOC 2007数据集上测试的平均正确率均值(mean Average Precision,mAP)提高了2.4%,在FDDB(Face Detection Data Set and Benchmark)相同检出率下误检率降低了3.2%,且边框拟合度更高。  相似文献   

18.
针对货车利用躲避摄像头等手段在城市道路中不按规定时间、规定线路行驶,使得车辆不能被准确识别的问题,提出基于改进Faster RCNN的城市道路货车检测方法.该方法以Faster RCNN为基础模型,通过对传入主干网络的车辆图片进行卷积和池化等操作来提取特征,其中增加特征金字塔网络(FPN)提升对多尺度目标检测的精度;同时将K-means聚类算法应用在数据集上以获取新的锚点框;利用RPN (region proposal network)生成建议框;并使用CIoU (complete-IoU)损失函数代替原算法的smoothL1损失函数以提升检测车辆的精确性.实验结果显示,改进后的Faster RCNN相比原算法对货车检测的平均精度(AP)提高7.2%,召回率(recall)提高6.1%,减少了漏检的可能,在不同场景下具有良好的检测效果.  相似文献   

19.
近年来,图像检测方法已经被应用于很多领域.然而,这些方法都需要在目标任务上进行大量边框标注数据的重新训练.本文基于Faster RCNN方法,并对其进行改进,解决了在小数据且无需边框标注的情况下的商品图像检测问题.首先对Faster RCNN的边框回归层进行改进,提出了一种非类别特异性的边框回归层,仅使用公开数据集训练,无需在目标数据集上进行再训练,并将其用于数据预标定与商品检测.然后结合Grabcut与非类别特异性Faster RCNN提出了一种样本增强方法,用来生成包含多个商品的训练图像;并为Faster RCNN添加了重识别层,提高了检测精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号