首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
鉴于目标检测中的物体外观会根据其基本形状及不同的姿势和视角而有很大的差异,对Faster R-CNN算法进行研究并提出一种多通道检测算法.根据图像宽高比给生成的Ro I分配由3个通道组成的网络进行训练和测试,通过最小化正则函数R(W)和3对损失函数之和L(W)来优化网络,3个通道共享fc6层来提高检测性能并节省内存空间.为验证算法的有效性,在多个数据集和自己拍摄的图像上进行实验验证,实验结果表明,在PASCALVOC2012数据集中改进算法平均精度为78.8%,相比其它相关算法在不同程度上有所提高.  相似文献   

2.
面向多尺度目标检测的改进Faster R-CNN算法   总被引:2,自引:0,他引:2  
由于多尺度目标检测中图像目标尺度差异性大,基于单层次特征提取的目标检测算法或者导致小目标特征提取丢失、扭曲,或者导致大目标特征提取冗余度过高,检测效果不理想.为此,基于Faster R-CNN思想,提出一种多尺度目标检测算法.首先采用多层次提取特征策略提取多尺度目标特征;然后统计目标真实框大小与纵横比,设置锚点规格;最后采用多通道方法生成多尺度目标候选框.基于PASCAL VOC数据集的实验结果表明,该算法总体漏检率为9.7%,平均精度的均值为75.2%,检测性能较当前主流的多尺度目标检测算法有一定的提高.  相似文献   

3.
针对人工和传统自动化算法检测发动机零件表面缺陷中准确率和效率低下,无法满足智能制造需求问题,提出了一种基于深度学习的检测算法.以Faster R-CNN深度学习算法为算法框架,引入聚类理论来确定anchor方案,通过对比k-meansII和CURE聚类算法生成anchor对检测结果的影响,提出了基于聚类生成anchor方案的Faster R-CNN的零件表面缺陷检测算法,并引入多级ROI池化层结构,减少ROI池化过程中取整带来的偏差,实现高效并准确检测零件表面缺陷的目的.通过设计缺陷图像数据采集方案,建立了3种缺陷零件数据集,并验证了算法的性能.实验结果表明,该算法将缺陷检测的均值平均精度mAP从原算法的54.7%提高到97.9%,检测速度最快达到4.9 fps,能够满足智能制造的生产需求.  相似文献   

4.
目的 火焰检测可有效防止火灾的发生。针对目前火焰检测方法,传统图像处理技术的抗干扰能力差、泛化性不强,检测效果对数据波动比较敏感;机器学习方法需要根据不同的场景设定并提取合适火焰的特征,过程比较繁琐。为此提出一种基于Faster R-CNN的多类型火焰检测方法,避免复杂的人工特征提取工作,在面对复杂背景、光照强度变化和形态多样的火焰图像时依然保证较好的检测精度。方法 基于深度学习的思想,利用卷积神经网络自动学习获取图像特征。首先,利用自建数据集构建视觉任务。根据火焰的尖角特性、直观形态和烟雾量等,将火焰类数据划分为单尖角火焰、多尖角火焰和无规则火焰3类。此外,通过深度网络特征可视化实验发现,人造光源与火焰在轮廓上具有一定的相似性,为此建立了人造光源圆形和方形两个数据集作为干扰项来保证检测模型的稳定性;然后,细化训练参数并调整预训练的卷积神经网络结构,改动分类层以满足特定视觉任务。将经过深度卷积神经网络中卷积层和池化层抽象得到的图像特征送入区域生成网络进行回归计算,利用迁移学习的策略得到每一类目标物体相应的探测器;最后,得到与视觉任务相关的目标检测模型,保存权重和偏置参数。并联各类目标物体的子探测器作为整体探测器使用,检测时输出各类探测器的分数,得分最高的视为正确检测项。结果 首先,利用训练好的各探测器与相应测试集样本进行测试,然后,再利用各类目标物的测试集来测试其他类探测器的检测效果,以此证明各探测器之间的互异性。实验结果表明,各类探测器都具有较高的专一性,大大降低了误判的可能性,对于形变剧烈和复杂背景的火焰图像也具有良好的检测准确率。训练得到的检测模型在应对小目标、多目标、形态多样、复杂背景和光照变化等检测难度较大的情况时,均能获得很好的效果,测试集结果表明各类探测器的平均准确率提高了3.03% 8.78%不等。结论 本文提出的火焰检测方法,通过挖掘火焰的直观形态特征,细分火焰类别,再利用深度卷积神经网络代替手动特征设置和提取过程,结合自建数据集和根据视觉任务修改的网络模型训练得到了检测效果良好的多类型火焰检测模型。利用深度学习的思想,避免了繁琐的人工特征提取工作,在得到较好的检测效果的同时,也保证了模型具有较强的抗干扰能力。本文为解决火焰检测问题提供了更加泛化和简洁的解决思路。  相似文献   

5.
随着人工智能的发展,数字图像被广泛应用于各大领域。然而,图像编辑软件的出现导致大量图像受到恶意篡改,严重影响了图像内容的真实性。图像篡改检测的研究不同于通用的目标检测,它需要更加关注图像本身的篡改信息,而这些信息表现形式往往比较微弱,所以检测时需要侧重于学习更丰富的篡改特征。提出一种结合梯度边缘信息和注意力机制的双流Faster R-CNN模型,可以实现不同篡改类型区域的检测定位。双流之一为原色流,利用注意力机制提取图像的表层特征,如亮度对比、篡改边界的视觉差异等。双流之二为梯度流,利用梯度高通滤波器增强真实区域与篡改区域之间的边缘异常特征,使模型更容易发现篡改图像中微弱的篡改痕迹。通过紧凑型双线性池化将原色流和梯度流的特征进行融合。由于公开可用的图像篡改数据集规模较小,基于PASCAL VOC 2012数据集创建了规模为10 000幅的图像篡改检测数据集,用于模型预训练。在COVER、COLUMBIA和CASIA数据集上的检测结果表明,所提模型的检测精度相比当前最好模型的提高了7.1%~9.6%,并在JPEG压缩和图像模糊攻击下表现出了更高的鲁棒性。  相似文献   

6.
由于人体行为类内差异大,类间相似性大,而且还存在视觉角度与遮挡等问题,使用人工提取特征的方法特征提取难度大并且难以提取有效特征,使得人体行为检测率较低。针对这个问题,本文在物体检测的基础上使用检测效果较好的Faster R-CNN算法来进行人体行为检测,并对Faster R-CNN算法与批量规范化算法和在线难例挖掘算法进行结合,有效利用了深度学习算法实现人体行为检测。对此改进算法进行实验验证,验证的分类和位置精度达到了80%以上,实验结果表明,改进的算法具有识别精度高的特点。  相似文献   

7.
电力作业危险系数较高、事故频发。电力作业人员的安全问题备受关注。为更好地规范人员的电力作业行为、避免事故发生,研究了基于深度学习算法和视频监控技术的实时监控和预警模型。通过研究机器学习算法的特征提取网络,提出了一种区域建议网络(RPN)、残差网络(ResNet)特征网络。该特征网络是将不同子网络的特征图自上而下叠加操作后形成特征图,再对新特征图进行区域建议操作。输入基于候选区域的卷积神经网络(R-CNN)进行识别和回归修正,得出目标结果。试验结果表明,相较于传统的ResNet、视觉几何组(VGG)-16网络,RPN-ResNet特征网络的目标识别率提升了3%以上,同时也保障了算法识别的实时性。高效、实时的预警,有效地保障了电力作业的安全性。  相似文献   

8.
指针仪表识别并读数是机房巡检的重要任务,该文基于图像处理和深度学习算法,设计了一种指针仪表识别系统。首先,通过巡检机器人采集机房巡检的数据集;其次,对Faster R-CNN模型进行池化策略改进,并使用更深的ResNet152残差网络,实现仪表区域的识别和定位;最后,使用边缘检测结合霍夫变换对仪表进行矫正和读数。实验结果表明,改进后的Faster R-CNN模型准确率较高,平均精确度提高了6.2%,也优于当前主流的网络模型。该模型测试的读数误差在2%以内,企业测试人员实际运行后的误差在4%内,可以满足企业巡检需求,具有较好的应用价值。  相似文献   

9.
根据WHO发布的报告,每年疟疾的新发病例超过2亿,死亡人数仍居高不下.疟疾血涂片镜检法是疟疾检测的金标准,但由于人工评估所需的步骤繁琐,即使在经验丰富的医师手中,这种诊断方法也很耗时并且容易发生漏检和误检.此外疟原虫细胞形状、密度和颜色的变化以及某些细胞类的不确定性等因素,对疟原虫检测提出了重大挑战.基于深度学习的神经...  相似文献   

10.
合成孔径雷达(Synthetic Aperture Radar, SAR)船舶检测在海洋交通监控中发挥着重要作用,传统SAR目标检测算法一般利用目标与背景杂波之间的对比度差异进行检测,在近岸海域等复杂场景下检测效果较差。为了提高在复杂场景下的检测性能,本文提出一种基于改进Faster R-CNN的船舶检测方法,在分析不同特征分辨率对检测性能影响的基础上,结合VGG的思想与扩张卷积设计一个适用于SAR船舶目标检测的特征提取网络,以提升对小型船舶目标的检测能力。另外,根据sentinel-1A数据集中目标尺寸分布选取小尺寸anchor,并通过去除冗余anchor,将检测速度提升了一倍。在sentinel-1A数据集上的实验证明本文提出的算法能够快速、有效地从复杂场景SAR图像中检测出船舶目标。  相似文献   

11.
随着多旋翼无人机引入输电线路巡检作业后,对巡线人员通过图像判断线路上设备是否有缺陷提出了新的挑战。为了帮助巡线人员做出准确决策,提高发现缺陷的能力,基于深度卷积神经网络,搭建了适用于无人机图像识别的输电线路缺陷识别网络模型。首先详细描述了输电线路缺陷识别图像数据库的建立过程,然后通过分析对比三个预训练前端网络的性能及多个参数对网络模型识别准确率的影响,得到基于Faster R-CNN的输电线路缺陷最优识别网络模型。经过测试集验证,提出的缺陷识别网络模型的识别准确率达到了90%以上,单张图片耗时达到了毫秒级,在识别准确率和耗时上均明显优于其他识别网络模型,为实际巡线工作中的输电线路缺陷判别提供智能有效的决策依据,是机器学习在智能电网中应用的有益探索。  相似文献   

12.
目的 在传统车辆目标检测问题中,需要针对不同图像场景选择适合的特征。为此提出一种基于快速区域卷积神经网络(Fast R-CNN)的场景图像车辆目标发现方法,避免传统车辆目标检测问题中需要设计手工特征的问题。方法 该方法基于深度学习卷积神经网络思想。首先使用待检测车辆图像定义视觉任务。利用选择性搜索算法获得样本图像的候选区域,将候选区域坐标与视觉任务示例图像一起输入网络学习。示例图像经过深度卷积神经网络中的卷积层,池化层计算,最终得到深度卷积特征。在输入时没有规定示例图像的规格,此时得到的卷积特征规格不定。然后,基于Fast R-CNN网络结构,通过感兴趣区域池化层规格化特征,最后将特征输入不同的全连接分支,并行回归计算特征分类,以及检测框坐标值。经过多次迭代训练,最后得到与指定视觉任务强相关的目标检测模型,具有训练好的权重参数。在新的场景图像中,可以通过该目标检测模型检测给定类型的车辆目标。结果 首先确定视觉任务包含公交车,小汽车两类,背景场景是城市道路。利用与视觉任务强相关的测试样本集对目标检测模型进行测试,实验表明,当测试样本场景与视觉任务相关度越高,且样本中车辆目标的形变越小,得到的车辆目标检测模型对车辆目标检测具有良好的检测效果。结论 本文提出的车辆目标检测方法,利用卷积神经网络提取卷积特征代替传统手工特征提取过程,通过Fast R-CNN对由示例图像组成定义的视觉任务训练得到了效果良好的车辆目标检测模型。该模型可以对与视觉任务强相关新场景图像进行效果良好的车辆目标检测。本文结合深度学习卷积神经网络思想,利用卷积特征替代传统手工特征,避免了传统检测问题中特征选择问题。深层卷积特征具有更好的表达能力。基于Fast R-CNN网络,最终通过多次迭代训练得到车辆检测模型。该检测模型对本文规定的视觉任务有良好的检测效果。本文为解决车辆目标检测问题提供了更加泛化和简洁的解决思路。  相似文献   

13.
王林  张鹤鹤 《计算机应用》2018,38(3):666-670
针对传统机器学习方法在车辆检测应用中易受光照、目标尺度和图像质量等因素影响,效率低下且泛化能力较差的问题,提出一种基于改进的较快的基于区域卷积神经网络(R-CNN)模型的车辆检测方法。该方法以Faster R-CNN模型为基础,通过对输入图像进行卷积和池化等操作提取车辆特征,结合多尺度训练和难负样本挖掘策略降低复杂环境的影响,利用KITTI数据集对深度神经网络模型进行训练,并采集实际场景中的图像进行测试。仿真实验中,在保证检测时间的情况下,相对原Faster R-CNN算法检测精确度提高了约8%。实验结果表明,所提方法能够自动地提取车辆特征,解决了传统方法提取特征费时费力的问题,同时提高了车辆检测精确度,具有良好的泛化能力和适用范围。  相似文献   

14.
针对物体检测实时多目标回归算法中分别优化各四个位置参数,割裂了四个位置变量之间的关系,造成对物体的边框回归不够准确且训练不易收敛的问题,提出一种带检测评价函数(Intersection over Union,IoU)作为损失函数的实时多目标回归人脸检测算法。首先基于Redmond等提出实时多目标回归模型,采用该模型检测实时性的机制,然后融合了IoU函数作为位置参数的损失函数,将实时多目标回归模型中的四个独立位置参数整合成一个单元进行优化,避免了基础模型的缺陷。算法在人脸检测基准库FDDB上进行测试,实验结果表明:在人脸检测的有效性上优于主流的传统人脸检测算法,检测速度上领先于其他经典深度学习方法。提出的算法在检测人脸的有效性和检测速度两者之间取得了一个较好的平衡,为构建实用的人脸相关应用系统提供了参考价值。  相似文献   

15.
针对当前基于深度学习的目标检测算法采取的特征图融合方式存在缺陷,算法普遍不能很好地应对尺度变化等问题,提出一种跨深度卷积特征增强的目标检测算法CDC-YOLO。对YOLOv3算法进行改进,针对多尺度预测层各自的特点采用与之适应的特征增强模块,采用多通道的跨深度的卷积核并结合空洞卷积并行地提取特征,最终级联起来。该模块能充分利用多尺度多深度特征,形成统一的多尺度特征表达。在VOC2007test上的实验结果表明,提出算法的mAP (均值平均精度)高达82.33%,比原始YOLOv3提升了约2%,且对尺度变化大的物体鲁棒性更强。  相似文献   

16.
针对提高不同笔体下的手写识别准确率进行了研究,将深度卷积神经网络与自动编码器相结合,设计卷积自编码器网络层数,形成深度卷积自编码神经网络。首先采用双线性插值方法分别对MNIST数据集与一万幅自制中国大学生手写数字图片进行图像预处理,然后先使用单一MNIST数据集对深度卷积自编码神经网络进行训练与测试;最后使用MNIST与自制数据集中5 000幅混合,再次训练该网络,对另外5 000幅进行测试。实验数据表明,所提深度卷积自编码神经网络在MNIST测试集正确率达到99.37%,有效提高了准确率;且5 000幅自制数据集模型测试正确率达99.33%,表明该算法实用性较强,在不同笔体数字上得到了较高的识别准确率,模型准确有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号