首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对多尺度行人检测的问题,本文提出一种基于融合特征金字塔网络(Feature pyramid networks,FPN)和Faster R-CNN(Faster region convolutional neural network)的行人检测算法。首先,对FPN和区域建议网络(Region proposal networks,RPN)进行融合;然后,对FPN和Fast R-CNN进行融合;最后,在Caltech数据集、KITTI数据集和ETC数据集上分别对融合FPN和Faster R-CNN的行人检测算法进行训练和测试。该算法在Caltech数据集、KITTI数据集和ETC数据集上的mAP (mean Average Precision)分别达到69.72%, 69.76%和89.74%。与Faster R-CNN相比,该算法不仅提高了行人检测精度,而且在多尺度行人检测的问题上也获得了较为满意的检测效果。  相似文献   

2.
针对牲畜牛身份认证的多牛脸检测场景,本文给出一种基于改进Faster R-CNN的牛脸检测方法。使用Inception v2替换ZF网络作为Faster R-CNN的基础网络,模型精度得到显著提升;针对多牛检测场景对NMS(Non-Maximum Suppression)进行相应优化,使模型的召回率得到显著提升。通过和其他目标检测模型对比实验,本文的改进模型在精确率和召回率上均优于其他模型。  相似文献   

3.
目的 为了有效解决传统行人检测算法在分辨率低、行人尺寸较小等情境下检测精度低的问题,将基于区域全卷积网络(region-based fully convolutional networks,R-FCN)的目标检测算法引入到行人检测中,提出一种改进R-FCN模型的小尺度行人检测算法。方法 为了使特征提取更加准确,在ResNet-101的conv5阶段中嵌入可变形卷积层,扩大特征图的感受野;为提高小尺寸行人检测精度,在ResNet-101中增加另一条检测路径,对不同尺寸大小的特征图进行感兴趣区域池化;为解决小尺寸行人检测中的误检问题,利用自举策略的非极大值抑制算法代替传统的非极大值抑制算法。结果 在基准数据集Caltech上进行评估,实验表明,改进的R-FCN算法与具有代表性的单阶段检测器(single shot multiBox detector,SSD)算法和两阶段检测器中的Faster R-CNN(region convolutional neural network)算法相比,检测精度分别提高了3.29%和2.78%;在相同ResNet-101基础网络下,检测精度比原始R-FCN算法提高了12.10%。结论 本文提出的改进R-FCN模型,使小尺寸行人检测精度更加准确。相比原始模型,改进的R-FCN模型对行人检测的精确率和召回率有更好的平衡能力,在保证精确率的同时,具有更大的召回率。  相似文献   

4.
邹斌  张聪 《计算机应用》2023,43(1):61-66
为提高拥挤场景下的人群检测准确率,提出一种基于改进Faster R-CNN的密集人群检测算法。首先,在特征提取阶段添加空间与通道注意力机制,使用加强的双向特征金字塔网络(S-BiFPN)替代原网络中的多尺度特征金字塔(FPN),使网络对重要特征进行自主学习并加强对图像深层特征的提取;其次,引入多实例预测(MIP)算法对实例进行预测,以避免模型对拥挤场景下的目标造成漏检;最后,对模型中的非极大值抑制(NMS)进行优化,并额外增设一个交并比(IoU)阈值,以对检测结果的干扰项进行精确抑制。在开源的密集人群检测数据集上进行测试的结果显示,相较于原Faster R-CNN算法,所提算法的平均精度(AP)提升5.6%,Jaccard指数值提升3.2%。所提算法具有较高检测精度和稳定性,可以满足密集场景人群检测的需求。  相似文献   

5.
随着无人驾驶和智能驾驶技术的发展,计算机视觉对视频图像检测的实时性和准确性要求也越来越高.现有的行人检测方法在检测速度和检测精度两个方面难以权衡.针对此问题,提出一种改进的Faster R-CNN模型,在Faster R-CNN的主体特征提取网络模块中加入SE网络单元,进行道路行人检测.这种方法不仅能达到相对较高的准确率,用于视频检测时还能达到一个较好的检测速率,其综合表现比Faster R-CNN模型更好.在INRIA数据集和私有数据集上的实验表明,模型的mAP最好成绩能达到93.76%,最高检测速度达到了13.79 f/s.  相似文献   

6.
行人检测在车辆辅助驾驶、视频监控、智能机器人等领域具有重要的应用价值.针对当前行人检测算法在视频分辨率低和背景复杂的情况下存在很多误检及漏检的问题,提出一种融合多模型和帧间信息的行人检测算法.首先融合Fast R-CNN和Faster R-CNN模型的互补检测结果获取精准的检测窗口;然后采用视频帧间上下文融合算法来弥补单帧图像检测算法存在的漏检和误检.实验结果表明,在Caltech行人检测数据库上,在每幅图像虚警率(FPPI)为10%的条件下,该算法丢失率仅为14.04%,比Faster R-CNN单模型丢失率(16.09%)降低2.05%;利用多模型和帧间信息融合对行人检测结果进行校正,能提高行人检测性能.  相似文献   

7.
目的 针对Faster R-CNN (faster region convolutional neural network)模型在肺部计算机断层扫描(computed tomography,CT)图磨玻璃密度影目标检测中小尺寸目标无法有效检测与模型检测速度慢等问题,对Faster R-CNN模型特征提取网络与区域候选网络(region proposal network,RPN)提出了改进方法。方法 使用特征金字塔网络替换Faster R-CNN的特征提取网络,生成特征金字塔;使用基于位置映射的RPN产生锚框,并计算每个锚框的中心到真实物体中心的远近程度(用参数“中心度”表示),对RPN判定为前景的锚框进一步修正位置作为候选区域(region proposal),并将RPN预测的前景/背景分类置信度与中心度结合作为候选区域的排序依据,候选区域经过非极大抑制筛选出感兴趣区域(region of interest,RoI)。将RoI对应的特征区域送入分类回归网络得到检测结果。结果 实验结果表明,在新冠肺炎患者肺部CT图数据集上,本文改进的模型相比于Faster R-CNN模型,召回率(recall)增加了7%,平均精度均值(mean average precision,mAP)增加了3.9%,传输率(frames per second,FPS)由5帧/s提升至9帧/s。特征金字塔网络的引入明显提升了模型的召回率与mAP指标,基于位置映射的RPN显著提升了模型的检测速度。与其他最新改进的目标检测模型相比,本文改进的模型保持了双阶段目标检测模型的高精度,并拉近了与单阶段目标检测模型在检测速度指标上的距离。结论 本文改进的模型能够有效检测到患者肺部CT图的磨玻璃密度影目标区域,对小尺寸目标同样适用,可以快速有效地为医生提供辅助诊断。  相似文献   

8.
智能交通的中重要一点就是对行人的检测跟踪用以规避行人实现自动驾驶。在神经网络运用的目标检测之前,常见的行人检测方法有梯度直方图特征(Histogram of oriented gradient,HOG)与支持向量机(Support vector machine,SVM)相结合的方法,但是此方法的弊端较为突出,在检测准确率远远达不到目前主流的几种深度学习算法检测,其应用场景受到很大的限制。而目前在深度学习中,行人检测应用比较广泛的模型有Faster R-CNN、YOLOv3等,而论文将采用改进Cascada R-CNN模型,其比Faster R-CNN具有更好的抗干扰能力,在昏暗、光线不均匀等条件下具有较好的行人检测效果,同时使其能过更好的识别小样本行人,实验在INRIA数据集中完成训练与并在自制的测试集检测,取得了不错的效果。  相似文献   

9.
伍鹏瑛    张建明    彭建    陆朝铨   《智能系统学报》2019,14(2):306-315
针对真实场景下的行人检测方法存在漏检、误检率高,以及小尺寸目标检测精度低等问题,提出了一种基于改进SSD网络的行人检测模型(PDIS)。PDIS通过引出更底层的输出特征图改进了原始SSD网络模型,并采用卷积神经网络不同层输出的抽象特征对行人目标分别做检测,融合多层检测结果,提升了小目标行人的检测性能。此外,针对数据集样本多样性能有效地提升检测算法的泛化能力,本文采集了不同光照、姿态、遮挡等复杂场景下的行人图像,对背景比较复杂的INRIA行人数据集进行了扩充,在扩增的行人数据集上训练的PDIS模型,提高了在真实场景下的行人检测精度。实验表明:PDIS在INRIA测试集上测试结果达到93.8%的准确率,漏检率低至7.4%。  相似文献   

10.
针对遥感图像目标检测中的漏检错检问题,提出了一种基于特征增强及密集场景优化的目标检测算法。通过对Faster R-CNN框架进行优化,加入特征增强卷积层使得小目标特征更加显著,同时采用改进的非极大值抑制算法对密集场景的目标置信度进行更新,从而提高遥感图像目标检测性能。实验结果表明:该算法在DOTA遥感数据集上与已有方法相比有效提升了目标检测精度。  相似文献   

11.
朱繁  王洪元  张继 《计算机应用》2019,39(11):3210-3215
针对复杂场景下行人检测效果差的问题,采用基于深度学习的目标检测中领先的研究成果,提出了一种基于改进Mask R-CNN框架的行人检测算法。首先,采用K-means算法对行人数据集的目标框进行聚类得到合适的长宽比,通过增加一组长宽比(2:5)使12种anchors适应图像中行人的尺寸;然后,结合细粒度图像识别技术,实现行人的高定位精度;其次,采用全卷积网络(FCN)分割前景对象,并进行像素预测获得行人的局部掩码(上半身、下半身),实现对行人的细粒度检测;最后,通过学习行人的局部特征获得行人的整体掩码。为了验证改进算法的有效性,将其与当前具有代表性的目标检测方法(如更快速的区域卷积神经网络(Faster R-CNN)、YOLOv2、R-FCN)在同数据集上进行对比。实验结果表明,改进的算法提高了行人检测的速度和精度,并且降低了误检率。  相似文献   

12.
行人检测是目标检测中的一个重要研究方向。针对行人检测算法在复杂场景和目标太小情况下漏检的问题,在Faster R-CNN检测算法的基础上,提出一种基于浅层特征融合引导的深层网络行人检测。通过HOG特征、改进的LBP特征与深度网络特征融合获得准确的行人特征,在国际上广泛使用的行人数据集上进行一系列实验。结果表明,所提出的改进方法在检测准确率和速率方面都有所提高。  相似文献   

13.
目前基于深度学习算法的目标检测技术在合成孔径雷达(SAR)图像船舶检测中取得了显著的成果,然而仍存在着小目标船舶和近岸密集排列船舶检测效果差的问题。针对上述问题,提出了基于改进RetinaNet的船舶检测算法。在传统RetinaNet算法的基础上,首先,将特征提取网络残差块中的卷积改进为分组卷积,以增加网络宽度,从而提高网络的特征提取能力;其次,在特征提取网络的后两个阶段加入注意力机制,让网络更加专注于目标区域,从而提升目标检测能力;最后,将软非极大值抑制(Soft-NMS)加入到算法中,降低算法对于近岸密集排列船舶检测的漏检率。在高分辨率SAR图像数据集(HRSID)和SAR船舶检测数据集(SSDD)上的实验结果表明,所提改进算法对于小目标船舶和近岸船舶的检测效果得到了有效提升,与当前优秀的目标检测模型Faster R-CNN、YOLOv3和CenterNet等相比,在检测精度和速度上更加优越。  相似文献   

14.
针对交通拥堵的车辆密集场景中检测目标重叠率高而导致漏检和误检的问题,提出了改进YOLOv3、CIoU损失函数优化以及SD-NMS优化算法(简记L-YOLOv3+CIoU Loss+SD-NMS)。利用深度可分离卷积、SE模块和Ghost模块改进YOLOv3的残差单元结构,以提高对密集目标的特征提取能力,减少网络模型参数量;采用完整交并比CIoU损失函数加快网络模型收敛速度,同时将多目标集合预测思想与DIoU-NMS有机结合,提出了SD-NMS优化算法,以降低漏检误检率。在BDD100K数据集上进行实验,结果表明,改进的目标检测算法召回率达到91.58%,精准率达到93.04%,与YOLOv3算法相比,召回率和精准率分别提升了12.09%和9.52%,具有更好的检测效果。  相似文献   

15.
为解决通用目标检测算法对于密集车辆检测的误检和漏检等问题,本文提出了一种基于Faster R-CNN的高速公路拥堵场景车辆目标检测方法。实验提出多变化处理模块和排斥力损失,在补充数据多样性的同时提高模型的泛化能力,并针对密集场景车辆遮挡等情况,提高密集车辆的检测精度。实验结果表明,该网络模型相比现有检测方法达到了更好的检测效果。  相似文献   

16.
现有基于深度学习的煤矸识别方法应用于井下复杂环境中时易出现误检和漏检情况,且对小目标煤矸的识别精度低。针对该问题,提出一种改进YOLOv5模型,并基于该模型实现煤矸识别。对采集的煤与矸石数据进行数据增强,以丰富数据集,提高数据利用率;在空间金字塔池化(SPP)模块中引入空洞卷积和残差块,得到残差ASPP模块,可在不损失图像信息的前提下,增大卷积输出感受野,强化模型对深层特征的提取;采用AdaBelief优化算法代替YOLOv5原有的Adam优化算法,提高模型的收敛速度与识别精度。实验结果表明:AdaBelief优化算法和残差ASPP模块可有效提高YOLOv5模型的精确率、召回率和平均精度均值(mAP);改进YOLOv5模型的mAP达到94.43%,比原始YOLOv5模型提高了2.27%,帧率降低了0.03帧/s,性能优于SSD,Faster R-CNN,YOLOv3,YOLOv4等主流目标检测模型;在极端黑暗的环境中,改进YOLOv5模型也能准确划定目标边界,识别效果优于其他改进YOLOv5模型。  相似文献   

17.
针对景区内高密度行人检测中遮挡与小目标行人漏检率高、模型复杂度高、计算量大的问题,提出一种YOLOv5-GSPE改进算法模型,在保证精度的同时改善检测效果,降低模型复杂度。改进算法模型通过GhostConv优化主干网络中常规卷积(Conv)降低模型复杂度,并使用空洞卷积改善SPPF模块中池化操作带来的特征信息丢失,提升模型检测时效性,增强主干网络特征提取。提出一种增强的特征金字塔网络—PrFPN,使用同层连接进一步丰富原始输入特征的融合,减少特征提取过程中的特征损失。将引入正态分布计算优化后的EIoU损失函数作为边界框回归损失函数,提高边界框定位精度。实验结果表明,YOLOv5-GSPE算法模型对比YOLOv5s模型在保证检测时效性的情况下整体复杂度降低了12.51%,基于Pedestrian测试集的平均精度提升4.05%,基于WiderPerson测试集的平均精度提升3.28%,并降低了行人遮挡及小目标漏检率,改善了检测效果,该模型的可行性与有效性得到验证。  相似文献   

18.
针对货车利用躲避摄像头等手段在城市道路中不按规定时间、规定线路行驶,使得车辆不能被准确识别的问题,提出基于改进Faster RCNN的城市道路货车检测方法.该方法以Faster RCNN为基础模型,通过对传入主干网络的车辆图片进行卷积和池化等操作来提取特征,其中增加特征金字塔网络(FPN)提升对多尺度目标检测的精度;同时将K-means聚类算法应用在数据集上以获取新的锚点框;利用RPN (region proposal network)生成建议框;并使用CIoU (complete-IoU)损失函数代替原算法的smoothL1损失函数以提升检测车辆的精确性.实验结果显示,改进后的Faster RCNN相比原算法对货车检测的平均精度(AP)提高7.2%,召回率(recall)提高6.1%,减少了漏检的可能,在不同场景下具有良好的检测效果.  相似文献   

19.
建筑施工现场钢筋图像背景复杂且干扰较多,传统图像检测算法无法有效利用特征信息,难以满足现阶段建筑智能监理行业中钢筋尺寸检测精度的验收要求。提出一种在Mask R-CNN模型基础上加入自下而上路径和注意力机制的改进模型BU-CS Mask R-CNN。在建筑工地现场拍摄图像后,整理自建钢筋数据集,并在此数据集上进行算法验证。实验结果表明,与Mask R-CNN模型相比,BU-CS Mask R-CNN模型的召回率、交并比和像素准确率分别提升了4.9%、6.8%、7.4%,钢筋直径和间距的尺寸检测精度分别提升了14.9%、4.4%,能得到更加准确的钢筋目标检测框和边缘分割掩膜,达到了行业中实际工程验收的精度要求。  相似文献   

20.
为保持行人在新型冠状病毒肺炎(COVID-19)疫情下的安全社交距离,有效控制和预防疫情传播,构建一种基于YOLOv4的安全社交距离风险评估模型。利用微调后的YOLOv4算法对行人进行目标提取,获取行人关键点,并将行人连续运动视为质点的连续运动,结合DeepSort算法实现对行人的跟踪处理。在此基础上,建立视觉坐标系,在鸟瞰视角下提出运动矢量分析算法计算和判断行人运动方向并评估行人的安全社交距离。在牛津城市中心的数据集上评估模型有效性,实验结果表明,微调后YOLOv4算法在行人检测中平均精度均值达到90.33%,行人社交距离风险评估准确率达到88.23%,性能优于Fast R-CNN、Faster R-CNN、YOLOv3和YOLOv4算法,表明所提模型能够有效提升安全社交距离的检测准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号