首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 578 毫秒
1.
孙旭旦  吴清  赵春艳  张满囤 《红外与激光工程》2022,51(9):20210924-1-20210924-10
行人被严重遮挡导致无法提取有效特征是行人检测中出现漏检的一个主要原因。为了解决该问题,提出一种语义增强引导特征重建的遮挡行人检测算法。首先,利用空间和通道之间的依赖性设计了语义特征增强模块,建立全局上下文信息用以增强遮挡行人特征。其次,为关注行人的可见区域,通过自适应特征重建模块生成语义分割图,自适应调整通道的有效权重,增强行人和背景的可判别性。最后,通过多层次级联语义特征增强和自适应特征重建两个模块得到多层次特征图,融合多特征用以最终的行人解析。实验结果表明,该方法在具有挑战性的行人检测基准CityPersons和Caltech上,对严重遮挡目标的漏检率分别实现了47.28%和44.04%,在遮挡行人的检测上相较于其他方法具有较好的鲁棒性。  相似文献   

2.
赵双  陈树越  王巧月 《红外技术》2021,43(6):575-582
针对夜间红外图像中行人与背景灰度差异小且存在遮挡等问题,提出了一种夜间复杂场景下的红外行人检测算法.首先利用行人语义融合方法生成对目标全覆盖的显著图,与原图融合得到感兴趣区域,然后构造基于改进的方向梯度直方图特征的两分支分类器,同时提出一种遮挡判别算法,根据分类器模糊分数判断是否遮挡,设计一种头部模板实现最终的行人检测...  相似文献   

3.
针对杂乱场景下难以有效地提取行人关键信息和局部遮挡时全局特征方法失效的问题,提出了一种双金字塔结构引导的多粒度行人重识别(person re-identification,ReID)方法。首先在ResNet50中嵌入注意力金字塔,引导网络由粗到细依次挖掘不同粒度的特征,使网络更倾向于关注复杂环境中行人的显著区域;其次通过结构不对称的双重注意力特征金字塔分支(double attention feature pyramid branch,DFP branch)提取多尺度的行人特征,丰富特征的多样性,同时双重注意力机制可使分支从浅层信息中捕获高细粒度的局部特征;最后将粒度较粗的全局特征与多层级细粒度的局部特征融合,两种金字塔相互作用,以此获得更多具有鉴别性的多粒度特征,改善行人遮挡问题。在多个数据集上进行了实验,结果表明,各项评价指标均高于目前大多数主流模型,其中在DukeMTMC-reID数据集上,Rank-1、mAP和平均逆负处罚(mean inverse negative penalty,mINP)分别达到了91.6%、81.9%、48.1%。  相似文献   

4.
针对复杂道路场景下行人检测精度与速度难以提升的问题,提出一种融合多尺度信息和跨维特征引导的轻量级行人检测算法。首先以高性能检测器YOLOX为基础框架,构建多尺度轻量卷积并嵌入主干网络中,以获取多尺度特征信息。然后设计了一种端到端的轻量特征引导注意力模块,采用跨维通道加权的方式将空间信息与通道信息融合,引导模型关注行人的可视区域。最后为减少模型在轻量化过程中特征信息的损失,使用增大感受野的深度可分离卷积构建特征融合网络。实验结果表明,相比于其他主流检测算法,所提算法在KITTI数据集上达到了71.03%的检测精度和80 FPS的检测速度,在背景复杂、密集遮挡、尺度不一等场景中都具有较好的鲁棒性和实时性。  相似文献   

5.
行人检测中,小尺度行人时常被漏检、误检。为了提升小尺度行人的检测准确率并且降低其漏检率,该文提出一个特征增强模块。首先,考虑到小尺度行人随着网络加深特征逐渐减少的问题,特征融合策略突破特征金字塔层级结构的约束,融合深层、浅层特征图,保留了大量小尺度行人特征。然后,考虑到小尺度行人特征容易与背景信息发生混淆的问题,通过自注意力模块联合通道注意力模块建模特征图空间、通道关联性,利用小尺度行人上下文信息和通道信息,增强了小尺度行人特征并且抑制了背景信息。最后,基于特征增强模块构建了一个小尺度行人检测器。所提方法在CrowdHuman数据集中小尺度行人的检测准确率为19.8%,检测速度为22帧/s,在CityPersons数据集中小尺度行人的误检率为13.1%。结果表明该方法对于小尺度行人的检测效果优于其他对比算法且实现了较快的检测速度。  相似文献   

6.
邓磊  李海芳 《激光与红外》2022,52(2):295-304
针对现有目标检测网络很难适应复杂战场环境下的超视距、遮挡、多视角变化等干扰的影响,提出了一种基于多金字塔池化模型的整体嵌套卷积网络,该网络通过引入空洞卷积思想,在保证卷积特征分辨率不变的基础上提高弱小目标的检测精度;同时,本文所提的模型也将通过多孔空间金字塔池化将多尺度上下文特征进行融合,然后在整体嵌套卷积基础上利用装...  相似文献   

7.
地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性。针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果。构建地铁场景行人数据集,标注对应标签,进行数据预处理操作。本研究在特征提取模块中加入深度残差收缩网络,将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道,削弱冗余特征信道;利用改进空洞空间金字塔池化模块,在不丢失图像信息的前提下获得多尺度、多感受野的融合特征,有效捕获图像全局上下文信息;设计了一种改进非极大值抑制算法,对目标预测框进行后处理,保留检测目标最优预测框。实验结果表明:提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度,尤其对小行人目标和密集行人目标的检测,效果提升更为显著。  相似文献   

8.
针对图像中小尺寸行人目标检测识别率低的问题,提出一种基于改进多尺度特征融合的行人检测算法。首先,在原始YOLOv3模型的基础上将BN层融合到卷积层;其次,增加检测层,借鉴特征金字塔思想将高低层特征进行融合与预测;最后,利用线性尺度缩放的K-means聚类算法优化候选框,提高小尺寸行人检测效果。在INRIA行人数据集上的实验结果表明,改进算法准确率达到91.4%,与YOLOv3算法相比提高了3.4%;在复杂监控环境下也证明了所提算法的有效性。  相似文献   

9.
作为计算机视觉和图像处理研究领域中的经典课题,行人检测技术在智能驾驶、视频监控等领域中具有广泛的应用空间.然而,面对一些复杂的环境和情况,如阴雨、雾霾、被遮挡、照明度变化、目标尺度差异大等,常见的基于可见光或红外图像的行人检测方法的效果尚不尽如人意,无论是在检测准确率还是检测速度上.该文分析并抓住可见光和红外检测系统中行人特征差异较大,但在不同环境中又各有优势的特点,并结合多尺度特征提取方法,提出一种适用于多样复杂环境下多尺度行人实时检测的方法——融合行人检测网络(FPDNet).该网络主要由特征提取骨干网络、多尺度检测和信息决策融合3个部分构成,可自适应提取可见光或红外背景下的多尺度行人.实验结果证明,该检测网络在多种复杂视觉环境下都具有较好的适应能力,在检测准确性和检测速度上均能满足实际应用的需求.  相似文献   

10.
孙劲光  吴明岩 《信号处理》2022,38(10):2201-2210
针对目前由于行人重识别普遍存在的遮挡以及多姿态变化等原因,导致的行人重识别率低的问题,提出一种基于多尺度加权特征融合的行人重识别方法(Person Re-identification Method Based on Multi-scale Weighted Feature Fusion,MSWF)。该方法首先使用基准网络ResNeSt-50提取图像特征,获得下采样3倍、下采样4倍和下采样5倍的特征图,输入到加权特征金字塔网络中,然后使用快速归一化融合方法进行特征融合,在特征融合中引入加权操作可以让模型在训练过程中学习如何给融合特征的权重值进行分配,这样可以充分利用不同尺度的特征,获得更加丰富的行人特征。最后将融合后的富含语义信息的高层特征作为全局特征,将融合后的高分辨率特征作为局部特征。在训练过程中,联合Softmax分类损失函数、三元组损失函数和中心损失函数对模型进行训练,在测试阶段,将全局特征和局部特征沿通道维度进行拼接表示行人特征,并使用欧氏距离计算行人之间的距离。该方法在Market-1501、DukeMTMC-reID、CUHK03-Labeled和CUHK03-Detect...  相似文献   

11.
复杂视觉场景下存在过暗或者过曝的光照、恶劣的天气、严重遮挡、行人尺寸差别大以及图像模糊等问题,大大增加了行人检测的难度。因此,针对复杂视觉场景下行人检测准确度低、漏检严重的问题,提出了改进的YOLOv4算法以增强复杂视觉场景下的行人检测效果。首先,构建复杂视觉场景下的行人数据集。然后,在主干网中加入混合空洞卷积,提高网络对行人特征的提取能力。最后,提出空间锯齿空洞卷积结构,代替空间金字塔池化结构,获取更多细节特征。实验表明,在本文构建的行人数据集上,改进后的 YOLOv4算法的平均精度(average precision,AP)达到了90.08%,相比原YOLOv4算法提高了7.2%,对数平均漏检率(log-average miss rate,LAMR)降低了13.69%。  相似文献   

12.
YOLOv3算法在单一物体目标检测时使用Darknet53作为主干,网络出现冗余现象,导致参数过多,检测速度变慢,传统的边界框损失函数影响检测定位准确性。针对这一问题,文中提出了改进YOLOv3算法的行人检测方法。通过构造以Darknet19为主干网络多尺度融合的新型网络,加快训练速度和检测速度,还通过引入广义交并比损失函数来提高检测精确度。实验结果表明,在行人检测数据集如INRIA行人数据集中,相比于原始算法,文中所提算法的精确度提高了5%。和Faster R-CNN相比,在保证准确率的情况下,采用文中算法使单张图片的检测速度达到了每张0.015 s。  相似文献   

13.
Aiming at the problem of low detection accuracy of occluded pedestrian in traffic environments, this paper proposes a key points and visible part fusion network for occluded pedestrian detection. The proposed algorithm constructs two attention modules by introducing human key points and the bounding box of visible parts respectively, which suppresses the occluded parts in the channel features and spatial features of pedestrian features respectively. Experimental results on CityPersons and Caltech datasets demonstrate the effectiveness of the proposed algorithm. The missing rate (MR) is reduced to 40.78 on the Heavy subset of the CityPersons dataset and surpasses many outstanding methods.  相似文献   

14.
针对无锚框目标检测算法CenterNet中,目标特征利用程度不高、检测结果不够准确的问题,该文提出一种双分支特征融合的改进算法。在算法中,一个分支包含了特征金字塔增强模块和特征融合模块,以对主干网络输出的多层特征进行融合处理。同时,为利用更多的高级语义信息,在另一个分支中仅对主干网络的最后一层特征进行上采样。其次,对主干网络添加了基于频率的通道注意力机制,以增强特征提取能力。最后,采用拼接和卷积操作对两个分支的特征进行融合。实验结果表明,在公开数据集PASCAL VOC上的检测精度为82.3%,比CenterNet算法提高了3.6%,在KITTI数据集上精度领先其6%,检测速度均满足实时性要求。该文提出的双分支特征融合方法将不同层的特征进行处理,更好地利用浅层特征中的空间信息和深层特征中的语义信息,提升了算法的检测性能。  相似文献   

15.
针对交通十字路口等视野盲区往来行人间存在遮挡情况,如何高效准确地检测复杂道路中目标行人具有实际意义。为了实现夜间交汇路口场景行人检测,提出一种基于改进YOLOv5的行人目标检测算法,采用Non local和PSA模块对YOLOv5原网络的Bottleneck CSP进行改进,能够有效弥补遮挡中行人特征的帧间信息交互过程,增强长程范围通道特征依赖关系。设计更深的160×160检测层和自适应anthor,提升夜间行人检测的边界回归精确度。实验结果表明,针对夜间下交通路口场景,压缩改进后模型对行人检测鲁棒性高,相较于原始算法mAP_0.5和mAP_0.5:0.95值分别提升了14.2和12.7,说明所提算法对夜间行人检测的有效性。  相似文献   

16.
王国刚  孙召进  刘云鹏 《红外与激光工程》2022,51(5):20210459-1-20210459-10
针对经典的基于深度学习的红外弱小目标检测算法存在目标信息在高层感受野消失导致无法检出的问题,提出一种新的基于多通道多尺度特征融合的红外弱小目标检测算法(J-MSF)。首先,该算法提出了一种新的多通道JAnet结构,基于此结构搭建了主干特征提取网络;其次,设计了下降门限式特征金字塔池化结构(DSPP),并提出了多尺度融合检测策略;最后,设计了高斯损失优化函数。实验结果表明,所提出的算法在“地/空背景下红外图像弱小飞机目标检测跟踪数据集”上的检测效果与YOLOv3、YOLOv4算法对比,检出率、整体AP值分别提升9.07%、9.89%和1.67%、3.16%,提出算法优于目前主流的检测算法,体现出了良好的鲁棒性和适应性,可以有效的应用于红外弱小目标的检测。  相似文献   

17.
为了提高监控场景中行人检测的准确度,提出了一种基于上下文信息的行人检测方法.该方法将监控场景的上下文信息融入到卷积神经网络中,选择性地学习对行人检测有帮助的上下文信息.首先,利用一个截断的卷积神经网络提取输入图像的多张特征图.然后,将多张特征图通过两个包含上下文信息的卷积层,形成一张掩码图.最后,通过在掩码图上估计行人的边界框,获得行人检测的结果.实验表明,该方法能实现监控场景中准确且快速的行人检测.  相似文献   

18.
深度学习模型中的特征金字塔网络(Feature Pyramid Network,FPN)常被用作合成孔径雷达(Synthetic Aperture Radar,SAR)图像中多目标船舶的检测。针对复杂场景下多目标船舶检测问题,提出了一种基于改进锚点框的FPN模型。首先将特征金字塔模型嵌入传统的RPN(Region Proposal Network)并映射成新的特征空间用于目标检测,然后利用基于形状相似度距离(Shape Similar Distance,SSD)度量的Kmeans聚类算法优化FPN的初始锚点框,并使用SAR船舶数据集测试。实验结果表明,所提算法目标检测精确率达到98.62%,在复杂场景下与YOLO、Faster RCNN、FPN based on VGG/ResNet等模型进行对比,模型准确率提高,整体性能更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号