首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
孙旭旦  吴清  赵春艳  张满囤 《红外与激光工程》2022,51(9):20210924-1-20210924-10
行人被严重遮挡导致无法提取有效特征是行人检测中出现漏检的一个主要原因。为了解决该问题,提出一种语义增强引导特征重建的遮挡行人检测算法。首先,利用空间和通道之间的依赖性设计了语义特征增强模块,建立全局上下文信息用以增强遮挡行人特征。其次,为关注行人的可见区域,通过自适应特征重建模块生成语义分割图,自适应调整通道的有效权重,增强行人和背景的可判别性。最后,通过多层次级联语义特征增强和自适应特征重建两个模块得到多层次特征图,融合多特征用以最终的行人解析。实验结果表明,该方法在具有挑战性的行人检测基准CityPersons和Caltech上,对严重遮挡目标的漏检率分别实现了47.28%和44.04%,在遮挡行人的检测上相较于其他方法具有较好的鲁棒性。  相似文献   

2.
赵志刚 《微电子学》2022,52(5):898-904
为了提高车间监控系统智能化程度和工作场景中行人检测精度,提出了一种基于计算机视觉技术的行人检测方法。采用基于高级语义信息的无锚框特征检测技术,将检测任务简化为中心点和尺度的回归预测。特征提取模块通过四阶段降采样卷积网络,得到多尺度的图像特征并融合。头探测模块分成两路卷积,并行处理特征图,获得中心点热力图和尺度信息,输出检测结果。结果表明,在CityPersons数据集R子集上,MR-2达到11.61%,加入偏移量预测分支后MR-2提升了0.6%。这证明了该人员检测方法的性能优良。  相似文献   

3.
地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性。针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果。构建地铁场景行人数据集,标注对应标签,进行数据预处理操作。本研究在特征提取模块中加入深度残差收缩网络,将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道,削弱冗余特征信道;利用改进空洞空间金字塔池化模块,在不丢失图像信息的前提下获得多尺度、多感受野的融合特征,有效捕获图像全局上下文信息;设计了一种改进非极大值抑制算法,对目标预测框进行后处理,保留检测目标最优预测框。实验结果表明:提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度,尤其对小行人目标和密集行人目标的检测,效果提升更为显著。  相似文献   

4.
基于有向边界框的合成孔径雷达(SAR)舰船目标检测器能输出精准的边界框,但仍存在模型计算复杂度高、推理速度慢、存储消耗大等问题,导致其难以在星载平台上部署。基于此该文提出了结合特征图和检测头分支知识蒸馏的无锚框轻量化旋转检测方法。首先,结合目标的长宽比和方向角信息提出改进高斯核,使生成的热度图能更好地刻画目标形状。然后在检测器预测头部引入前景区域增强分支,使网络更关注前景特征且抑制背景杂波的干扰。在训练轻量化网络时,将像素点间的相似度构建为热度图蒸馏知识。为解决特征蒸馏中正负样本不平衡问题,将前景注意力区域作为掩模引导网络蒸馏与目标相关的特征。另外,该文提出全局语义模块对像素进行上下文信息建模,能够结合背景知识加强目标精确表征。基于HRSID数据集的实验结果表明所提方法在模型参数仅有9.07 M的轻量化条件下,mAP能达到80.71%,且检测帧率满足实时应用需求。   相似文献   

5.
针对复杂道路场景下行人检测精度与速度难以提升的问题,提出一种融合多尺度信息和跨维特征引导的轻量级行人检测算法。首先以高性能检测器YOLOX为基础框架,构建多尺度轻量卷积并嵌入主干网络中,以获取多尺度特征信息。然后设计了一种端到端的轻量特征引导注意力模块,采用跨维通道加权的方式将空间信息与通道信息融合,引导模型关注行人的可视区域。最后为减少模型在轻量化过程中特征信息的损失,使用增大感受野的深度可分离卷积构建特征融合网络。实验结果表明,相比于其他主流检测算法,所提算法在KITTI数据集上达到了71.03%的检测精度和80 FPS的检测速度,在背景复杂、密集遮挡、尺度不一等场景中都具有较好的鲁棒性和实时性。  相似文献   

6.
行人检测中,小尺度行人时常被漏检、误检。为了提升小尺度行人的检测准确率并且降低其漏检率,该文提出一个特征增强模块。首先,考虑到小尺度行人随着网络加深特征逐渐减少的问题,特征融合策略突破特征金字塔层级结构的约束,融合深层、浅层特征图,保留了大量小尺度行人特征。然后,考虑到小尺度行人特征容易与背景信息发生混淆的问题,通过自注意力模块联合通道注意力模块建模特征图空间、通道关联性,利用小尺度行人上下文信息和通道信息,增强了小尺度行人特征并且抑制了背景信息。最后,基于特征增强模块构建了一个小尺度行人检测器。所提方法在CrowdHuman数据集中小尺度行人的检测准确率为19.8%,检测速度为22帧/s,在CityPersons数据集中小尺度行人的误检率为13.1%。结果表明该方法对于小尺度行人的检测效果优于其他对比算法且实现了较快的检测速度。  相似文献   

7.
多行人目标跟踪是智能安防监控系统的关键技术之一,其跟踪准确度的高低直接关系到监控系统的效果。针对复杂监控场景下多行人目标跟踪困难的问题,提出了一种YOLOv3网络模型与SORT跟踪算法相结合的鲁棒跟踪方法。通过简化网络模型输出以提高模型效率,对YOLOv3模型针对行人检测数据集进行重新训练。为了避免因长时间遮挡导致的目标跟踪失败,设计行人重识别网络(Re-ID)来提取目标表征特征,并通过计算特征向量的余弦距离来判别帧间行人目标的关联程度。实验结果表明,文中设计的改进YOLOv3检测器使行人检测率有明显的提高,提出的行人目标跟踪算法有效提高了跟踪效果,在MOT16数据集上的跟踪准确率和跟踪精准率相比于SORT算法分别提高了15.72%和3.14%。  相似文献   

8.
针对行人检测在复杂环境下存在的高误检率和丢失率问题,提出了一种基于YOLOv5s的改进模型YOLOv5s-RFDH。该模型在保留YOLOv5s基线网络的基础上,在特征提取和检测部分进行了优化改进,以提高行人检测在复杂场景中的准确性和鲁棒性。针对CrowdHuman数据集和WiderPerson数据集进行行人目标检测。以上数据集行人密集且存在大量遮挡,因此,采用了K-Means++聚类算法来重新聚类数据集以获取适合数据的锚框;引入感受野模块(Receptive Field Block, RFB)来进行特征提取,在不同分支中使用空洞卷积增加感受野从而提取更深层次的特征信息,并最终将这些特征融合在一起,提升了小目标行人的检测精度;解耦头可以解决目标检测中的尺度不变性问题,引入解耦检测头将分类和回归任务分离,从而能够更加准确地检测到不同尺度和大小的目标。在CrowdHuman数据集和WiderPerson数据集划分出的测试集上进行对比实验,结果表明,改进后的模型在检测准确率上得到提升,丢失率有所下降,在以上两个不同数据集上检测准确率分别提升1.4%和1.2%,丢失率分别降低2.0%和1.7%。  相似文献   

9.
为解决工厂流水线上不同种类动态物品的快速精准抓取问题,提出一种两阶段动态多物品定位抓取方法。第1阶段采用所提多尺度上下文感知的单分支融合语义分割网络获取目标物品的掩码区域:首先特征提取网络采用单分支结构,在保证提取丰富的空间信息和高层语义信息的同时,减小网络参数量;随后特征融合网络通过双边引导特征融合模块增强空间信息和语义信息的表达能力;最后设计特征增强网络,通过特征辅助收敛模块嵌入浅层和深层网络中,加快网络收敛速度。第2阶段采用基于轮廓点检测的快速位姿估计策略在掩码区域预测最佳抓取点位姿。在自建数据集上的测试及流水线平台抓取实验结果表明,所提方法能实时检测和预测物品抓取点位姿,精准完成物品抓取,其分割精度、预测时间和抓取成功率均优于对比方法。  相似文献   

10.
针对航拍图像中对于小尺度的飞机目标出现漏检、错检的问题,在SSD(Single Shot MultiBox Detector)模型的基础上提出了一种改进SSD的航拍图像目标检测模型。首先,针对SSD模型中浅层特征图中缺乏语义、细节信息的问题,设计了一种特征融合机制,通过添加细节信息补充特征层和添加由递归反向路径获得的语义信息补充特征层来丰富浅层特征图的语义、细节信息。然后,针对SSD模型对通道以及空间信息的关注能力不足的问题,引入了结合通道和空间的混合注意力模块来提高模型整体的关注能力。最后,针对SSD模型中先验框与小尺度目标不匹配的问题,对先验框的比例进行了调整。使用自制的航拍图像数据集进行验证,结果表明改进后的模型检测精度为95.7%,相较于原模型提高了7.5%,检测速度达到30.8 FPS。  相似文献   

11.
基于行走拓扑结构分析的行人检测   总被引:1,自引:1,他引:0  
针对计算机视觉应用中的行人检测,当运动目标受到非刚性形变、光照、色彩和遮挡等因素影响时如何建立高鲁棒性的特征描述,本文提出了一种基于语义级行走动作拓扑结构的行人特征,对上述噪声和运动参数不敏感,并且数据量小。算法首先由运动能量图像(MEI,motion energy image)建立行走动态数据,然后抽象为骨架拓扑结构,输入二级级联检测器完成检测。实验表明,该算法可以有效地在光照、形变和遮挡等情况下对行人进行检测。  相似文献   

12.
针对无锚框目标检测算法CenterNet中,目标特征利用程度不高、检测结果不够准确的问题,该文提出一种双分支特征融合的改进算法。在算法中,一个分支包含了特征金字塔增强模块和特征融合模块,以对主干网络输出的多层特征进行融合处理。同时,为利用更多的高级语义信息,在另一个分支中仅对主干网络的最后一层特征进行上采样。其次,对主干网络添加了基于频率的通道注意力机制,以增强特征提取能力。最后,采用拼接和卷积操作对两个分支的特征进行融合。实验结果表明,在公开数据集PASCAL VOC上的检测精度为82.3%,比CenterNet算法提高了3.6%,在KITTI数据集上精度领先其6%,检测速度均满足实时性要求。该文提出的双分支特征融合方法将不同层的特征进行处理,更好地利用浅层特征中的空间信息和深层特征中的语义信息,提升了算法的检测性能。  相似文献   

13.
作为计算机视觉和图像处理研究领域中的经典课题,行人检测技术在智能驾驶、视频监控等领域中具有广泛的应用空间。然而,面对一些复杂的环境和情况,如阴雨、雾霾、被遮挡、照明度变化、目标尺度差异大等,常见的基于可见光或红外图像的行人检测方法的效果尚不尽如人意,无论是在检测准确率还是检测速度上。该文分析并抓住可见光和红外检测系统中行人特征差异较大,但在不同环境中又各有优势的特点,并结合多尺度特征提取方法,提出一种适用于多样复杂环境下多尺度行人实时检测的方法——融合行人检测网络(FPDNet)。该网络主要由特征提取骨干网络、多尺度检测和信息决策融合3个部分构成,可自适应提取可见光或红外背景下的多尺度行人。实验结果证明,该检测网络在多种复杂视觉环境下都具有较好的适应能力,在检测准确性和检测速度上均能满足实际应用的需求。  相似文献   

14.
Many previous occluded person re-identification(re-ID) methods try to use additional clues (pose estimation or semantic parsing models) to focus on non-occluded regions. However, these methods extremely rely on the performance of additional clues and often capture pedestrian features by designing complex modules. In this work, we propose a simple Fine-Grained Multi-Feature Fusion Network (FGMFN) to extract discriminative features, which is a dual-branch structure consisting of global feature branch and partial feature branch. Firstly, we utilize a chunking strategy to extract multi-granularity features to make the pedestrian information contained in it more comprehensive. Secondly, a spatial transformer network is introduced to localize the pedestrian’s upper body, and then introduce a relation-aware attention module to explore the fine-grained information. Finally, we fuse the features obtained from the two branches to obtain a more robust pedestrian representation. Extensive experiments verify the effectiveness of our method under the occlusion scenario.  相似文献   

15.
Most recent occluded person re-identification (re-ID) methods usually learn global features directly from pedestrian images, or use additional pose estimation and semantic analysis model to learn local features, while ignoring the relationship between global and local features, thus incorrectly retrieving different pedestrians with similar attributes as the same pedestrian. Moreover, learning local features using auxiliary models brings additional computational cost. In this work, we propose a Transformer-based dual-branch feature learning model for occluded person re-ID. Firstly, we propose a global–local feature interaction module to learn the relationship between global and local features, thus enhancing the richness of information in pedestrian features. Secondly, we randomly erase local areas in the input image to simulate the real occlusion situation, thereby improving the model’s adaptability to the occlusion scene. Finally, a spilt group module is introduced to explore the local distinguishing features of pedestrian. Numerous experiments validate the effectiveness of our proposed method.  相似文献   

16.
行人检测技术综述   总被引:44,自引:0,他引:44       下载免费PDF全文
行人检测是计算机视觉中的研究热点和难点,本文对2005-2011这段时间内的行人检测技术中最核心的两个问题—特征提取、分类器与定位—的研究现状进行综述.文章中首先将这些问题的处理方法分为不同的类别,将行人特征分为底层特征、基于学习的特征和混合特征,分类与定位方法分为滑动窗口法和超越滑动窗口法,并从纵横两个方向对这些方法的优缺点进行分析和比较,然后总结了构建行人检测器在实现细节上的一些经验,最后对行人检测技术的未来进行展望.  相似文献   

17.
行人检测系统是目前先进驾驶辅助系统中直接面向行人的保护系统,可最大程度地减少行人所受到的伤害。纹理对称度特征是目前最直观且能够用于表征行人的特征。文中在采用基于纹理对称度特征方法提取感兴趣区域的基础上,提出了一种线检测的方法,可以有效地减少检测过程中阴影、树叶等小纹理对检测结果的影响。最后利用梯度方向直方图特征和支持向量机方法对感兴趣区域进行验证。试验结果表明,该方法在保证检测速度的前提下,可减少检测过程中的虚警和漏警情况。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号