首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
受到移动设备计算能力和存储资源受限的局限,设计高效、高精度的人脸检测器是一个开放性的挑战.因此,文中提出融合多尺度特征的轻量级人脸检测算法(Lightweight Face Detection Algorithm with Multi-scale Feature Fusion, LFDMF),摒弃被视为人脸检测核心组件的多级检测结构.首先,利用现有的轻量级主干特征提取网络编码输入图像.然后,利用提出的颈部网络扩张特征图感受野,并将含有不同感受野的多尺度信息融至单级特征图中.最后,利用提出的多任务敏感检测头对该单级特征图进行人脸分类、回归和关键点检测.相比分而治之的人脸检测器,LFDMF精度更高、计算量更少.LFDMF按模型计算量高低可构建3个不同大小的网络,大模型LFDMF-L在Wider Face数据集上性能较优,中等模型LFDMF-M和小模型LFDMF-S以极低的模型参数量和计算量实现可观性能.  相似文献   

2.
针对多尺度行人检测精度不够高的问题,提出了一种级联式多尺度行人检测算法,使用矩形卷积核提取行人特征,根据行人轮廓特征设计候选区域宽高比例;并提出自适应损失函数,使网络聚焦于困难样本,有效缓解了长尾效应在训练网络时带来的不利因素,提高了网络泛化能力。实验结果表明:所提算法对于Caltech数据集中的大尺度行人,漏检率比Adapt Faster Rcnn算法降低了1. 36%;对于中小尺度行人,漏检率比Adapt Faster Rcnn算法下降8. 82%。  相似文献   

3.
目的 行人检测在自动驾驶、视频监控领域中有着广泛应用,是一个热门的研究话题。针对当前基于深度学习的行人检测算法在分辨率较低、行人尺度较小的情况下存在误检和漏检问题,提出一种融合多层特征的多尺度的行人检测算法。方法 首先,针对行人检测问题,删除了深度残差网络的一部分,仅采用深度残差网络的3个区域提取特征图,然后采用最邻近上采样法将最后一层提取的特征图放大两倍后再用相加法,将高层语义信息丰富的特征和低层细节信息丰富的特征进行融合;最后将融合后的3层特征分别输入区域候选网络中,经过softmax分类,得到带有行人的候选框,从而实现行人检测的目的。结果 实验结果表明,在Caltech行人检测数据集上,在每幅图像虚警率(FPPI)为10%的条件下,本文算法丢失率仅为57.88%,比最好的模型之一——多尺度卷积神经网络模型(MS-CNN)丢失率(60.95%)降低3.07%。结论 深层的特征具有高语义信息且感受野较大的特点,而浅层的特征具有位置信息且感受野较小的特点,融合两者特征可以达到增强深层特征的效果,让深层的特征具有较为丰富的目标位置信息。融合后的多层特征图具有不同程度的细节和语义信息,对检测不同尺度的行人有较好的效果。所以利用融合后的特征进行行人检测,能够提高行人检测性能。  相似文献   

4.
陈海燕  李春尧 《传感技术学报》2022,35(10):1375-1381
基于深度学习的特征金字塔网络(Feature Pyramid Networks, FPN)仅采用一次上采样与相邻层特征融合的方法,存在浅层网络与深层网络特征关联性不强,多层网络特征融合不充分的问题,影响多尺度目标检测精度。对此,将主干网络中提取的特征进行由深到浅的叠加融合,并对特征金字塔中得到的特征进行补充叠加融合。此外,为进一步提高检测器对目标特征的识别能力,对每次叠加融合后得到的特征通过non-local网络进行特征增强。以PASCAL VOC为数据集的目标检测实验结果表明,所提目标检测模型对数据集中所有类别目标的平均检测精度(mean Average Precision, mAP)为80.6%,对行人类别的检测精度(Average Precision, AP)为81.3%,较FPN网络分别提高了2.4%和2.8%,有效提高了多尺度目标检测精度。  相似文献   

5.
《计算机科学与探索》2019,(6):1049-1061
提出了一种改进的多尺度卷积特征目标检测方法,用以提高SSD(single shot multibox detector)模型对中目标和小目标的检测精确度。该方法先对SSD模型低层特征层采用区域放大提取的方法以提高对小目标的检测能力,再对高层特征层进行特征提取以改善中目标的检测效果。最后,利用SSD模型中原有的多尺度卷积检测方法,将改进的多层特征检测结果进行融合,并通过参数再训练以获得最终改进的SSD模型。实验结果表明,该方法在MS COCO数据集上对中目标和小目标的测试精确度分别为75.1%和40.5%,相比于原有SSD模型分别提升16.3%和23.1%。  相似文献   

6.
为提升在复杂环境下智能物流分拣系统中条形码检测的精度和速度,提出一种基于多尺度特征的条形码快速检测算法。采用深度学习中主流one-stage目标检测器作为基础框架,通过级联不同特征融合层和压缩层实现语义信息充分提取,在不同特征提取层分别嵌入膨胀卷积和深度可分离卷积,对特征提取效果和速度进行有效优化提升。将算法应用于实际分拣现场数据进行测试分析,与已有的YoLo-v3和Vgg-SSD网络等进行对比,该算法在准确度和速度方面具有明显优势,能够较好解决实际应用问题。  相似文献   

7.
行人在众多场景中都存在多尺度变化问题,严重影响检测器的精度,为此设计卷积特征重建和通道注意力两种模块来增强对多尺度行人的检测效果.以原始输入的多尺度特征为基础融合重建多个特征金字塔,然后融合多个特征金字塔中的相同尺度特征,并学习每层特征的通道注意力权值来增加有效通道层权重,由此得到的特征才用于最后的检测.将这两种模块集...  相似文献   

8.
9.
一种多尺度分形特征目标检测方法   总被引:4,自引:0,他引:4  
自然背景干扰下的自动目标检测是目标检测的一个基本问题.根据尺度变化时自然场景中人造目标的分形特征变化剧烈这一特点,提出了一种分形参数极值特征的自动目标检测方法.大量的实验结果表明,分形参数极值特征的自动目标检测方法能较好地完成自然背景干扰中人造小目标的自动检测.  相似文献   

10.
手势交互是人机交互系统的一个重要组成部分。针对现有SSD(Single Shot MultiBox Detector)网络中不同尺度特征间的独立性,无法充分利用各特征间的关联信息,导致对遮挡和不完整手的检测精度偏低等问题,提出一种改进的SSD算法,通过引进多尺度高分辨率保持特征融合模块,将来自不同层的不同分辨率的特征图进行融合形成新的特征图,其不仅保留了原有特征图的特征信息,还结合了不同层的细节信息和上下文较强的语义信息。利用原有SSD检测方法,生成候选预测框,利用非极大抑制(Non-maximum Suppression)得到最终检测结果。实验结果表明,该方法在EgoHands手势数据集上优于原始SSD方法和其他三种先进方法。  相似文献   

11.
行人检测算法是利用行人的特征结合分类器对图片中是否有行人进行判断的方法。文中基于传统的HOG行人特征检测方法以及Adaboost分类器思想,改进了行人检测算法。使用多尺度的HOG特征对图片的检测区域进行特征提取,并采用级联的Adaboost分类器结合对应尺度的特征进行分类判断,将判断结果输入下一级分类器中继续进行分类判断,最终实现区域内有无人的检测。实验结果表明多尺度下的级联分类器能够更加有效地筛选出行人区域,在计算时间小幅增加的情况下,很大地提高了检测精度。  相似文献   

12.
针对现有的多尺度目标检测模型在面对尺度变换和遮挡场景时所使用的融合方法融合不充分,且没有捕捉长距离依赖关系的问题,本文设计了通道融合增强模块和非局部特征交互模块,用于学习不同通道特征之间的相关性和捕捉特征图之间的长距离依赖关系。此外,针对当前检测架构都是基于单金字塔检测结构,存在信息丢失的情况,设计了双金字塔结构,并将提出的融合方法与双金字塔结构结合,在保留原始特征信息的基础上,补充融合后的特征信息。实验结果表明,提出的方法在公共数据集KITTI与PASCAL VOC上与其他先进工作相比具有更高的检测精度,证明了该方法在目标检测任务中的有效性。  相似文献   

13.
为了提高对中小占比手势识别的准确性与稳定性,提出了一种多尺度卷积特征融合的SSD(single shot multibox detector)手势识别方法.该方法突出表现在两大方面,其一,在原始的SSD算法的多尺度卷积检测方法基础上,引入了不同卷积层的特征融合思想,经过空洞卷积下采样操作与反卷积上采样操作,实现网络结构...  相似文献   

14.
为了解决复杂环境中不同因素干扰车牌检测精确度的问题,提出了一种基于双金字塔特征融合的复杂环境下车牌检测算法。通过采用Mish激活函数的残差网络(ResNet101-M)对输入图像进行初级特征提取;在传统特征金字塔网络(feature pyramid network,FPN)的基础上,提出了一种改进的双金字塔特征融合网络(siamese feature pyramid network,SFPN)。被提取的初级特征被送入该网络进行多层特征融合。融合后的特征被送入基于形状先验的锚点设置网络来确定感兴趣区域。将所生成的感兴趣区域送入级联定位网络从而得到准确的车牌检测结果。实验结果表明,该算法在AOLP与CCPD车牌数据集上均能够有效提升检测性能。  相似文献   

15.
针对电力设备在高温、高压、高流速条件下长期连续运行发生锈蚀隐患难以及时发现的问题,提出一种基于区域建议网络与全卷积神经网络相结合的对无规则锈迹进行检测的方法RPN-FCN。首先使用区域建议网络生成带锈迹的候选区域,然后对锈迹候选区域进行全卷积操作,从而在像素级别进行精确的分类定位。通过实验对比,结果表明本文提出的方法对于无规则的锈蚀检测更加准确有效。  相似文献   

16.
伪装目标检测是一项在复杂场景中定位和识别伪装目标的任务. 目前基于深度神经网络的方法已初步运用, 但在复杂场景下遇到干扰时, 许多方法无法充分利用目标的多级特征来提取丰富的语义信息, 仅依靠固定尺寸特征识别伪装目标. 为解决这一问题, 本文提出了一种基于多尺度特征融合交互的伪装目标检测网络. 该网络包含两个创新设计: 多尺度特征感知模块和双阶段邻级交互模块. 前者旨在通过结合多尺度特征的方式充分捕获复杂场景中丰富的局部-全局场景对比信息. 后者则是整合来自相邻层的特征以利用跨层相关性将有价值的上下文信息从编码器传输到解码器网络. 本文在CHAMELEON、CAMO-Test、COD10K-Test这3个公共数据集上对提出的方法进行了评测并与当前的主流方法对比. 实验结果表明, 本文方法的性能超越了当前的主流方法, 在各项指标上达到了优异的性能水平.  相似文献   

17.
基于深度学习的人群密度检测算法取得了巨大进步,但该算法在实际复杂场景中的检测准确性和鲁棒性还有很大的提升空间.复杂场景下目标尺度不一致和背景信息干扰等因素使得人群密度检测成为一项具有挑战性的任务.针对该问题,提出了一种基于多尺度特征融合的人群密度检测网络.该网络首先利用不同分辨率图像并行交互提取人群粗细粒度特征,并引入多层次特征融合机制,以充分利用多层尺度信息.其次采用空间和通道注意力机制突出人群特征权重,聚焦感兴趣的人群,降低背景信息干扰,生成高质量密度图.实验结果表明,在多个典型的公共数据集上与具有代表性的人群密度检测方法相比,多尺度特征融合的人群密度检测网络具有良好的准确性和鲁棒性.  相似文献   

18.
GSNet使用抓取度区分杂乱场景的可抓取区域, 显著地提高了杂乱场景中机器人抓取位姿检测准确性, 但是GSNet仅使用一个固定大小的圆柱体来确定抓取位姿参数, 而忽略了不同大小尺度的特征对抓取位姿估计的影响. 针对这一问题, 本文提出了一个多尺度圆柱体注意力特征融合模块(Ms-CAFF), 包含注意力融合模块和门控单元两个核心模块, 替代了GSNet中原始的特征提取方法, 使用注意力机制有效地融合4个不同大小圆柱体空间内部的几何特征, 从而增强了网络对不同尺度几何特征的感知能力. 在大规模杂乱场景抓取位姿检测数据集GraspNet-1Billion的实验结果表明, 在引入模块后将网络生成抓取位姿的精度最多提高了10.30%和6.65%. 同时本文将网络应用于实际实验, 验证了方法在真实场景当中的有效性.  相似文献   

19.
针对密集场景下人群目标尺度变化大导致识别精度不高的问题,本文提出两种多尺度特征融合结构:注意力加权融合模块(attention-weighted fusion module,AWF)和自底向上融合模块(bottom-up fusion module,BUF).其中AWF模块引入注意力分支学习特征图的权重,并将加权后的多...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号