首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 168 毫秒
1.
针对目前行人检测算法计算量过大和对小尺度行人检测精度不高的问题,提出了一种基于深度卷积神经网络特征层融合的小尺度行人检测方法,设计了一种包含9个卷积层的深度神经网络架构.在进行行人检测时,首先,对输入图像进行分块预处理操作,避免损失原始图像的视觉信息;然后,将网络不同层的卷积特征进行融合,提升行人特征的区分能力和表达能力,进而提升行人检测的精度,在保证检测精度的同时有效降低网络的复杂度.在INRIA、Caltech等公共行人数据集上的实验结果表明,所提出的行人检测方法能够有效检测小尺度的行人,且网络架构的参数量更少,检测速度更快,能得到更高精度的行人检测结果.  相似文献   

2.
为了解决传统前端行人检测算法准确率低以及鲁棒性差的问题,提出将前端嵌入式设备与人工智能芯片搭载的轻量级神经网络相结合的方法,以实现在前端嵌入式设备中完成更加准确、稳定的行人检测.针对前端嵌入式设备性能不足的问题,提出一种轻量级卷积神经网络模型,通过对网络框架的重新设计以及使用聚类分析重新定义候选框尺寸的方法,大大减少网络权重以及计算量.实验结果表明:该方法相较于传统行人检测方法有着更高的检测精度,并在嵌入式行人检测加速方面具有显著效果,可达到每幅图片62 ms的检测速度.  相似文献   

3.
李会军  王瀚洋y  李杨  叶宾 《控制与决策》2020,35(6):1323-1328
虽然基于深度学习的目标检测器具有较高的检测精度,但是大多数检测器的检测速度不能满足实时性要求.此外,目前主流的实时检测算法如SSD(single shot multibox detector)和YOLO(you only look once),对小目标的检测精度不高.鉴于此,提出一种基于视觉特征区域建议的目标检测算法,能够综合平衡检测精度和检测速度.算法分为区域建议和网络分类,区域建议根据目标的特征信息提取候选区域ROI(region of interest);网络分类使用CNN(convolutional neural network)对区域建议中提取的ROI进行处理,计算每个ROI类别的置信度,置信度大于设定阈值的ROI即为目标检测结果.实验结果表明,所提出算法的检测精度明显高于Faster R-CNN、SSD和YOLO,并且具有接近SSD和YOLO的检测速度.  相似文献   

4.
基于分流抑制机制的卷积神经网络人脸检测法   总被引:1,自引:1,他引:1  
提出了一种基于分流抑制机制的卷积神经网络(SICNN)的人脸检测方法.该方法具有结构简单、训练参数少和适应性强等优点.待测图像经过具有分流抑制机制的神经元处理以后,特征信息进一步增强.该方法的人脸检测器可以检测出具有不同表情、姿态、尺寸和背景的图像中的人脸位置,并达到较高的检测率、较快的检测速度和低的错误警报数.  相似文献   

5.
针对卷积神经网络在交通标志识别实时性不好,对设备硬件要求过高的缺点,提出了一种具有实时性,高精度的基于轻量型卷积神经网络的改进网络。一方面引入深度可分离卷积和激活函数Mish,加快网络的训练和识别速度,降低对硬件设备的要求;另一方面通过对网络架构及层次的改进,同时合理改变卷积核的大小和数目,加强图片特征的表达与传递。在BelgiumTSC交通标志数据集上的实验结果表明,改进后网络明显提高了网络训练速度,同时识别精度也略高于原网络,验证了改进方法的有效性。通过与其他模型相比,该模型能够更快速准确完成交通标志识别任务,验证了该方法的可行性。  相似文献   

6.
针对人脸检测在移动端应用时面临的移动设备计算能力及存储资源受限等问题,设计一种基于轻量级卷积神经网络的改进人脸检测算法Lightweight-SSH。基于单点无头人脸检测器(SSH)人脸检测算法,采用基于MobileNet的轻量级卷积神经网络对样本数据进行特征提取,减少模型的参数量和计算量,通过在SSH网络的检测模块中引入可变形卷积层,提升卷积神经网络对人脸形变的建模能力。在Wider Face数据集上的实验结果表明,与常用人脸检测算法相比,Lightweight-SSH算法在保证检测精度的前提下,明显降低模型复杂度,并提高了模型检测速度。  相似文献   

7.
通过嵌入式设备在边缘端进行行人检测能满足实时、安全与隐私保护等方面的基本需求.由于原CenterNet检测网络模型backbone通常以DLA、Hourglass等复杂度较高的多层特征融合结构,嵌入式设备的计算能力有限难以满足实时的要求,因此基于BiFPN网络结构和加权特征融合方法,通过对backbone中的不同特征层进行加权融合,改进了原来的backbone方法,在保证检测精度的同时提升了检测速度.同时针对行人这一特定的检测类别,通过修改训练期间HeatMap上高斯核分布,增加对行人检测的适应性,进一步减少了因行人之间相互遮挡而漏检造成的精度降低.在Jetson TX2上的实验结果表明,改进后的行人检测AP为0.774,同时单张图像的推理时间为68 ms,能够满足在嵌入式设备上的实时要求.  相似文献   

8.
红外热成像因其具有非接触性、灵敏性等优点,已被广泛应用于电力设备的带电检测及其诊断中。其中,对设备快速精确地识别定位是电力设备智能诊断的关键。然而利用传统机器算法对电力设备图像进行识别定位,存在泛化能力不强、鲁棒性较差等不足。针对此问题,开展基于R-FCN区域全卷积网络的绝缘子红外图像识别研究。在TensorFlow框架下搭建RFCN检测模型,并利用迁移学习方法初始化模型权重,以提高训练效果。最后,将所研究算法与Faster-RCNN和SSD模型进行对比。实验表明,R-FCN模型的检测精度为89.2%,检测速度为23 fps,具有较高的精度和速度。该算法为绝缘子的智能诊断奠定坚实基础。  相似文献   

9.
陈乔松  弓攀豪 《计算机应用研究》2020,37(7):2202-2205,2226
针对行人检测方法未能充分利用卷积网络浅层特征的问题,改进Faster R-CNN框架,提出了一种基于自适应特征卷积网络的行人检测方法。该方法有两处改进:a)设计了SFCM模块,用于提取卷积神经网络浅层细节特征;b)引用挤压与激励操作设计了AFCM模块,用于筛选检测所需的强辨识力行人特征。此外,利用公开的Caltech和INRIA行人数据集,通过在基准框架中逐一添加SFCM和AFCM模块训练行人检测器,验证了所提模块的有效性,并对比了主流行人检测算法。实验结果显示,所提方法的误检率分别降到了9.13%和9.46%,具有更优的检测性能。  相似文献   

10.
一种基于多特征和机器学习的分级行人检测方法   总被引:4,自引:0,他引:4  
针对单幅图像中的行人检测问题,提出了基于自适应增强算法(Adaboost)和支持向量机(Support vector machine, SVM)的两级检测方法, 应用粗细结合的思想有效提高检测的精度.粗级行人检测器通过提取四方向特征(Four direction features, FDF)和GAB (Gentle Adaboost)级联训练得到,精密级行人检测器用熵梯度直方图(Entropy-histograms of oriented gradients, EHOG)作为特征, 通过支持向量机学习得到.本文提出的EHOG特征考虑到熵, 通过分布的混乱程度描述,具有分辨行人和类似人的物体能力. 实验结果表明,本文提出的EHOG、粗细结合的两级检测方法能准确地检测出复杂背景下不同姿势的直立行人, 检测精度优于以往Adaboost方法.  相似文献   

11.
针对卷积神经网络的庞大参数量和计算量难以应用于移动设备或嵌入式设备的问题,提出冗余特征重建模块(redundant feature reconstruction,RFR)和组注意力卷积模块(group attention convolution,GAC),RFR模块使用较少的参数量提取重要的固有特征,通过线性算子重建冗...  相似文献   

12.
王程  刘元盛  刘圣杰 《计算机工程》2023,49(2):296-302+313
行人检测在无人驾驶环境感知领域具有重要应用。现有行人检测算法多数只关注普通大小的行人目标,忽略了小目标行人特征信息过少的问题,从而造成检测精度低、应用于嵌入式设备中实时性不高等情况。针对该问题,提出一种小目标行人检测算法YOLOv4-DBF。引用深度可分离卷积代替YOLOv4算法中的传统卷积,以降低模型的参数量和计算量,提升检测速度和算法实时性。在YOLOv4骨干网络中的特征融合部分引入scSE注意力模块,对输入行人特征图的重要通道和空间特征进行增强,促使网络学习更有意义的特征信息。对YOLOv4颈部中特征金字塔网络的特征融合部分进行改进,在增加少量计算量的情况下增强对图像中行人目标的多尺度特征学习,从而提高检测精度。在VOC07+12+COCO数据集上进行训练和验证,结果表明,相比原YOLOv4算法,YOLOv4-DBF算法的AP值提高4.16个百分点,速度提升27%,将该算法加速部署在无人车中的TX2设备上进行实时测试,其检测速度达到23FPS,能够有效提高小目标行人检测的精度及实时性。  相似文献   

13.
针对移动端目标检测算法需要模型参数量与计算量更少、推理速度更快和检测效果更好以及目标检测算法对于小目标误检、漏检及特征提取能力不足等问题, 提出一种基于YOLOv5改进的轻量化目标检测算法. 该算法使用轻量级网络MobileNetV2作为目标检测算法的骨干网络降低模型的参数量与计算量, 通过使用深度可分离卷积结合大卷积核的思想降低网络的计算量与参数量, 并提升了小目标的检测精度. 使用GhostConv来替换部分普通卷积, 进一步降低参数量与计算量. 本文算法在VOC竞赛数据集, COCO竞赛数据集两份数据集上均进行了多次对比实验, 结果表明本文算法相比于其他模型参数量更小、计算量更小、推理速度更快以及检测精度更高.  相似文献   

14.
Lightweight implementation of existing human pose estimation networks limits the model representation capability, and it cannot effectively deal with problems such as changeable poses, complex backgrounds, and occlusion in practical applications. To address this problem, a lightweight human pose estimation network with dynamic convolution, called LDNet, is proposed in this study. First, we start from a lightweight feature extraction head to reduce the number of image preprocessing parameters. Then, we employ a high-resolution parallel subnetwork to predict precise keypoint heatmaps. To reduce the complexity due to high-resolution representations while maintaining good network performance, we propose a lightweight dynamic convolution. It can cope with changing human poses by adaptively learning different convolution parameters. Finally, to further exploit the relationship between the high-level semantic and spatial structure features for accurately locating different keypoints, we propose a keypoint refinement module based on our lightweight dynamic convolution to improve the keypoint detection and location results. Overall, accurate keypoint prediction results are obtained and compared with those of many existing networks, such as HRNet, the number of parameters is reduced by 82.1% and the calculation complexity is reduced by 47.9%. The model achieves an average precision of 73.5% and 88.7% on the COCO 2017 and MPII datasets, respectively. LDNet also shows good prediction accuracy and robustness on the CrowdPose dataset. The proposed network is superior to existing outstanding lightweight networks and is comparable to existing large-scale human pose estimation networks.  相似文献   

15.
SSD(single shot multi-box detector)是目前广泛应用于行人检测的神经网络算法,为了提高其检测精度和检测速度,对SSD算法进行了有效改进(改进后的算法称为XSSD-P)。选择Xception网络作为XSSD-P算法的骨干网络并重新选择用于预测的特征层;根据行人外形尺寸的特征设计了多尺度卷积核和基础锚框,并将二者耦合,基础锚框通过调节自身大小得到锚框(anchors)用于位置回归;再使用深度可分离卷积代替常规卷积在特征图上进行预测,实现了行人的有效检测。在INRIA数据集、VOC数据集和COCO数据集上进行检测精度对比测试,与SSD以及其他主流算法相比,XSSD-P算法在行人检测方面拥有更高的检测精度,并在Caltech行人数据集和MIT行人数据集中验证了XSSD-P算法的泛化性能。在检测速度方面,与SSD算法相比,XSSD-P算法的检测速度高出30 FPS,提高了42.86%。实验结果表明,XSSD-P的检测精度和检测速度均优于SSD算法。  相似文献   

16.
目的 在近岸合成孔径雷达(synthetic aperture radar, SAR)图像舰船检测中,由于陆地建筑及岛屿等复杂背景的影响,小型舰船与周边相似建筑及岛屿容易混淆。现有方法通常使用固定大小的方形卷积核提取图像特征。但是小型舰船在图像中占比较小,且呈长条形倾斜分布。固定大小的方形卷积核引入了过多背景信息,对分类造成干扰。为此,本文针对SAR图像舰船目标提出一种基于可变形空洞卷积的骨干网络。方法 首先用可变形空洞卷积核代替传统卷积核,使提取特征位置更贴合目标形状,强化对舰船目标本身区域和边缘特征的提取能力,减少背景信息提取。然后提出3通道混合注意力机制来加强局部细节信息提取,突出小型舰船与暗礁、岛屿等的差异性,提高模型细分类效果。结果 在SAR图像舰船数据集HRSID(high-resolution SAR images dataset)上的实验结果表明,本文方法应用在Cascade-RCNN(cascade region convolutional neural network)、YOLOv4(you only look once v4)和BorderDet(border d...  相似文献   

17.
目的 为满足语义分割算法准确度和实时性的要求,提出了一种基于空洞可分离卷积模块和注意力机制的实时语义分割方法。方法 将深度可分离卷积与不同空洞率的空洞卷积相结合,设计了一个空洞可分离卷积模块,在减少模型计算量的同时,能够更高效地提取特征;在网络输出端加入了通道注意力模块和空间注意力模块,增强对特征的通道信息和空间信息的表达并与原始特征融合,以进一步提高特征的表达能力;将融合的特征上采样到原图大小,预测像素类别,实现语义分割。结果 在Cityscapes数据集和CamVid数据集上进行了实验验证,分别取得70.4%和67.8%的分割精度,速度达到71帧/s,而模型参数量仅为0.66 M。在不影响速度的情况下,分割精度比原始方法分别提高了1.2%和1.2%,验证了该方法的有效性。同时,与近年来的实时语义分割方法相比也表现出一定优势。结论 本文方法采用空洞可分离卷积模块和注意力模块,在减少模型计算量的同时,能够更高效地提取特征,且在保证实时分割的情况下提升分割精度,在准确度和实时性之间达到了有效的平衡。  相似文献   

18.
为了深度卷积神经网络能够更好地应用于边缘设备,减少深度神经网络的模型参数量,降低网络复杂度,对于轻量化卷积神经网络的研究日益增多。将常用于多尺度融合的卷积——空洞卷积首次应用于神经网络轻量化领域研究。利用空洞卷积采样与扩大感受野的结构特性,实现了模型参数量的减少与计算复杂度的降低。将空洞卷积单纯作用于残差网络结构,达到轻量化目的,并进一步与逐点卷积结合,提高轻量化效果,形成改进型空洞卷积轻量化方法。为减少准确率衰减,将改进型空洞卷积与普通卷积相融合,提出一种融合型空洞卷积轻量化方法。实验结果表明,改进型空洞卷积轻量化方法具有最显著的轻量化效果,融合型空洞卷积轻量化方法使模型参数量减少同时具有最佳速度与精度的权衡。  相似文献   

19.
目的 基于深度学习的动作识别方法识别准确率显著提升,但仍然存在很多挑战和困难。现行方法在一些训练数据大、分类类别多的数据集以及实际应用中鲁棒性较差,而且许多方法使用的模型参数量较大、计算复杂,提高模型准确度和鲁棒性的同时对模型进行轻量化仍然是一个重要的研究方向。为此,提出了一种基于知识蒸馏的轻量化时空图卷积动作识别融合模型。方法 改进最新的时空卷积网络,利用分组卷积等设计参数量较少的时空卷积子模型;为了训练该模型,选取两个现有的基于全卷积的模型作为教师模型在数据集上训练,在得到训练好的教师模型后,再利用知识蒸馏的方法结合数据增强技术训练参数量较少的时空卷积子模型;利用线性融合的方法将知识蒸馏训练得到的子模型融合得到最终的融合模型。结果 在广泛使用的NTU RGB + D数据集上与前沿的多种方法进行了比较,在CS(cross-subject)和CV(cross-view)两种评估标准下,本文模型的准确率分别为90.9%和96.5%,与教师模型2s-AGCN(two-stream adaptive graph convolutional networks for skeleton-based action)相比,分别提高了2.4%和1.4%;与教师模型DGNN(directed graph neural network)相比,分别提高了1.0%和0.4%;与MS-AAGCN(multi-stream attention-enhanced adaptive graph convolutional neural network)模型相比,分别提高了0.9%和0.3%。结论 本文提出的融合模型,综合了知识蒸馏、数据增强技术和模型融合的优点,使动作识别更加准确和鲁棒。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号