首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 297 毫秒
1.
由于光照变化、乘客拥挤和站外噪声干扰大等问题,现今地铁进站客流人脸检测技术精度较低。为提高人脸检测精度,本文在YOLO2轻量级目标检测算法Tiny YOLO2原有网络结构基础上,首先利用不同数目的1×1卷积层对特征图进行压缩,然后将特征图尺寸重新调整到统一大小进行级联,得到高维特征图。缩减网络最后几层卷积核数量,用1×1卷积层替换原始网络的3×3卷积层,得到更深而且更窄的人脸检测网络。改进后的网络先后在Wider Face数据集和地铁进站客流数据集上进行训练,得到最终的人脸检测模型。加载训练好的人脸检测模型对随机选取的300幅站外乘客图片进行测试。测试结果表明:本文算法相比Tiny YOLO2原始人脸检测算法,召回率提高4.2%,单幅图片检测速度提高6.5%。同时在广泛使用的人脸检测算法评测数据集FDDB上进行测试,在误检数目为200的情况下,人脸检测准确率相比Tiny YOLO2平均提高5%,比SSD检测算法提高2%,而且本文算法能够在检测速度和精度之间取得较好的平衡,有较好的泛化性。  相似文献   

2.
针对实时目标检测YOLO(You Look Only Once)算法中存在的检测精度低和网络模型训练速度慢等问题,结合批再规范化算法处理小批样本以及非独立同分布数据的优势,提出了在YOLO网络结构加入批再规范化处理的改进算法。该YOLO改进算法把卷积层经过卷积运算产生的特征图看作一个个神经元,然后对这些神经元进行规范化处理。同时,在网络结构中移除了Dropout,并增大了网络训练的学习率。实验结果表明,该改进算法相对于原YOLO算法具有更高的检测精度、更快的实时检测速度以及通过适当设置批样本大小可使网络模型在训练时间和硬件设备方面成本有一定的降低。  相似文献   

3.
张雲轲  刘丹 《计算机应用》2019,39(1):192-198
针对TINY YOLO车辆检测算法计算量过大,且在小型嵌入式系统中难以达到实时检测要求的问题。利用小型Zynq SoC系统的架构优势以及TINY YOLO的网络权值中存在大量接近零的权值参数这一特点,提出硬件并行加速的改进算法,称为浓缩小型深度网络(Xerantic-TINY YOLO,X-TINY YOLO)车辆检测算法。首先对TINY YOLO中网络结构进行压缩;其次采用高效多级流水线、流水线内全并行的方式对卷积计算部分进行算法加速;最后提出与网络结构相配合的数据切割和传输方案。实验结果表明,X-TINY YOLO仅消耗50%的片内硬件资源,可在相对于GPU和CPU性价比更高更适合嵌入式场景的Zynq SoC系统上实现,且其检测速度达到24帧/s,满足车辆检测的实时性要求。  相似文献   

4.
针对YOLO目标检测算法在小目标检测方面存在的不足,以及难以在嵌入式平台上达到实时性的问题,设计出了一种基于YOLO算法改进的dense_YOLO目标检测算法。该算法共分为2个阶段:特征提取阶段和目标检测回归阶段。在特征提取阶段,借鉴DenseNet结构的思想,设计了新的基于深度可分离卷积的slim-densenet特征提取模块,增强了小目标的特征传递,减少了参数量,加快了网络的传播速度。在目标检测阶段,提出自适应多尺度融合检测的思想,将提取到的特征进行融合,在不同的特征尺度上进行目标的分类和回归,提高了对小目标的检测准确率。实验结果表明:在嵌入式平台上,针对小目标,本文提出的dense_YOLO目标检测算法相较原YOLO算法mAP指标提高了7%,单幅图像检测时间缩短了15 ms,网络模型大小减少了90 MB,明显优于原算法。  相似文献   

5.
针对YOLOv4的人脸口罩检测参数量和计算量大,难以部署到硬件资源有限的嵌入式设备问题,提出一种轻量型YOLOv4算法,并设计卷积神经网络硬件加速器。将骨干网络替换成MobileNetv2,使用深度可分离卷积替换掉部分普通卷积,压缩网络结构;改进SPP模块以满足Vitis AI支持的池化窗口尺寸;在颈部网络中,增加CSP结构使网络更容易优化。实验结果表明,改进的算法牺牲0.25%的检测精度,压缩84.42%的模型大小。在ZYNQ上,mAP达到95.16%,DPU平均利用率减少38%。  相似文献   

6.
基于卷积神经网络的目标检测算法在追求较高精度的同时,忽略了检测速度,使得算法难以在有限算力的情况下实现实时检测。在YOLO目标检测算法的基础上,采用一系列轻量化的方法,运用Mobilenetv1网络替换Darknet53基础网络,将YOLO head部分3×3标准卷积替换为深度可分离卷积,根据灵敏度对卷积层滤波器进行排序和修剪,并在嵌入式GPU TX2平台上进行C++推理部署。在VOC数据集上的测试结果表明,改进算法在精度仅下降0.75个百分点的前提下实现了2.4倍加速,模型占用内存仅为原来的21.5%。  相似文献   

7.
尽管基于卷积神经网络(CNN)的人脸检测器在精度上已经有了很大提升,但所需的计算量和模型复杂度越来越高,如何在计算能力有限的嵌入式设备上应用人脸检测模型是一个很大的挑战.针对320×240分辨率输入图像的人脸检测在嵌入式系统上的应用问题,提出了一种基于轻量级网络的低分辨率人脸检测算法.该算法使用注意力机制、结合了Dis...  相似文献   

8.
为了解决航拍小汽车检测精度和速度问题,论文在YOLO v3算法的基础上,设计了一种新的网络结构,并提出了一种改进YOLO v3算法.首先用混合深度卷积核代替单一卷积核,设计了一种新的特征提取网络.其次,对YOLO v3的FPN网络进行了改进,将深度特征映射和浅层特征映射融合,减小了卷积核的感受野.最后,在设计损失函数时...  相似文献   

9.
针对基于嵌入式现场可编程门阵列(FPGA)平台的卷积神经网络加速器由于资源有限导致处理速度受限的问题,提出一种高性能卷积神经网络加速器.首先根据卷积神经网络和嵌入式FPGA平台的特点,设计软硬件协同操作架构;然后在存储资源和计算资源的限制下,分别提出二维直接内存存取分块和权衡数字信号处理单元与查找表使用的优化策略;最后针对人脸检测的应用,对SSD网络模型进行优化,采用软硬件流水结构,提高人脸检测系统的整体性能.在Xilinx ZC706开发板上实现此加速器,实验结果表明,该加速器可达到167.5 GOPS的平均性能和81.2帧/s的人脸检测速率,其平均性能和人脸检测速率是嵌入式GPU平台TX2的1.58倍.  相似文献   

10.
针对目前人脸润饰检测算法特征提取复杂、识别率低的问题,提出了一种基于多尺度卷积神经网络的人脸润饰检测算法.不同于传统的卷积神经网络,本文的网络增加了图像预处理,利用基于方向梯度直方图(Histograms of Oriented Gradient,HOG)特征的人脸提取算法从原始图像中提取出人脸部分;在第一个池化层后连接局部归一化(Local Response Normalization,LRN)层,加速模型的收敛;提出了多尺度卷积层,将大小为1×1,3×3和5×5的卷积核进行级联,提高模型分类效果.实验结果表明,本文算法的检测精度在人脸润饰数据集LFW和ND-ⅢTD分别达到99.5%和92.9%,相比于主流网络结构和最新人脸润饰检测算法,检测精度有显著提高.  相似文献   

11.
针对当前基于深度学习的安全帽检测方法因结构复杂和计算量大,难以在嵌入端实现实时检测的问题,提出一种适用于嵌入式平台的轻量化安全帽实时检测方法.该方法以Tiny-YOLOv3检测网络为基础,通过改进特征提取网络和多尺度预测优化网络结构,引入空间金字塔池化模块丰富特征图的多尺度信息,采用K-means聚类算法确定适合安全帽...  相似文献   

12.
YOLO系列算法的简化版本YOLOv3-Tiny具有较为简单的网络框架,对GPU显存要求较低,该算法虽然实时性较高,却存在精度较低的问题,在识别行车目标方面不能得到精确的结果。对此,本文首先改变输入图片的大小,目的是获取图片更多的横向信息,使得网络更容易学习行车的信息,其次改进算法的网络结构提高算法的精度,最终得出改进的YOLOv3-Tiny算法。实验结果表明,改进之后的算法在保证实时性的情况下,提高了精确性。  相似文献   

13.
输电线路安全是电网安全稳定运行的前提,但是频繁的鸟类活动却给输电线路造成了严重影响。为解决传统驱鸟方式的弊端,研究人员采用深度学习算法进行鸟类检测,然而深度学习算法需运行在性能好的服务器上,这必然会造成网络时延,无法做到实时驱鸟,所以应在移动端进行鸟类检测,但现有的目标检测算法模型较大,无法直接应用在移动端,因此本文提出一种适用于移动端的YOLO v3输电线路鸟类检测算法,将YOLO v3模型中的基础网络darknet-53替换成轻量级的特征提取网络MobileNet,实现了移动端输电线路鸟类检测。实验结果表明,在输电线路鸟类检测任务中,该模型准确率可达到83.57%,检测速度达到61 fps,可在内存4 GB的移动端平台稳定运行,能够满足输电线路鸟类检测任务的精度要求及实时性要求,具有良好的应用前景。  相似文献   

14.
针对在低功耗、低成本硬件平台快速准确检测老人跌倒高危行为的问题,提出了一种基于AlphaPose优化模型的老人异常行为检测算法.首先,对行人目标检测模型和姿态估计模型进行优化,以加快人体目标检测和姿态关节点推理;然后,通过优化的AlphaPose模型快速计算得到人体姿态关节点图像坐标数据;最后,计算人体跌倒瞬间头部关节...  相似文献   

15.
基于YOLOv3的嵌入式实时视频目标检测算法   总被引:1,自引:0,他引:1  
深度神经网络在目标检测领域具有优异的检测性能,但其结构复杂、计算量大,难以在嵌入式设备上进行高性能的实时目标检测。针对该问题,提出一种基于YOLOv3的目标检测算法。采用半精度推理策略提高YOLO算法的推理速度,并通过视频运动自适应推理策略充分利用前后帧视频之间目标的关联性,降低深度学习算法的运行频率,进一步提高目标检测速度。在ILSVRC数据集上的实验结果表明,该算法可以在NVIDIA TX2嵌入式平台上实现28 frame/s的视频目标检测,且检测精度与原始的YOLOv3算法相当。  相似文献   

16.
针对当前电力线路检测中存在深度学习网络参数量大、计算复杂度高等问题;在YOLOv5的基础上提出一种电力线和杆塔的实时检测算法;通过减少Bottleneck数量来简化特征提取层网络结构,使用深度可分离卷积技术实现模型计算量的降低;分析电力线目标框筛选机制,改进(Non-Maximum Suppression)NMS算法,提升模型目标检测精度;实验结果表明,对Bottleneck的改进在识别精度有所提高的情况下能有效降低模型的参数量,模型检测准确率和召回率分别达到94%与95%,体积压缩了20.7%,在Jetson Nano嵌入式平台上检测速度达到17.2 fps,对两类电力线路目标检测达到较高的识别率和实时性,对无人机电力巡检导航有较好的参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号