共查询到20条相似文献,搜索用时 15 毫秒
1.
针对通用的目标检测算法在检测生活场景下的多类目标时检测精度低、速度较慢的问题,提出了一种基于注意力机制改进的轻量级目标检测算法YOLOv4s。该算法以CSPDarknet53-s作为主干特征提取网络提取图像特征,通过注意力模块进行特征选择,再利用特征金字塔网络对特征进行融合,最后通过检测头分别处理特征融合后的两个输出,进而提高对生活场景下多类目标检测的能力。实验结果表明:相比改进前的算法,YOLOv4s算法在PASCAL VOC数据集上的平均均值精度(mAP)及MS COCO数据集上的平均精度(AP)都有一定程度的提升;相较于轻量级算法Efficientdet,YOLOv4s算法在MS COCO数据集上的AP也有一定提高,并且实现了有效的显著目标检测。 相似文献
2.
基于卷积神经网络的深度学习算法展现出卓越性能的同时也带来了冗杂的数据量和计算量,大量的存储与计算开销也成了该类算法在硬件平台部署过程中的最大阻碍。而神经网络模型量化使用低精度定点数代替原始模型中的高精度浮点数,在损失较小精度的前提下可有效压缩模型大小,减少硬件资源开销,提高模型推理速度。现有的量化方法大多将模型各层数据量化至相同精度,混合精度量化则根据不同层的数据分布设置不同的量化精度,旨在相同压缩比下达到更高的模型准确率,但寻找合适的混合精度量化策略仍十分困难。因此,提出一种基于误差限制的混合精度量化策略,通过对神经网络卷积层中的放缩因子进行统一等比限制,确定各层的量化精度,并使用截断方法线性量化权重和激活至低精度定点数,在相同压缩比下,相比统一精度量化方法有更高的准确率。其次,将卷积神经网络的经典目标检测算法YOLOV5s作为基准模型,测试了方法的效果。在COCO数据集和VOC数据集上,该方法与统一精度量化相比,压缩到5位的模型平均精度均值(mean Average Precision, mAP)分别提高了6%和24.9%。 相似文献
3.
《信息通信》2021,(1):75-77
非约束环境下的人脸定位算法是诸多面部感知应用系统中的关键基础模块,一直是极具挑战性的课题。随着海量训练数据集的出现及深度学习技术的发展,基于深层卷积神经网络的视觉目标检测方法取得了突破性的进展,YOLOv3-Tiny是其中一种具有较高准确率的快速通用目标检测算法,但由于其输出神经元的物理感受野范围会随网络输入尺寸的固定而被限定,使其无法在具有尺度范围跨度过大的非约束人脸检测中充分发挥其检测性能。为了有效扩展YOLOv3-Tiny网络检测神经元的有效感知范围,文章提出了一种基于YOLOv3-Tiny多模型融合方式的快速人脸定位算法。首先根据人脸尺寸对原始图像集的标签数据进行筛选,划分为不同的子集,并利用它们分别对多个具有不同有效感知范围的YOLOv3-Tiny模型进行训练。接着,利用多模型对输入图像独立进行推理,并基于非极大值抑制算法及相应的尺度约束阈值实现检测结果的有效融合。实验结果显示,该算法能够有效利用多模型各自的检测优势,实现跨度尺度范围下的无约束人脸检测,具有重要应用潜力。 相似文献
4.
5.
6.
在基于机器视觉的ADAS(Advanced Driver Assistance System)系统中,基于传统RGB可见光成像的障碍物检测方法极易受到异常天气、光学折射等原因影响。相比之下,被动式热红外成像技术有着不受天气干扰、不受光线干扰等优势,对未来的ADAS系统是一种潜在的解决方案。本文基于热红外图像的特性,对YoloV5s检测网络进行针对性优化,提出基于改进型YoloV5s的热红外道路车辆及行人检测方法。该方法针对热红外图像的特性以及实际部署中嵌入式平台的算力问题,使用卷积下采样层替换YoloV5s中低效的Focus Layer。针对实际部署环境中遇到的遮挡、重叠等易出现误检、漏检的情况,以DIoU_NMS替换加权NMS作为候选框非极大值抑制方法。使用FLIR热红外交通检测数据集进行了算法验证,该方法参数量为7.4 M,计算量为17.5 GFLOPs,检测速度达到213 FPS,同时mAP达到93.4%。该方法在保证检测精度的同时能满足ADAS系统对实时性的要求。 相似文献
7.
随着数据快速增长,冯诺依曼架构内存墙成为计算性能进一步提升的关键瓶颈。新型存算一体架构(包括存内计算(IMC)架构与近存计算(NMC)架构),有望打破冯诺依曼架构瓶颈,大幅提高算力和能效。该文介绍了存算一体芯片的发展历程、研究现状以及基于各类存储器介质(如传统存储器DRAM, SRAM和Flash和新型非易失性存储器ReRAM, PCM, MRAM, FeFET等)的存内计算基本原理、优势与面临的问题。然后,以知存科技WTM2101量产芯片为例,重点介绍了存算一体芯片的电路结构与应用现状。最后,分析了存算一体芯片未来的发展前景与面临的挑战。 相似文献
8.
9.
由于嵌入式设备的内存和计算能力有限,在无人机平台上运行基于深度学习的目标检测算法进行实时解析具有很大的挑战性,同时,算法在小目标、高密度、多类别的场景下,检测精度有待提高。在此前提下,构建NCWS-YOLO轻量级算法,以YOLOv5算法为基础,基于非极大值抑制方法,融合加权框融合算法,提出了NCW方法,重构了预测端目标框筛选网络,使检测精度提升了3.9%。并且利用通道剪枝技术,对批归一化层进行通道稀疏化训练,选择不包括shortcut的层进行修剪,使参数量减少了74%,模型大小缩减了72.2%,浮点数运算降低了37.6%,将算法部署于嵌入式设备上实现了对无人机数据集的目标检测任务。所提方法在无人机数据集上测试精度(Pr)和平均精度(mAP@0.5)分别达到了0.941和0.969,在Nvidia Jetson TX2上推理速度提升了49.6%。实验数据表明,该网络能够在低功耗、算力低的嵌入式设备上进行实时检测。 相似文献
10.
传统中文车牌识别方法对场景约束有要求,算法实时性差,且无法被部署在边缘设备上。针对上述问题,文中提出一种基于YOLO(You Only Look Once)的无约束场景中文车牌检测与识别方法。该方法分为车牌检测和车牌字符识别两个模块。在车牌检测部分,使用改进的YOLOv5模型,在预测目标候选区域的基础上多预测4组关键点用于车牌矫正,并使用在COCO数据集上训练的预训练模型进行训练,减少了由环境复杂引起的误检问题,具有高实时性。在车牌字符识别部分,改进了CRNN(Convolutional Recurrent Neural Network)模型,减少了算法的参数量和计算量,使其能成功部署于各类边缘设备。实验结果表明所提出的车牌识别方法能在复杂环境中高效检测并识别车牌。文中提出的车牌检测模型在车牌检测数据集上的map值相较Retina-face提升了3.0%,车牌字符识别模型在车牌识别数据集上精确度相比LPR-Net提升了4.2%。 相似文献
11.
在基于深度卷积神经网络的目标检测方法中,模型的参数量动辄数十兆字节,在计算资源有限的移动终端等边缘设备中部署这样的大模型比较困难。为了解决这个问题,本文在Single Shot MultiBox Detector(SSD)的基础上联合轻量化网络设计和参数量化两种技术来实现网络模型的轻量化。首先,基于ResNet50和MobileNet我们重新设计了SSD目标检测框架,并训练了一个全精度参数模型。然后,在全精度参数模型的基础上,采取逐块量化的策略将特征提取层中卷积层的参数精度降低到三值(零和正负一)。实验结果表明,本文提出的联合方案在Pascal VOC2007数据集上测试能够达到72.54%的mAP,和其他业界领先的轻量级目标检测方法相比检测精度更高且能使模型占用的内存空间更小。 相似文献
12.
在频谱感知中经典的能量检测算法在低信噪比时检测性能较低且门限难以估计,基于机器学习的感知算法受限于检验统计量的构造会造成接收信号原有结构信息的丢失。针对这些问题,本文提出一种基于LSTM神经网络的频谱感知方法,首先利用接收信号序列作为神经网络的输入特征向量,然后使用LSTM神经网络进行训练得到分类器,最后使用训练好的模型实现频谱感知。该方法无需估计检测门限值,也无需构造特征向量,仿真结果表明,所提算法在采样点和次级用户更少的情况下仍优于对比算法。 相似文献
13.
14.
基于内容的图像检索的关键在于对图像进行特征提取和对特征进行多比特量化编码 。近年来,基于内容的图像检索使用低级可视化特征对图像进行描述,存在“语义鸿沟”问题;其次,传统量化编码使用随机生成的投影矩阵,该矩阵与特征数据无关,因此不能保证量化的精确度。针对目前存在的这些问题,本文结合深度学习思想与迭代量化思想,提出基于卷积神经网络VGG16和迭代量化(Iterative Quantization, ITQ)的图像检索方法。使用在公开数据集上预训练VGG16网络模型,提取基于深度学习的图像特征;使用ITQ方法对哈希哈函数进行训练,不断逼近特征与设定比特数的哈希码之间的量化误差最小值,实现量化误差的最小化;最后使用获得的哈希码进行图像检索。本文使用查全率、查准率和平均精度均值作为检索效果的评价指标,在Caltech256图像库上进行测试。实验结果表明,本文提出的算法在检索优于其他主流图像检索算法。 相似文献
15.
人工智能交互领域的不断发展,使计算机视觉技术的研究更加深入且多样化。人体姿态识别是计算机视觉中的一个重要的基础问题。文章基于计算机视觉开展人体姿态识别研究,通过VGGNet模型实现神经网络预测,采用Openpose算法获取18个人体关键点位置和置信度,根据PAF和二分图算法实现关节拼接。实验基于MS COCO 2017数据集建立优化模型,在测试集上达到了96.31%的准确率。最后,文章实现了能够识别出人体骨骼姿态的系统。 相似文献
16.
17.
18.
为了提升目标检测算法在多尺度学习方面的能力,尤其是对小目标的检测能力,本文提出了一种基于改进YOLOv5的超分辨率和多尺度融合目标检测算法。首先,该算法使用子像素卷积代替原YOLOv5模型的上采样操作,提高图像的分辨率,并尽可能保留小目标的信息。其次,使用并行快速多尺度融合(parallel fast multi-scale fusion,PFMF)模块实现深层特征和浅层特征的双向融合,将原YOLOv5算法的3尺度预测升级为4尺度预测,以此提高模型多尺度特征学习能力和对小目标的检测效果。实验结果表明,与YOLOv5s相比,改进后的模型在PASCAL VOC数据集中,mAP@0.5提高了2.8个百分点,mAP@0.5∶0.95提高了3.5个百分点;在MS COCO数据集中,mAP@0.5提高了4.3个百分点,mAP@0.5∶0.95提高了5.2个百分点。改进后的 YOLOv5模型在多尺度检测,尤其是小目标的检测效果方面得到了提升,并具有一定的应用价值。 相似文献
19.