期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王睿旸施欣妤陈伟陆科名陈曦珑《电脑编程技巧与维护》2021,(1):133-136,176

计算复杂度一直制约着目标检测算法在边缘端设备中的部署,利用模型剪枝方法,对流行的目前检测算法YOLOv3进行了精简,提出了一种适合于无人机部署的目标检测模型,在几乎不降低模型精度的前提下大大降低了模型的参数量和浮点计算量.通过L1正则化、几何中心匹配、通道剪枝、层剪枝、知识蒸馏等方法,对YOLOv3算法进行了剪枝和优化. 相似文献

2.

基于敏感度的YOLO网络集成剪枝算法

张江永徐智勇张建林许涛《计算机工程》2021,47(9):59-68

深层卷积神经网络所需的计算量和存储空间严重制约了其在资源有限平台上的应用与部署。针对基于单一参数重要性评价或者特征重建的剪枝算法泛化能力较差的问题,提出基于敏感度的集成剪枝算法,利用BN层的缩放因子稀疏YOLO网络中卷积核个数较多的冗余层,结合3种参数重要性评价方法对卷积核做重要性排序,并根据敏感度确定每一层的剪枝比率。实验结果表明,该剪枝算法对于YOLOv3和YOLOv3-tiny网络分别缩减80.5%和92.6%的参数量,并且相比基于网络轻量化方法的剪枝算法提升了网络模型压缩后的检测精度和泛化能力。相似文献

3.

基于SlimYOLOv3的工业场景目标检测算法

刘馨柔李洋宋文军《计算机应用研究》2021,38(6):1889-1893

基于人工设计特征的检测算法检测速度普遍较慢,检测精度也有待提高,已无法满足现今工业生产中的需求.而基于深度学习的检测技术,因其需要大量的计算和存储空间无法在资源受限的设备上部署使用.针对这些问题,引用一种通道剪枝方法实现YOLOv3检测网络的轻量化,得到剪枝模型SlimYOLOv3,并进一步提出将SlimYOLOv3用于工业场景下的实时检测任务.方法通过对通道缩放因子施加L1正则化来增强卷积层的通道级稀疏性,并对信息量较小的特征通道进行剪枝,最终获得轻量级的网络模型.与原模型相比,SlimYOLOv3剪枝模型减小了60％,计算量减少了50％,检测速度是原模型的1.7倍,更适于智能工业场景中复杂目标的实时检测. 相似文献

4.

基于自适应阈值的循环剪枝算法

王以忠郭振栋房臣杨国威王琦琦郭肖勇《计算机应用研究》2022,39(5)

针对YOLO系列目标检测算法中复杂的网络模型和大量冗余参数问题,提出了一种基于自适应阈值的循环剪枝算法：在经过基础训练和稀疏化训练后,进入到自适应阈值剪枝模块,该模块针对缩放因子分布情况,通过缩放因子对通道和卷积层的重要性进行评估,自主学习到一个剪枝阈值,再对网络模型进行剪枝,此过程可以循环进行,并在通道剪枝和层剪枝中应用。该算法中的阈值不是人为设定,而是针对当前网络结构学习获得,通过剪枝获得一个更优的精简模型。算法实验基于YOLOv3在三个数据集上验证,结果表明,该算法对不同数据集、不同网络结构表现出较强的适应性,与传统固定阈值相比,通过自适应阈值剪枝的模型在检测精度、压缩效果、推理速度等方面都取得了更优的效果。相似文献

5.

面向轻量化网络的安全帽检测算法

下载免费PDF全文

蒋润熙阿里甫·库尔班耿丽婷《计算机工程与应用》2021,57(20):263-270

随着深度学习的发展,神经网络模型的体积越来越大,伴随而来的是参数量与计算量的增多,但实际安全帽检测环境下需要把网络模型部署在算力有限的移动端或嵌入式设备中,而这些设备无法支持复杂的计算量。针对这个问题,提出了一种适合部署在移动设备的轻量级目标检测网络HourGlass-YOLO（HG-YOLO）。以YOLOv5为基础模型,基于Inverted Resblock结构重构了新的主干特征提取网络HourGlass;并使用通道剪枝技术,对BatchNormalization（BN）层进行稀疏训练,将权值较小的通道进行删减,在保证精度的情况下,减少模型的参数;融合卷积层和BN层来加快在CPU上的推理速度。实验结果表明HG-YOLO在保证精度的情况下,将YOLOv5模型的体积压缩87%、浮点数减少86%、参数量降低89%,相比SSD在检测速度上快了8.2倍,更适合实际工业场景中的部署。相似文献

6.

基于YOLOv5s剪枝模型的输电线路全景监测研究

闫彦辉张楠武建超张国庆唐锐倪威《测控技术》2023,42(1):10-15

随着人工智能技术的快速发展,基于深度学习的目标检测算法在诸多行业得到了应用。针对当前输电线路影像中典型障碍物目标识别对人工要求较高的问题,提出了基于YOLOv5模型剪枝的算法来对输电线路附近典型目标进行检测。首先,算法进行基础训练后得到一个检测精度和推理速度两种性能比较均衡的网络模型,再进行稀疏训练以获得参数较为稀疏的神经网络模型,最后,采取不同剪枝策略对网络进行修剪,达到压缩模型大小提高推理速度的目的。在自制数据集上使用多种算法进行对比试验,实验结果表明：相较于YOLOv4、CenterNet和SSD算法,所提算法在保持相对较高检测精度条件下提高了检测速度,能够满足实际需要。相似文献

7.

面向边缘端的施工人员实时检测方法

下载免费PDF全文

徐晓东王俊杰《计算机工程与应用》2021,57(23):280-286

施工人员检测在施工管理工作中有重要的应用价值。施工现场图像背景复杂且视角多样,给施工人员检测任务带来难度,同时施工现场大多基础配套设施不完善,并且网络条件较差,不适合在大型GPU工作站上进行模型部署。针对以上问题,以YOLOv3检测网络为基础,加入特征金字塔池化模块,增加多尺度特征融合并改进候选框,提升检测精度,同时采用通道剪枝算法对检测网络进行轻量化处理以适应边缘端设备算力,提出一种面向边缘端的施工人员实时检测方法。该方法在自制的施工人员数据集上平均准确率可达到88.23%,较YOLOv3检测方法提升4.89个百分点,且将模型大小压缩至原来的1/13,检测速度提升一倍,在嵌入式设备Jetson Xavier NX上检测速度可达到69.08帧/s,满足在施工现场进行实时边缘端检测的要求。相似文献

8.

基于参数子空间和缩放因子的YOLO剪枝算法

杨民杰梁亚玲杜明辉《计算机工程》2021,47(2):111-117

为保证YOLO网络在嵌入式设备上正常运行,需采用剪枝算法精简滤波器以减小网络存储空间和计算量,而现有剪枝算法耗时较长且剪枝精度较低。提出一种基于参数子空间和批量归一化（BN）层缩放因子的双准则剪枝算法。将卷积层滤波器通过k均值聚类得到不同参数子空间,在子空间内使滤波器按权重排序并去除权重较低的滤波器,同时采用BN层缩放因子剪枝算法避免剪枝精度下降。实验结果表明,采用该算法剪枝后的YOLOv3网络在精度不变的情况下,占用的内存减少5/6且计算时间缩短1/3,与PF、CP等剪枝算法相比,该算法在保持较高网络精度的情况下计算量更少。相似文献

9.

融合改进通道和层剪枝的口罩人脸检测

刘紫燕袁磊朱明成马珊珊《计算机工程与科学》2022,44(3):463-470

针对实际场景中目标检测算法部署算力缺乏和资源不足的问题,提出了一种基于改进通道和层剪枝的模型剪枝方法,通过设置自适应局部安全阈值以改进通道剪枝,同时通过综合评价整个残差结构值的方法进行层剪枝,并将模型剪枝方法用于口罩人脸检测.首先采用基于人脸的数据扩增方法构建口罩人脸检测数据集并使用该数据集训练YOLOv4目标检测网络... 相似文献

10.

基于嵌入式Jetson TX2的高原鼠兔目标检测

陈海燕贾明明赵文力王婵飞《计算机应用》2023,43(1):98-103

高原鼠兔目标检测是对其进行种群数量统计及种群动态变化研究的基础,但传统的高原鼠兔智能监测系统的目标检测硬件设备大,在抽样采集数据时移动性较弱。针对此问题,提出一种可部署到便携式设备Jetson TX2上的基于改进YOLOv3模型的目标检测方法。该方法将YOLOv3的主干网络DarkNet53替换成MobileNet,并利用剪枝、微调等方法构建轻量级高原鼠兔目标检测模型,再将轻量化模型部署到Jetson TX2上。自然场景下高原鼠兔目标检测实验的结果表明：所提方法的检测平均精度（AP）、每秒检测帧数（FPS）和模型大小分别为97.36%、36和14.88 MB,优于主干网络替换后未裁剪的YOLOv3模型及原始YOLOv3模型,相较于原YOLOv3模型,AP在仅下降1.05个百分点的情况下,FPS提升了620%,模型大小压缩了93.67%,能够部署在便携设备上进行实时且准确的高原鼠兔目标检测。相似文献

11.

基于ZYNQ平台的YOLOv3压缩和加速

郭文旭苏远歧刘跃虎《计算机应用》2021,41(3):669-676

高精度物体检测网络急剧增加的参数和计算量使得它们很难在车辆和无人机等端侧设备上直接部署使用。针对这一问题,从网络压缩和计算加速两方面入手,提出了一种面向残差网络的新型压缩方案来实现YOLOv3的压缩,并通过ZYNQ平台对这一压缩后的网络进行加速。首先,提出了包括网络裁剪和网络量化两方面的网络压缩算法。网络裁剪方面,给出了针对残差结构的裁剪策略来将网络剪枝分为通道剪枝和残差链剪枝两个粒度,解决了通道剪枝无法应对残差连接的局限性,进一步降低了模型的参数量;网络量化方面,实现了一种基于相对熵的模拟量化方法,以通道为单位对参数进行量化,在线统计模型的参数分布与参数量化造成的信息损失,从而辅助选择最优量化策略来减少量化过程的精度损失。然后,在ZYNQ平台上设计并改进了8比特的卷积加速模块,从而优化了片上缓存结构并结合Winograd算法实现了压缩后YOLOv3的加速。实验结果表明,所提压缩算法较YOLOv3 tiny能够进一步降低模型尺寸,但检测精度提升了7个百分点;同时ZYNQ平台上的硬件加速方法获得了比其他平台更高的能耗比,从而推进了YOLOv3以及其他残差网络在ZYNQ端侧的实际部署。相似文献

12.

基于改进YOLOv5的轻量化航空目标检测方法

杨小冈高凡卢瑞涛李维鹏张涛曾俊《信息与控制》2022,51(3):361-368

为解决硬件平台资源受限条件下的实时航空目标检测需求,在基于改进YOLOv5的基础上,提出了一种针对移动端设备/边缘计算的轻量化航空目标检测方法。首先以MobileNetv3为基础搭建特征提取网络,设计通道注意力增强结构MNtECA (MobileNetv3 with Efficient Channel Attention)提高特征提取能力;其次在深度可分离卷积层增加1×1的卷积,在减少卷积结构参数的同时提高网络的拟合能力;最后对检测网络进行迭代通道剪枝实现模型压缩和加速。实验选取DIOR (Object Detection in Optical Remote Sensing Images)数据集进行训练和测试,并在嵌入式平台(NVIDIA Jetson Xavier NX)对轻量级模型进行推理验证。结果表明,所提出的轻量级模型大幅降低了参数和计算量,同时具有较高精度,实现了移动端设备/边缘计算的实时航空目标检测。相似文献

13.

改进YOLOv5s的轨道障碍物检测模型轻量化研究

下载免费PDF全文

李昂孙士杰张朝阳冯明涛吴成中李旺《计算机工程与应用》2023,59(4):197-207

针对传统列车轨道障碍物检测方法实时性差和对小目标检测精度低的不足,提出一种改进YOLOv5s检测网络的轻量化障碍物检测模型。引入更加轻量化的Mixup数据增强方式,替代算法中原有的Mosaic数据增强方式;引入GhostNet网络结构中的深度可分离卷积GhostConv,替代原有YOLOv5s模型中特征提取网络与特征融合网络中的普通卷积层,减小了模型的计算开销;在模型特征提取网络末端加入CA空间注意力机制,让算法在训练过程中减少了重要位置信息的丢失,弥补了改进GhostNet对检测精度的损失;将改进后的模型进行稀疏训练和通道剪枝操作,剪掉对检测精度影响不大的通道,同时保留重要的特征信息,使模型更加轻量化。实验结果表明,改进后的模型在自制的多样化轨道交通数据集上,相较于原始YOLOv5s算法,在模型大小减小9.7 MB,检测速度提高14 FPS的前提下,检测精度提升了1.0个百分点。同时与目前主流的检测算法对比,在检测精度与检测速度上也具有一定的优越性,适用于复杂轨道交通环境下的障碍物目标检测。相似文献

14.

改进YOLOv3-SPP的无人机目标检测模型压缩方案

下载免费PDF全文

黄文斌陈仁文袁婷婷《计算机工程与应用》2021,57(21):165-173

无人机设备算力低下,深度模型计算量过大不适合直接部署,航拍图像目标小并且密集,模型对目标识别分类效果也不佳。为了提高深度模型航拍目标检测的精度和速度,降低计算量。对YOLOv3-SPP模型进行改进,将GIoU代替平方和用作定位损失,提高定位精度。提出了一种数据集优化和数据增强方法。再针对特定类别按照权值进行采样处理均衡化类别数量。随机组合不同场景样本组成批训练,提高模型训练效率和检测鲁棒性。再对模型进行压缩,在BN层添加缩放因子进行稀疏训练和通道剪枝的基础上,通过缩放因子衡量模型残差层重要性,修剪不重要残差,进一步减小前向推理层数和参数。实验表明,模型参数量减小了95.7%,模型大小减小95.82%,同等算力下模型推理速度提高为原来3倍。且精度和速度均高于最新YOLOv5系列轻量模型。相似文献

15.

基于MCA-YOLOv5s的轻量化地铁站内行人检测

下载免费PDF全文

孙同庆刘光杰唐喆李佑文《计算机系统应用》2023,32(11):120-130

随着智慧车站和云计算的迅速发展,地铁站内大规模视频监控系统行人检测的部署愈发重要,在客流监测、乘客引导和行为警示等方面发挥着人力不能及的重要作用.在实际工程应用中,受到计算资源有限以及多尺度多角度遮挡的困难样本带来错漏检的不利影响,为此提出一种轻量化行人检测算法MCA-YOLOv5s.首先使用Mobile Netv3代替YOLOv5主干网络,实现网络模型轻量化处理,并用PConv代替Mobile Netv3网络中的DWConv,减少冗余计算和内存访问;其次在特征融合阶段的C3模块中融入坐标注意力机制,使模型更加关注行人的位置信息;同时将损失函数CIoU替换为Alpha IoU以增加High Loss目标的权重和边界框的回归精度;最后通过FPGM剪枝压缩改进后的网络模型,提升模型加载和运行速度.将改进后的模型部署在华为Atlas 300 AI加速卡中,对地铁站内行人进行检测,其平均精度达到94.1%,检测速度为104.1 fps.实际工程实践表明,改进后的算法检测速度提升71.8%,节省了站内硬件部署资源,更满足地铁大客流下的行人监测和管理的工程实际需求. 相似文献