期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

武文娟李勇《小型微型计算机系统》2023,(3):560-564

随着计算机技术日益发展，计算机视觉逐渐融入人们的生活，深度卷积神经网络在计算机视觉领域得到了广泛的应用.然而计算资源和内存的限制，为卷积神经网络在嵌入式设备的部署带来了巨大的困难.本文提出了一种新的轻量级的人脸识别的卷积神经网络——Emfacenet,通过在CASIA-WebFace数据集上进行卷积神经网络的训练，并在计算机CPU平台以及嵌入式平台上利用LFW数据集对模型的预测效果分别进行测试，Emfacenet在CPU平台下识别速度分别是Resnet50、Mobilenetv3以及Mobilefacenets这3种模型的2.07倍、1.67倍、1.63倍，在嵌入式平台下识别速度分别56.65倍、2.09倍、3.41倍.而且Emfacenet卷积神经网络模型大小仅为138.1KB,保持较高精度的同时运行效率显著提高，可以适用于嵌入式等硬件资源受限领域来实现人脸识别. 相似文献

2.

XSSD-P：改进的SSD行人检测算法

下载免费PDF全文

鲍文斌张冬泉《计算机工程与应用》2022,58(23):132-141

SSD（single shot multi-box detector）是目前广泛应用于行人检测的神经网络算法,为了提高其检测精度和检测速度,对SSD算法进行了有效改进（改进后的算法称为XSSD-P）。选择Xception网络作为XSSD-P算法的骨干网络并重新选择用于预测的特征层;根据行人外形尺寸的特征设计了多尺度卷积核和基础锚框,并将二者耦合,基础锚框通过调节自身大小得到锚框（anchors）用于位置回归;再使用深度可分离卷积代替常规卷积在特征图上进行预测,实现了行人的有效检测。在INRIA数据集、VOC数据集和COCO数据集上进行检测精度对比测试,与SSD以及其他主流算法相比,XSSD-P算法在行人检测方面拥有更高的检测精度,并在Caltech行人数据集和MIT行人数据集中验证了XSSD-P算法的泛化性能。在检测速度方面,与SSD算法相比,XSSD-P算法的检测速度高出30?FPS,提高了42.86%。实验结果表明,XSSD-P的检测精度和检测速度均优于SSD算法。相似文献

3.

多尺度卷积特征融合的SSD手势识别算法

谢淋东仲志丹乔栋豪高辛洪《计算机技术与发展》2021,(3)

为了提高对中小占比手势识别的准确性与稳定性,提出了一种多尺度卷积特征融合的SSD(single shot multibox detector)手势识别方法。该方法突出表现在两大方面,其一,在原始的SSD算法的多尺度卷积检测方法基础上,引入了不同卷积层的特征融合思想,经过空洞卷积下采样操作与反卷积上采样操作,实现网络结构中的浅层视觉卷积层与深层语义卷积层的融合,代替原有的卷积层用于手势识别,以提高模型对中小目标手势的识别精度;其二,为了解决正负样本不均衡导致分类性能差的问题,提出一种改进的损失函数,以提升模型对目标手势的分类能力。在手势识别公开的数据集上的实验结果表明,与SSD和Faster R-CNN等识别方法相比,能够在保持较高的手势检测精度的同时,又具有较好的鲁棒性与检测速度。相似文献

4.

面向嵌入式FPGA的高性能卷积神经网络加速器设计

曾成龙刘强《计算机辅助设计与图形学学报》2019,31(9)

针对基于嵌入式现场可编程门阵列(FPGA)平台的卷积神经网络加速器由于资源有限导致处理速度受限的问题,提出一种高性能卷积神经网络加速器.首先根据卷积神经网络和嵌入式FPGA平台的特点,设计软硬件协同操作架构;然后在存储资源和计算资源的限制下,分别提出二维直接内存存取分块和权衡数字信号处理单元与查找表使用的优化策略;最后针对人脸检测的应用,对SSD网络模型进行优化,采用软硬件流水结构,提高人脸检测系统的整体性能.在Xilinx ZC706开发板上实现此加速器,实验结果表明,该加速器可达到167.5 GOPS的平均性能和81.2帧/s的人脸检测速率,其平均性能和人脸检测速率是嵌入式GPU平台TX2的1.58倍. 相似文献

5.

一种基于SSD改进的目标检测算法

苏蒙李为《计算机与现代化》2020,(2):89-93

SSD(Single Shot MultiBox Detector)是一种基于深度学习的目标检测算法,它作为当前最为主流的检测算法之一,在极大地提高检测速度的同时,还能保证一定的检测精度,但是仍难以满足实际应用的需求。本文在SSD模型的基础上,引入注意力机制,提出一种基于SSD改进的目标检测算法。注意力机制能够有效地提高卷积神经网络对图片特征的提取能力,从而进一步提高算法的检测精度。改进后的算法在Pascal VOC数据集上进行对比试验。实验结果表明,改进后的模型在Pascal VOC2007测试集上的检测精度达到78.5% mAP（mean Average Precision）,比改进前提高4.2个百分点,在Pascal VOC2012测试集上的检测精度达到77.1% mAP,比改进前提高4.7个百分点。相似文献

6.

基于卷积神经网络优化TLD运动手势跟踪算法

下载免费PDF全文

王民李泽洋王纯石新源《计算机工程与应用》2019,55(9):151-156

针对TLD（Tracking-Learning-Detection）算法在光照变化不均、遮挡严重、跟踪目标模糊等情况下会出现跟踪失败的问题，提出一种基于卷积神经网络优化TLD运动手势跟踪算法。选取手势特征作正样本，其背景作负样本，获取手势HOG特征并投入到卷积神经网络中加以训练，得到手势检测分类器，从而确定目标手势区域，实现手势的自动识别；再利用TLD算法对手势进行跟踪与学习，对正负样本进行估计检测并实时校正，同时运用SURF特征匹配更新跟踪器。实验结果验证，该算法对比TLD经典算法跟踪精度提高了4.24%，增强了运动手势的跟踪效果，相比经典跟踪算法拥有更高鲁棒性。相似文献

7.

基于改进卷积注意力模块与残差结构的SSD网络

张侣周博文吴亮红《计算机科学》2022,49(3):211-217

SSD(Single Shot Multibox Detector)是一种基于卷积神经网络的单阶检测算法,相比双阶检测算法,它在保证一定精度的同时显著提高了检测速度,但仍难以满足很多实际应用,尤其是在小目标检测任务中,检测精度更是难以满足需求。针对该不足,文中提出了一种基于改进残差结构与卷积注意力模块的特征提取网络Res-Am CNN(Residual with Attention Module Convolutional Neural Networks),大幅提高了网络的特征提取能力,并在原始SSD金字塔结构中引入上采样加法融合(Additive Fusion with Upsample,AFU)来进行特征融合,增强了浅层特征的表征能力。在PASCAL VOC数据集上的实验结果表明,相比原始SSD网络和主流的检测网络,Res-Am&AFU SSD(SSD with Res-Am CNN and AFU)网络在VOC测试集上的平均精度均值(mean Average Precision,mAP)达到69.1%,在精度上领先单阶网络,接近双阶网络,在检测速度上远快于双阶网络。在小目标测试集上的实验结果表明,Res-Am&AFU SSD网络的mAP为67.2%,比原始SSD提高了9.4%,且该方法具有更加灵活、无需预训练等优点。相似文献

8.

智能人机交互中第一视角手势表达的一次性学习分类识别

鹿智秦世引李连伟张鼎豪《自动化学报》2021,47(6):1284-1301

在智能人机交互中, 以交互人的视角为第一视角的手势表达发挥着重要作用, 而面向第一视角的手势识别则成为最重要的技术环节. 本文通过深度卷积神经网络的级联组合, 研究复杂应用场景中第一视角下的一次性学习手势识别(One-shot learning hand gesture recognition, OSLHGR)算法. 考虑到实际应用的便捷性和适用性, 运用改进的轻量级SSD (Single shot multibox detector)目标检测网络实现第一视角下手势目标的快速精确检测; 进而, 以改进的轻量级U-Net网络为主要工具进行复杂背景下手势目标的像素级高效精准分割. 在此基础上, 以组合式3D深度神经网络为工具, 研究提出了一种第一视角下的一次性学习手势动作识别的网络化算法. 在Pascal VOC 2012数据集和SoftKinetic DS325采集的手势数据集上进行的一系列实验测试结果表明, 本文所提出的网络化算法在手势目标检测与分割精度、分类识别准确率和实时性等方面都有显著的优势, 可为在复杂应用环境下实现便捷式高性能智能人机交互提供可靠的技术支持. 相似文献

9.

轻量化目标检测算法研究及应用

黄靖淞左颢睿张建林《计算机工程》2021,47(10):236-241

基于卷积神经网络的目标检测算法在追求较高精度的同时,忽略了检测速度,使得算法难以在有限算力的情况下实现实时检测。在YOLO目标检测算法的基础上,采用一系列轻量化的方法,运用Mobilenetv1网络替换Darknet53基础网络,将YOLO head部分3×3标准卷积替换为深度可分离卷积,根据灵敏度对卷积层滤波器进行排序和修剪,并在嵌入式GPU TX2平台上进行C++推理部署。在VOC数据集上的测试结果表明,改进算法在精度仅下降0.75个百分点的前提下实现了2.4倍加速,模型占用内存仅为原来的21.5%。相似文献

10.

基于通道剪枝和量化的卷积神经网络压缩方法

徐晓蒋志翔张杨《计算机工程与设计》2021,42(10):2860-2866

为提升辅助维修技术在实际工程应用中的性能,解决嵌入式设备性能有限,难以实现实时物体识别任务这一问题,以提高轻量级卷积神经网络在嵌入式平台中的识别速度为目标,提出一种基于通道剪枝和量化的综合卷积神经网络压缩方法.以MobileNet V3模型进行实验,其结果表明,该卷积神经网络压缩方法有效压缩了网络结构,在识别精度损失可接受的情况下,实现了目标物体在嵌入式平台上的实时识别. 相似文献

11.

基于深度神经网络的sEMG手势识别研究

下载免费PDF全文

张龙娇曾晓勤《计算机工程与应用》2019,55(23):113-119

为了提高表面肌电信号（sEMG）手势识别算法的准确性,并解决人为提取大量特征具有局限性的问题,提出了一种基于深度神经网络的手势识别方法。将MYO臂环采集到的8通道sEMG数据,采用活动段分割的方法探测到有效动作;设计出一种融合卷积神经网络（CNN）和长短时记忆（LSTM）网络的神经网络;实验的结果表明手势识别准确率为91.6%,验证了提出的方案高效可行。相似文献

12.

遗传神经网络在语音识别中的应用研究

赵锋《数字社区&智能家居》2008,(8):774-776

针对语音识别的特点,对BP神经网络在语音识别技术中的应用进行了探索性研究,进而结合人工智能领域较为有效的方法——遗传（GA）算法,针对传统BP算法识别准确率高但训练速度慢的缺点,对BP网络进行改进,构建了一种基于遗传神经网络的语音识别算法（GABP）,并建立相应的语音识别系统。仿真实验表明,该算法有效地缩短了识别时间,提高了网络训练速度和语音的识别率。相似文献

13.

嵌入式软件算法级能耗建模与分析

张晶陈沫良《计算机工程》2014,(6):13-15,28

针对嵌入式软件算法级能耗的优化问题,建立算法级能耗估算模型。以旅行商问题(TSP)为例,采用神经网络算法、遗传算法等进行能耗求解,对求解过程中的算法执行次数、算法复杂度以及运行时间这3个特征值进行能耗分析,通过能耗估算模型计算出算法针对TSP问题的能耗估算值,并将该估算值与使用sim-panalyzer功耗仿真平台求解得到的能耗测试值进行比较,结果表明,能耗测试值与估算值的误差在10%左右,证明该能耗估算模型具有较高的准确性。相似文献

14.

基于构造性形态学神经网络的一种提升算法

下载免费PDF全文

邓文豪金炜东吴旭东《计算机工程与应用》2015,51(18):140-143

构造性形态学神经网络算法（CMNN）是一种数学形态学与传统的神经网络模型相结合的一种非线性神经网络,有较强的实用性。其训练算法根据形态学联想记忆而来,在测试过程中采用形态学算子将测试样本归类于训练得到的超盒之中。由于其测试过程无法正确地将落在超盒外的样本进行分类,后有人提出了一种基于模糊格的形态学神经网络（FL-CMNN）,该算法用样本与超盒的隶属度判断提高了原CMNN算法的分类效果,但增加了算法的复杂程度且分类效果不稳定。这里提出一种基于构造性形态学神经网络算法的提升算法（LCMNN）,该算法继承了原有的形态学算子运算速度快的优点且能够将落在超盒之外的样本进行准确地归类。数值实验表明,基于构造性形态学神经网络算法的提升算法（LCMNN）与其他几种算法相比,能够达到最好的分类效果,而且简单易行,计算时间少。相似文献

15.

基于多尺度感受野融合的小目标检测算法

下载免费PDF全文

李成豪张静胡莉肖贤鹏张华《计算机工程与应用》2022,58(12):177-182

针对通用目标检测算法在检测小目标时检测精度低的问题,提出一种基于多尺度感受野融合的小目标检测算法S-RetinaNet。该算法采用残差神经网络（residual neural network,ResNet）提取出图像的特征,利用递归特征金字塔网络（recursive feature pyramid network,RFPN）对特征进行融合,通过多尺度感受野融合模块（multiscale receptive field fusion,MRFF）分别处理RFPN的三个输出,提升对小目标的检测能力。实验表明,相比改进前的RetinaNet算法,S-RetinaNet算法在PASCAL VOC数据集上的均值平均精度（mean average precision,mAP）和MS COCO数据集上的平均精度（average precision,AP）分别提高了2.3和1.6个百分点,其中小目标检测精度（average precision small,APS）更为显著,提升了2.7个百分点。相似文献

16.

基于级联神经网络的型钢表面缺陷检测算法

于海涛李健升刘亚姣李福龙王江张春晖于利峰《计算机应用》2023,43(1):232-241

深度学习在缺陷检测方面具有优越性能,然而在工业应用过程中由于缺陷概率低,无缺陷图像的检测过程占据了大部分计算时间,严重限制了整体上的有效检测速度。针对上述问题,提出一种基于级联网络的型钢表面缺陷检测算法SDNet。该算法分为两个阶段：预检阶段和精检阶段。预检阶段采用基于深度可分离卷积（DSC）以及多尺度并行卷积的轻量化ResNet预检网络,判断型钢表面图像是否存在缺陷;精检阶段以YOLOv3作为基准网络对图像中的缺陷进行准确分类与定位,并在主干特征提取网络以及预测分支中引入改进空洞空间金字塔池化（ASPP）模块以及对偶注意力模块,以提升网络的检测性能。实验结果表明,SDNet在1 024像素×1 024像素图像上的检测速度达到每秒120.63帧,准确率达到92.1%。与原YOLOv3算法相比,所提算法的检测速度是原YOLOv3算法的3.7倍,检测精度提高了10.4个百分点,可应用于型钢表面缺陷的快速检测。相似文献

17.

面向自然场景文本检测的改进NMS算法

下载免费PDF全文

杨有为周刚《计算机工程与应用》2022,58(1):204-208

近些年来,卷积神经网络算法在自然场景文本检测效果上较传统算法已经有了很大提升,但如何有效处理神经网络输出层候选框仍然值得研究。非极大值抑制算法（non-maximum suppression,NMS）通过选择最高置信度候选框作为检测结果,往往容易对较长文本以及混叠文本区域检测失效。考虑到该问题,可以将候选框集合进行排序滤波与融合计算,得到更准确的候选框,有效减少上述检测失效的情况。这种方法,可以直接嵌入原有方法中,而不需要改变网络结构或者增加任何训练量。通过在公开数据集上进行实验,对比其他方法,该方法有较大优势。相似文献

18.

高性能人脸识别加速器优化设计及FPGA实现

下载免费PDF全文

吴进张伟华席萌代巍《计算机工程与应用》2020,56(22):48-54

计算机视觉的快速发展对嵌入式产品的系统性能要求越来越高,传统的现场可编程门阵列（Field Programmable Gate Array,FPGA）平台存在计算吞吐未能很好匹配内存带宽,通用处理器对卷积神经网络（Convolutional Neural Network,CNN）的实现效率不高,未能满足性能要求等问题。针对以上设计瓶颈,使用经典的LeNet-5神经网络模型,在Xilinx ZC706嵌入式开发平台上设计了一个高性能的人脸识别神经网络加速器,在高层次综合（High Level Synthesis,HLS）工具的基础上通过存储优化、定点量化、运算优化等方法对神经网络模型进行优化改进,实现了7层的CNN加速器。实验结果表明,CNN加速器的工作频率为200 MHz,相较于CPU,加速器实现了126倍加速,相较于GPU速度提升10倍以上,并且功耗仅为2.62 W。相似文献

19.

粒子群优化神经网络在动态手势识别中的应用

李文生姚琼邓春健《计算机工程与科学》2011,33(5):74

为了提高动态手势学习训练速度和识别准确率,本文提出一种基于粒子群优化BP神经网络的动态手势识别方法。首先基于自然人机交互需要,定义一套基于机器视觉的动态手势模型;在获取指尖运动轨迹的基础上,提取动态手势的特征向量作为神经网络的输入;利用改进的PSO算法训练BP神经网络,得到神经网络的权值和阈值;最后利用训练过的神经网络识别基于机器视觉的动态手势。测试结果表明:改进的PSO算法能够提高神经网络训练速度和精度,进而提高动态手势识别准确率。相似文献