首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对目前在中央处理器(CPU)中部署卷积神经网络速度慢、在图形处理器(GPU)中功耗高等问题,采用基于现场可编程门阵列(FPGA)平台开发的卷积神经网络识别系统,对卷积神经网络的各个环节进行算法加速。考虑到算法的计算量和逻辑资源的消耗主要集中在卷积层,提出了在特征图的通道方向进行双卷积并行模块设计。在卷积神经网络的池化层和激活函数Softmax中,设计了流式池化,并提出改进的分段查表计算Softmax函数的方法。另外,在归一化和预处理阶段也分别进行了优化。卷积神经网络识别系统选用XILINX公司的ZCU104开发平台。该平台内部包含片上系统与可编程逻辑控制器。通过自制水果数据集,分别在ZCU104、CPU和GPU上进行试验。试验结果显示,ZCU104分类的准确率达到了95.8%,识别速度约为计算机端上CPU实现同种网络模型的3倍,并且高于GPU。此外,该系统通用性高、资源占用率低,可应用在其他神经网络模型中。  相似文献   

2.
随着人工智能的快速发展,卷积神经网络(CNN)在很多领域发挥着越来越重要的作用。分析研究了现有卷积神经网络模型,设计了一种基于现场可编程门阵列(FPGA)的卷积神经网络加速器。在卷积运算中四个维度方向实现了并行化计算;提出了参数化架构设计,在三种参数条件下,单个时钟周期分别能够完成512、1024、2048次乘累加;设计了片内双缓存结构,减少片外存储访问的同时实现了有效的数据复用;使用流水线实现了完整的神经网络单层运算过程,提升了运算效率。与CPU、GPU以及相关FPGA加速方案进行了对比实验,实验结果表明,所提出的设计的计算速度达到了560.2 GOP/s,为i7-6850K CPU的8.9倍。同时,其计算的性能功耗比达到了NVDIA GTX 1080Ti GPU的3.0倍,与相关研究相比,所设计的加速器在主流CNN网络的计算上实现了较高的性能功耗比,同时不乏通用性。  相似文献   

3.
本文基于FPGA实现了一种数据传输引擎,解决了传统直接存储器存取(DMA)带宽利用率低、无法支持三维数据的读写等问题.本文将片内缓存的功能设计在DMA,降低了数据传输引擎的设计难度.本文在Xilinx Zynq XC7045上实现了该数据传输引擎,在200 MHz的时钟频率下最高能达到4 Gbps的带宽和100%的带宽利用率.  相似文献   

4.
由于军事背景下战场上不同目标的相似度极高以及复杂情况下的分类识别率不高,传统视觉特征的分类精度已不能满足要求。针对含有特定军事目标的大规模图像分类问题构造了一种新的基于主成分分析(Principal Components Analysis, PCA)白化的卷积神经网络结构,有效地降低数据间的相关性,加强学习能力,提高目标分类的准确率。利用大规模的军事图像数据集对该模型进行了识别精度评估,实验表明,与基于视觉特征的词袋模型以及经典的卷积神经网络分类算法相比,该算法对于军事目标的分类精度有明显提高。  相似文献   

5.
近年来,卷积神经网络(CNN)等深度学习方法的发展为发动机故障诊断和预测带来了新的思路。CNN具有局部连接、权值共享、池化操作以及多层结构等特点,能够有效提取局部特征,降低网络的训练难度,使CNN具有很强的学习能力和特征表达能力。开展了深度卷积神经网络故障预测方法研究,实现了面向发动机气路故障预测算法架构。利用基于发动机试验仿真数据对该方法进行了验证,并与其他几种常见的基于数据驱动的预测方法进行了比较,验证结果表明本文提出的基于卷积神经网络的预测方法具有较好的可行性和效果,可作为开展发动机PHM技术研究的参考。  相似文献   

6.
基于卷积神经网络的面向对象露天采场提取   总被引:1,自引:0,他引:1  
矿产资源的过度开发会对自然环境造成严重的负影响,矿山环境监测对生态文明建设具有十分重要意义.在目前的矿山环境监测中,机器学习算法被广泛的使用并取得了较为良好的效果.近年来,随着深度学习领域的快速发展,相关理论知识也逐渐被应用于遥感图像处理中.将深度学习算法与面向对象的思想相结合,以高分二号影像作为研究数据,使用卷积神经...  相似文献   

7.
基于多时序特征和卷积神经网络的农作物分类   总被引:1,自引:0,他引:1  
近年来,以卷积神经网络为主的深度学习模型在各种遥感应用中都显示出巨大的潜力。以加州帝国郡为研究区,以Landsat 8 OLI年内时序遥感影像计算时序植被指数NDVI、EVI、RVI以及TVI,组合后输入到构建的一维卷积神经网络 模型,以实现作物的高精度精细分类。为了验证卷积模型的优越性,另搭建了基于递归神经网络及其变体的深度学习模型。结果表明:①引入其他时序特征后,能够有效地提高卷积神经网络的分类精度。NDVI+EVI+TVI+RVI组合特征总体精度和Kappa系数最高,分别是89.667 4%和0.856 0,对比NDVI时序特征总体精度和Kappa系数提高了近4%和0.6。②在与其他深度学习模型的对比中,一维卷积神经网络分类精度最高,能够从时序数据中较为准确捕捉作物时序特征信息,尽管递归神经网络被广泛应用于序列数据的研究,但分类结果要略差于卷积神经网络。实验表明在NDVI的基础上引入其他植被指数辅助,能够有效地提高分类精度。基于一维卷积神经网络的深度学习框架为长时间序列分类任务提供了一种有效且高效的方法。  相似文献   

8.
卷积神经网络优异的性能使其在图像处理领域占有重要地位,然而模型的实际应用多依赖于GPU,难以部署在对功耗敏感的嵌入式设备上。为了使模型能够高效部署在以FPGA为基础的平台上,本文提出一种卷积神经网络定点化方法,以数据精度与资源消耗为设计指标,根据模型中数据分布的统计以及数据类型的划分,确定不同的定点化策略,并给出了不同量化方法与溢出模式和硬件资源消耗的关系。使用Xilinx定点化库进行测试,实验结果表明,使用16位定点数对模型进行统一量化,能够在较小的精度损失下降低硬件资源消耗,且不同的量化模式下硬件资源消耗相同,不同的溢出模式下硬件资源消耗区别较大。  相似文献   

9.
该文以互联网上的图片数据为训练数据,结合使用深度学习技术,实现了一种基于卷积神经网络和检测关键词的目标检测系统。系统根据用户输入的检测关键词,利用网络爬虫技术搜集图像用于训练。对每张图像,使用预训练的神经网络模型提取图像特征,并采用金字塔池化技术得到图像表达向量。系统基于图像表达向量学习分类器,并利用分类器对用户上传的图片进行目标检测。系统的实现具有实际意义,理想情况下可对任意具体目标实现检测(如行人、车辆、动物等)。  相似文献   

10.
《微型机与应用》2019,(7):54-59
针对现有的SRCNN算法网络训练时间太长、重建性能不佳、运行速度较慢的问题,提出了一种新的图像超分辨率重建算法,基于卷积神经网络以低分辨率的图像作为网络输入,利用卷积操作学习图像的高阶表示,通过反卷积操作进行上采样重建图像,同时在网络中加入残差结构,使得整个网络能够更好地收敛。在Set5、Set14、BSD200测试集上的实验结果表明,相比双三次插值法Bicubic、SRCNN等方法,所提方法对图像的超分辨率重建效果更好,运行速度有很大的提升,且网络的收敛速度更快。  相似文献   

11.
传统文本分类使用word embedding作为文档表示,忽略词在当前上下文的含义,潜在的认为相同词在不同文本中含义相同。针对此问题提出一种词义消歧的卷积神经网络文本分类模型——WSDCNN(Word Sense Disambiguation Convolutional Neural Network)。使用双向长短时记忆网络(BLSTM) 建模上下文,得到词义消歧后的文档特征图。利用卷积神经网络(CNN)进一步提取对文本分类最重要的特征。在四个数据集上进行对比实验,结果表明,所提出方法在两个数据集,特别是文档级数据集上优于先前最好的方法,在另外两个数据集上得到与此前最好方法相当的结果。  相似文献   

12.
窦慧  张凌茗  韩峰  申富饶  赵健 《软件学报》2024,35(1):159-184
神经网络模型性能日益强大,被广泛应用于解决各类计算机相关任务,并表现出非常优秀的能力,但人类对神经网络模型的运行机制却并不完全理解.针对神经网络可解释性的研究进行了梳理和汇总,就模型可解释性研究的定义、必要性、分类、评估等方面进行了详细的讨论.从解释算法的关注点出发,提出一种神经网络可解释算法的新型分类方法,为理解神经网络提供一个全新的视角.根据提出的新型分类方法对当前卷积神经网络的可解释方法进行梳理,并对不同类别解释算法的特点进行分析和比较.同时,介绍了常见可解释算法的评估原则和评估方法.对可解释神经网络的研究方向与应用进行概述.就可解释神经网络面临的挑战进行阐述,并针对这些挑战给出可能的解决方向.  相似文献   

13.
针对传统的光场深度估计算法精度低、计算慢的问题,提出了一种改进DenseNet的多输入流密集连接型卷积神经网络进行光场深度估计的方法。该方法采用的密集连接的结构,减少了模型的计算量。对输入图片进行预处理,转化为极平面图EPI Volume(Epipolar Plane Image)结构,采用随机灰度化等数据增强方法克服训练数据不足,通过神经网络将EPI特征转化为深度信息。在HCI 4D光场数据集上的对比实验结果表明,该方法在均方误差和不良像素率上都取得了良好结果,并且在执行时间上大幅领先于传统算法。  相似文献   

14.
随着卷积神经网络技术的发展,近来的研究越来越注重于准确率的提升以及语义信息的完善。其中Mask R-CNN网络是对Faster R-CNN进一步改进后的实例分割网络,在高分遥感图像地物识别具有良好的分割效果。但由于卷积神经网络只能用小瓦片图像进行训练和预测,而导致预测结果存在较大的语义信息误差。面对这种问题,提出了针对卷积神经网络预测结果缺陷的缝隙修复算法,即先使用Overlapsize算法改善预测结果与真实结果的匹配程度,再通过PostGIS数据库中的相关函数填补缝隙,使小瓦片能真正拼接成完整大图。研究及实验结果表明:该算法能够很好地改善图像语义信息,具有实用性。  相似文献   

15.
基于神经网络的方法计算量通常十分庞大,限制方法在嵌入式场景领域的应用.为了解决这一问题,文中提出基于异构现场可编程门阵列的卷积网络加速器.采用滑动窗并行加速卷积计算过程,可同时处理不同输入、输出通道的卷积过程.同时结合网络量化过程进行8 bit定点加速器设计,降低计算资源的使用.实验表明,文中定点加速器运算速度较快,功耗较小,算法性能损失较小.  相似文献   

16.
《软件工程师》2022,(1):6-9
为了提高乳腺癌病理图像良恶性诊断的准确率,提出了一个基于卷积神经网络(CNN)对乳腺癌病理图像的诊断方法。利用这种方法,能够快速地对乳腺癌病理图像自动进行良恶性诊断。乳腺癌病理图像具有非常复杂的结构,利用VGG16架构的卷积神经网络对病理图像进行特征提取,利用数据增强的方法扩充数据集,使用迁移学习,将在ImageNet数据集上训练得到的权重作为该网络的初始化参数,该模型在乳腺癌数据集Breakhis上得到的准确率可以达到95%,而在经过解冻部分训练层、调整学习率等优化操作之后,分类准确率最高可以达到99%。实验结果表明,优化后的方法在乳腺癌良恶性诊断准确率方面有很大的提高。  相似文献   

17.
基于卷积神经网络的发动机气路故障诊断方法   总被引:1,自引:0,他引:1       下载免费PDF全文
深度学习是一种新的基于特征表示的机器学习方法。深度学习模型包含多个隐藏层,可以通过对输入数据进行自动学习来获取隐藏的功能层中的特征信息。与传统的诊断方法相比,深度学习具备从原始信息中提取更丰富的特征的能力,因此已经成为基于机器学习的故障诊断研究的新方向,为发动机气路等复杂系统故障诊断带来了新思路。结合发动机气路试验数据的特点与深度学习的优势,提出基于卷积神经网络的故障诊断方法,包括预处理、模型训练及优化等过程,并实现了复杂系统故障诊断预测算法平台。经某发动机气路试验仿真数据实例验证,提出的方法具有较好的可行性和效果,能够充分利用深度学习的优点,更准确地识别发动机气路的健康状况。  相似文献   

18.
在FPGA数据处理应用场合中,引入神经网络能够提高数据特征的学习能力.但是基于非嵌入式的神经网络在运算过程中通常具有显著的复杂性和稀疏性,难以直接应用于FPGA上.于是,为了提高FPGA在数据处理时的并行性和高效性,设计了基于卷积网络加速器的FPGA数据处理架构.首先对卷积网络的层进行优化设计,采用ReLU函数来加速卷...  相似文献   

19.
从给定语音中提取有效语音段表示是语种识别的关键点。近年来深度学习在语种识别应用中有重要的进展,通过深度神经网络可以提取音素相关特征,并有效提升系统性能。基于深度学习的端对端语种识别系统也表现出其优异的识别性能。本文针对语种识别任务提出了基于卷积神经网络的端对端语种识别系统,利用神经网络强大的特征提取能力及区分性建模能力,提取具有语种区分性的基本单元,再通过池化层得到有效语音段表示,最后输入全连接层得到识别结果。实验表明,在NIST LRE 2009数据集上,相比于现阶段国际主流语种识别系统,提出的系统在30 s,10 s和3 s等语音段上错误率分别相对下降了1.35%,12.79%和29.84%,且平均错误代价在3种时长上均相对下降30%以上。  相似文献   

20.
近年来,计算机视觉领域随着深度学习的发展取得了长足进步,而该领域中卷积神经网络发挥了重要作用。计算机视觉领域的发展与物品识别检测、视频监控分析等息息相关,在日常生活和生产中具有重要作用。作为其最基本的算法之一,图像语义分割更是关键所在,只有保证图像语义分割,才能使后续算法正常执行分类或者识别命令。基于此,探讨了卷积神经网络在计算机视觉领域尤其是图像分割方面的应用,以提升图像分割算法的效率及效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号