首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 968 毫秒

1.  基于深度学习监控场景下的多尺度目标检测算法研究  
   程显毅  胡海涛  季国华  孙丽丽《南京师范大学学报》,2018年第3期
   针对监控环境下的视频图像处理存在漏检这一问题,分析现有目标检测算法中普遍使用的深度学习方法—Faster R-CNN,在VGG16卷积神经网络基础上,对深度卷积神经网络进行改进,在第一层卷积层中加入空洞卷积核,扩展神经网络的宽度,使得目标检测模型具有尺度不变性.在深度学习平台PyTorch下对Cifar-10数据集进行了实验,实验结果显示,改进的目标检测算法具有较好的尺度不变性,在监控场景下更具优势.    

2.  基于Faster R-CNN的手势识别算法  
   吴晓凤  张江鑫  徐欣晨《计算机辅助设计与图形学学报》,2018年第3期
   针对传统手势识别算法准确率不高、鲁棒性不强的问题,基于卷积神经网络提出基于Faster R-CNN的手势识别算法.首先修改Faster R-CNN框架的关键参数,达到同时检测和识别手势的目的;然后提出扰动交叠率算法,避免训练模型的过拟合问题,进一步提高识别准确率.在公共数据集NTU和VIVA上进行手势识别实验的结果表明,该算法有效地避免了训练模型的过拟合问题,比传统算法具有更高的识别准确率和更强的鲁棒性.    

3.  基于孪生卷积神经网络与三元组损失函数的图像识别模型  
   张安琪《电子制作.电脑维护与应用》,2018年第21期
   深度学习作为近年来迅速发展的全新领域,在科学研究与工业生产等方面受到了广泛的关注。其中,卷积神经网络(Convolutional neutral networks, CNN)作为深度学习中一种经典的神经网络架构,已在图像分类、人脸识别以及信号处理等领域得到了广泛的应用。在此基础上,本文对传统CNN结构进行改进,取消了CNN输出层用于普通分类的Softmax函数,采用基于孪生神经网络(Siamese neutral networks)的CNN架构,并使用三元组损失(Triplet Loss)作为图像分类的目标损失函数。为检验模型效果,我们在国际数据建模和数据分析竞赛平台Kaggle的座头鲸图像识别挑战赛上运用该模型。    

4.  基于深度学习的目标检测算法综述  
   周晓彦  王珂  李凌燕《电子测量技术》,2017年第11期
   传统的目标检测算法及策略已经难以满足目标检测中数据处理的效率、性能、速度和智能化等各个方面要求.深度学习通过对大脑认知能力的研究和模仿以实现对数据特征的分析处理,具有强大的视觉目标检测能力,成为了当前目标检测的主流算法.首先回顾了传统目标检测的发展以及存在的问题;其次介绍以R-CNN为代表的结合region proposal和卷积神经网络(CNN)分类的目标检测框架(R-CNN、SPP-NET、Fast R-CNN、Faster R-CNN);然后介绍以YOLO算法为代表的将目标检测转换为回归问题的目标检测框架(YOLO、SSD);最后对深度学习的目标检测算法存在的问题做出总结,以及未来的发展方向.    

5.  基于Fast R-CNN的车辆目标检测  
   曹诗雨  刘跃虎  李辛昭《中国图象图形学报》,2017年第22卷第5期
   目的 在传统车辆目标检测问题中,需要针对不同图像场景选择适合的特征。为此提出一种基于快速区域卷积神经网络(Fast R-CNN)的场景图像车辆目标发现方法,避免传统车辆目标检测问题中需要设计手工特征的问题。方法 该方法基于深度学习卷积神经网络思想。首先使用待检测车辆图像定义视觉任务。利用选择性搜索算法获得样本图像的候选区域,将候选区域坐标与视觉任务示例图像一起输入网络学习。示例图像经过深度卷积神经网络中的卷积层,池化层计算,最终得到深度卷积特征。在输入时没有规定示例图像的规格,此时得到的卷积特征规格不定。然后,基于Fast R-CNN网络结构,通过感兴趣区域池化层规格化特征,最后将特征输入不同的全连接分支,并行回归计算特征分类,以及检测框坐标值。经过多次迭代训练,最后得到与指定视觉任务强相关的目标检测模型,具有训练好的权重参数。在新的场景图像中,可以通过该目标检测模型检测给定类型的车辆目标。结果 首先确定视觉任务包含公交车,小汽车两类,背景场景是城市道路。利用与视觉任务强相关的测试样本集对目标检测模型进行测试,实验表明,当测试样本场景与视觉任务相关度越高,且样本中车辆目标的形变越小,得到的车辆目标检测模型对车辆目标检测具有良好的检测效果。结论 本文提出的车辆目标检测方法,利用卷积神经网络提取卷积特征代替传统手工特征提取过程,通过Fast R-CNN对由示例图像组成定义的视觉任务训练得到了效果良好的车辆目标检测模型。该模型可以对与视觉任务强相关新场景图像进行效果良好的车辆目标检测。本文结合深度学习卷积神经网络思想,利用卷积特征替代传统手工特征,避免了传统检测问题中特征选择问题。深层卷积特征具有更好的表达能力。基于Fast R-CNN网络,最终通过多次迭代训练得到车辆检测模型。该检测模型对本文规定的视觉任务有良好的检测效果。本文为解决车辆目标检测问题提供了更加泛化和简洁的解决思路。    

6.  基于跨连卷积神经网络的性别分类模型  
   张婷  李玉鑑  胡海鹤  张亚红《自动化学报》,2016年第42卷第6期
   为提高性别分类准确率, 在传统卷积神经网络(Convolutional neural network, CNN)的基础上, 提出一个跨连卷积神经网络(Cross-connected CNN, CCNN)模型. 该模型是一个9层的网络结构, 包含输入层、6个由卷积层和池化层交错构成的隐含层、全连接层和输出层, 其中允许第2个池化层跨过两个层直接与全连接层相连接. 在10个人脸数据集上的性别分类实验结果表明, 跨连卷积网络的准确率均不低于传统卷积网络.    

7.  基于CNN深度学习模型的交通图像拥堵识别  
   崔华  刘云飞  宋鑫鑫  李盼侬《科技创新与应用》,2018年第4期
   卷积神经网络(CNN)在诸多图像分类(如数字识别,人脸识别)方面都被证明有着非常出色的表现,复杂图像的分类识别需要经过多个层次的信息特征认识整合以及加工。另一方面对交通状态进行准确识别,是科学制定主动交通管理决策的基础,有利于及时疏导拥堵,提高道路运行效率。文章在Tensor Flow上使用了基于CNN的分类模型对图片进行交通拥堵识别,其是在国际大赛上较为出名的Cifar-10模型,并对网络结构和参数进行了调整优化,有较高的准确率和效率。    

8.  基于多分类器协同学习的卷积神经网络训练算法  
   陈文  张恩阳  赵勇《计算机科学》,2016年第43卷第9期
   卷积神经网络(CNN)是一类重要的深度神经网络,然而其训练过程需要大量的已标记样本,从而限制了其实际应用。针对这一问题,分析了CNN分类器的协同学习过程,给出了基于迭代进化的分类器协同训练算法CAMC。该算法结合了CNN和多分类器协同训练的优势,首先采用不同的卷积核提取出多种样本特征以产生不同的CNN分类器;然后利用少量的已标记样本和大量的未标记样本对多个分类器进行协同训练,以持续提高分类性能。在人脸表情标准数据集上的实验结果表明,相对于传统的表情特征识别法LBP和Gabor,CAMC能够在分类过程中利用未标记样本持续实现性能提升,从而具有更高的分类准确率。    

9.  基于非监督预训练的结构优化卷积神经网络  
   刘庆  唐贤伦  张娜《四川大学学报(工程科学版)》,2017年第49卷第Z2期
   针对典型卷积神经网络卷积核由经验设置且网络结构固定不变难以后期再学习的问题,基于稀疏自编码器(Sparse Autoencoder, SAE)和卷积神经网络(Convoutional Neural Network, CNN),提出新的CNN模型。该模型通过SAE预训练CNN网络的卷积核,提取有效特征;并在典型CNN结构基础上增加一条网络支路,使得后续再学习时只更新支路权值,记忆已有特征并增加新特征。文中模型在MNIST数据集上迭代更新10次网络权值可以使测试识别率达到97.65%;在手写汉字数据集HCL2000中的简单字,中等字,复杂字及相似字上的测试正确率能达93%以上;50个训练样本,250个测试样本时,相似字识别率可达80.36%;比典型CNN及传统手写汉字识别方法更具泛化性。实验表明所提出方法可有效应用于手写字等图像识别应用中。    

10.  SR-CNN融合决策的眼部状态识别方法  
   黄斌  陈仁文  周秦邦  唐杰《哈尔滨工程大学学报》,2018年第7期
   为了研究人眼状态识别对人眼定位的依赖性和实际使用中分类模型泛化能力不佳的问题,本文提出了一种基于选择性区域的卷积神经网络的融合决策的眼部状态识别方法。该方法用SR方法预处理wild人脸数据集,扩大了训练集的规模并引入了对眼部的先验知识,在此基础上训练卷积神经网络的分类模型进行眼部状态识别的评估。对比实验结果可知,基于SR-CNN融合决策的眼部状态识别方法测试的准确度能达到95%左右,显著降低了测试错误率,提高了模型的泛化能力和准确性。    

11.  基于捷径的卷积神经网络在人脸识别中的应用研究  
   王飞  张莹  张东波  邵豪  成超鹏《电子测量与仪器学报》,2018年第4期
   人脸识别的特征要求具有区分性和识别性,传统的卷积神经网络(CNN)无法将低层次特征与高层次特征进行融合,识别准确率难以进一步提高。提出了一种基于附加惩罚函数和捷径连接的卷积神经网络模型,算法通过将第一层的卷积特征与原有网络模型最后一层的全连接层直接连接,增加了深层次特征的识别能力,减少了浅层主要特征的损失;为了提高已学习到的深度特征的识别能力,算法在原有的softmax损失函数项添加一个惩罚项,使已学习到的同类特征到该类特征中心之间的距离最小化。在CASIA-web、Facescrub数据集上的实验结果表明,改进算法分类准确率优于深度卷积神经网络(DCNN)、GRCC等算法。    

12.  结合语义信息的行人检测方法  
   刘丹  马同伟《电子测量与仪器学报》,2019年第1期
   随着卷积神经网络(CNN)的提出,行人检测方法的正确率已经得到了很大提升,尽管CNN模型可以学习到目标的不同变化,然而自动驾驶场景下的行人检测依然面临着巨大挑战,主要表现为广泛的尺度变化、光照变化以及不同程度的遮挡。在已有CNN网络的基础上,提出一种更为鲁棒的行人检测方法,其主要思想是在原有检测器的基础上利用像素级的语义信息作为额外的监督来训练CNN。该算法首先提取CNN不同尺度的特征图,在这些特征图上铺设不同大小的目标候选框,添加一层卷积层对这些目标候选框进行分类和回归,同时利用这些特征图生成语义分割图,最终分为两路分别监督目标检测结果和语义分割结果。在最新的行人检测数据集City Persons上的结果表明,结合语义信息可以提升算法的检测成功率,并且不增加算法耗时,在数据集中1 024×2 048 pixels的图像上平均检测耗时仅为0. 3 s一张图像。    

13.  短文本分类的ResLCNN模型  
   王俊丽  杨亚星  王小敏《软件学报》,2017年第28卷第S2期
   短文本分类是互联网文本数据处理中的关键任务之一.长短时记忆网络LSTM(long short-term memory)和卷积神经网络CNN(convolutional neural network)是广泛应用于短文本分类任务的两种深度学习模型.在计算机视觉和语音识别领域的深度学习研究表明,深层次的神经网络模型具有较好的表达数据特征的能力.受此启发,面向文本深度学习分类问题,提出基于3层LSTM和CNN网络结构的ResLCNN(residual-LSTM-CNN)深度学习模型.该模型有效结合LSTM获取文本序列数据的长距离依赖特征和CNN通过卷积操作获取句子局部特征的优势,同时借鉴残差模型理论,在第1层LSTM层与CNN层之间加入恒等映射,构建残差层,缓解深层模型梯度消失问题.为了探究深层短文本分类中ResLCNN模型的文本分类能力,在多种数据集上将其与LSTM、CNN及其组合模型进行对比实验.结果表明,相比于单层LSTM与CNN组合模型,ResLCNN深层模型在MR、SST-2和SST-5数据集上分别提高了1.0%、0.5%、0.47%的准确率,取得了更好的分类效果.    

14.  基于卷积记忆神经网络的微博短文本情感分析  
   郑啸  王义真  袁志祥  秦锋《电子测量与仪器学报》,2018年第3期
   微博短文本情感分析的目的是发现用户对热点事件的观点及态度。已有的方法大多是基于词袋模型,然而,词袋模型无法准确捕获带有情感倾向性的语言表现特征。结合卷积神经网络(CNN)和长短期记忆网络(LSTM)模型的特点,提出了卷积记忆神经网络模型(CMNN),并基于此模型来解决情感分析问题。与传统算法相比,模型避免了具体任务的特征工程设计;与CNN和LSTM相比,模型既能够有效提取短文本局部最优特征,又能够解决远距离的上下文依赖。通过在COAE2014数据集上的实验来验证了模型对微博短文本情感分析的有效性。并与CNN、LSTM以及传统模型SVM做了实验对比,结果表明,模型对于微博短文本情感分析在性能上优于其他3种模型。    

15.  一种基于前向无监督卷积神经网络的人脸表示学习方法  
   朱陶  任海军  洪卫军《计算机科学》,2016年第43卷第6期
   当前基于深度卷积神经网络的人脸表示学习方法需要利用海量的有标注的人脸数据。在实际应用中,精确标注人脸的身份非常困难。因此,提出了一种基于前向无监督卷积神经网络的人脸表示学习方法。其中,基于K-means聚类获取训练样本虚拟标签,再利用线性判别分析进行卷积核学习。提出的网络结构简单有效,训练阶段不需要反向传递,训练速度显著优于有监督的深度卷积神经网络。实验结果表明,提出的方法在真实条件下的人脸数据集LFW和经典的Feret数据集上取得了优于当前主流的无监督特征学习方法和局部特征描述子的性能。    

16.  基于卷积神经网络的监控场景下车辆颜色识别  
   张强  李嘉锋  卓力《测控技术》,2017年第36卷第10期
   颜色是车辆识别中广泛应用的主要线索之一,在智能交通系统中扮演着重要的角色.受光照变化、噪声、环境等复杂因素的影响,传统的车辆颜色识别方法难以取得理想的识别效果.利用卷积神经网络(CNN)的优越识别性能,提出了一种基于卷积神经网络的监控场景下车辆颜色识别方法.基于传统的CNN原理设计了车色识别专用深度网络架构,直接通过CNN学习基于颜色分布的分类模型.与其他基于深度学习的车色识别方法相比,提出的用于车色识别的专用深度网络,具有参数少、识别速度快、识别精度高等优点.实验结果表明,在Chen等公布的标准数据集上,与最新的研究成果相比,平均识别精度提高约0.77%,识别速度提高14倍左右.    

17.  高分辨卫星图像卷积神经网络分类模型  
   周明非  汪西莉  王磊  陈粉《中国图象图形学报》,2017年第22卷第7期
   目的 卫星图像往往目标、背景复杂而且带有噪声,因此使用人工选取的特征进行卫星图像的分类就变得十分困难。提出一种新的使用卷积神经网络进行卫星图像分类的方案。使用卷积神经网络可以提取卫星图像的高层特征,进而提高卫星图像分类的识别率。方法 首先,提出一个包含六类图像的新的卫星图像数据集来解决卷积神经网络的有标签训练样本不足的问题。其次,使用了一种直接训练卷积神经网络模型和3种预训练卷积神经网络模型来进行卫星图像分类。直接训练模型直接在文章提出的数据集上进行训练,预训练模型先在ILSVRC(the ImageNet large scale visual recognition challenge)-2012数据集上进行预训练,然后在提出的卫星图像数据集上进行微调训练。完成微调的模型用于卫星图像分类。结果 提出的微调预训练卷积神经网络深层模型具有最高的分类正确率。在提出的数据集上,深层卷积神经网络模型达到了99.50%的识别率。在数据集UC Merced Land Use上,深层卷积神经网络模型达到了96.44%的识别率。结论 本文提出的数据集具有一般性和代表性,使用的深层卷积神经网络模型具有很强的特征提取能力和分类能力,且是一种端到端的分类模型,不需要堆叠其他模型或分类器。在高分辨卫星图像的分类上,本文模型和对比模型相比取得了更有说服力的结果。    

18.  基于集成卷积神经网络的人脸年龄分类算法研究  
   马文娟  董红斌《计算机科学》,2018年第45卷第1期
   人脸年龄估计由于在人机交互和安全控制等领域有潜在应用,因此得到了广泛关注。文中主要进行人脸年龄分组的研究,针对人脸年龄分类问题提出了一种基于集成卷积神经网络的年龄分类算法。首先,训练两个以人脸图像为输入的卷积神经网络,当用卷积神经网络直接提取人脸图像的特征时,主要对 深度的全局特征 进行提取。为了补充人脸图像的局部特征,尤其是纹理信息,将提取的LBP(Local Binary Pattern)特征作为另一个网络的输入。最后,为了结合人脸的全局特征和局部特征,将这3个网络进行集成。该算法在广泛使用的年龄分类数据集Group上取得了不错的效果。    

19.  基于CNN的监控视频事件检测  
   王梦来  李想  陈奇  李澜博  赵衍运《自动化学报》,2016年第42卷第6期
   复杂监控视频中事件检测是一个具有挑战性的难题, 而TRECVID-SED评测使用的数据集取自机场的实际监控视频,以高难度著称. 针对TRECVID-SED评测集, 提出了一种基于卷积神经网络(Convolutional neural network, CNN)级联网络和轨迹分析的监控视频事件检测综合方案. 在该方案中, 引入级联CNN网络在拥挤场景中准确地检测行人, 为跟踪行人奠定了基础; 采用CNN网络检测具有关键姿态的个体事件, 引入轨迹分析方法检测群体事件. 该方案在国际评测中取得了很好的评测排名: 在6个事件检测的评测中, 3个事件检测排名第一.    

20.  图像分类卷积神经网络的特征选择模型压缩方法  
   邹月娴  余嘉胜  陈泽晗  陈锦  王毅《控制理论与应用》,2017年第34卷第6期
   深度卷积神经网络(convolutional neural networks, CNN)作为特征提取器(feature extractor, CNN--FE)已被广泛应用于许多领域并获得显著成功. 根据研究评测可知CNN--FE具有大量参数, 这大大限制了CNN--FE在如智能手机这样的内存有限的设备上的应用. 本文以AlexNet卷积神经网络特征提取器为研究对象, 面向图像分类问题, 在保持图像分类性能几乎不变的情况下减少CNN--FE模型参数量. 通过对AlexNet各层参数分布的详细分析, 作者发现其全连接层包含了大约99%的模型参数, 在图像分类类别较少的情况, AlexNet提取的特征存在冗余. 因此, 将CNN--FE模型压缩问题转化为深度特征选择问题, 联合考虑分类准确率和压缩率, 本文提出了一种新的基于互信息量的特征选择方法, 实现CNN--FE模型压缩. 在公开场景分类数据库以及自建的无线胶囊内窥镜(wireless capsule endoscope, WCE)气泡图片数据库上进行图像分类实验. 结果表明本文提出的CNN--FE模型压缩方法减少了约83%的AlexNet模型参数且其分类准确率几乎保持不变.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号