首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
针对真实场景下采集的人脸图像受环境、设备影响导致分辨率低且图像识别率较低的问题,应用深度学习技术,提出一种基于卷积神经网络(CNN)和主成分分析(PCA)的低分辨率人脸识别算法.首先利用图像超分辨率重构将低分辨率图像重建为高分辨率图像;其次利用CNN提取重建后人脸图像特征,对损失函数进行优化;再利用PCA对特征进行降维,得到更优的分类特征;最后利用支持向量机(SVM)、向量间距离等算法筛选出最优人脸分类并计算准确率.实验表明,该算法在LFW和FERET上均取得更好的识别效果,当人脸图像分辨率下降到8×8时,准确率仍能到达94.5%,优于其他算法并且降低了运算时间.  相似文献   

2.
为了避免传统表情识别方法中复杂的特征手动提取过程,同时保证能够提取到更多的表情特征,文中提出一种融合卷积神经网络(Convolutional Neural Network,CNN)、方向梯度直方图(Histogram of Oriented Gradient,HOG)以及人脸关键点定位(facial landmark detection)的人脸表情识别方法.该方法首先通过在图像预处理中使用多任务卷积神经网络(Multi-task convolutional neural network,MTCNN)对不同尺度输入图像进行人脸检测并得到人脸的关键点位置信息(facial landmark).然后根据facial landmark的位置信息计算出人脸表情图像的几何结构特征,并且计算人脸表情图像局部区域的方向梯度直方图来构成HOG特征,采用特征融合的方式将facial landmark和HOG特征做进一步的融合形成新的特征向量LM_HOG.最后将融合后的特征与经过CNN提取的全局特征再次融合输入到支持向量机(Support Vector Machine,SVM)和Softmax中进行表情识别.在FER2013和Extended Cohn-Kanade(CK+)人脸表情库上的实验结果表明,将融合得到的LM_HOG特征作为局部特征,用以描述图像的局部性差异,CNN提取的特征作为全局特征,用以描述人脸表情图像的整体性差异,融合后的特征能更好的提取图像细节特征,平均识别率分别达到了75.14%和97.86%,具有优越的性能.  相似文献   

3.
传统的广告展示系统无法根据当前受众喜好推送相应的广告,为此提出了一种基于英伟达Jetson TX1视觉开发平台的智能广告展示系统.在没有人为决策的情况下,该系统能够对摄像头采集的周围人物信息进行分析,通过决策自行推送最适合当前受众的广告.采用Faster R-CNN对人脸进行识别分类,获取目标场景中的人数及人脸图像信息;通过多层卷积结构的CNN对人脸图像信息分别进行性别和年龄的识别;根据分类结果采用多层卷积结构的CNN进行分值计算,从而推送最适合当前受众的广告.实验结果表明:为了验证算法的有效性,基于Gstreamer和GTK+实现了相应的播放器,该智能广告展示系统较好地实现了广告的精准播放.  相似文献   

4.
采用现场可编程门电路(FPGA)和中央处理器相结合的异构计算技术,解决人脸检测和识别计算加速问题。基于并发和流水线的方法加速Viola-Jones人脸检测算法,提高了数据吞吐量,增加了级联分类器的并行度;通过并发卷积操作和流水线特征图加速了卷积神经网络计算过程。实验结果表明,硬件平台较软件平台实现了2.9倍的加速比。  相似文献   

5.
提出了一种改进的、适合硬件并行实现的Adaboost算法多层分类器协处理器架构.该协处理器由积分图数据快速读取模块、多层分类器Haar型特征值运算模块、DMA数据存取模块和协处理器接口模块组成,模块间采用流水线以及FIFO缓存实现数据并行处理,用于人脸检测SoC中加速人脸检测迭代过程.将该协处理器嵌入一个实际的人脸检测SoC中,只增加了SoC的少量面积,却明显提高了人脸检测的处理速度.人脸检测SoC在CYCLONE-ⅡEP2C70 FPGA上通过验证.实验结果显示,在系统工作频率为70MHz时,能以10帧每秒的处理速度检测彩色QVGA图像中的人脸.  相似文献   

6.
通过与传统神经网络对比,分析了利用卷积神经网络(CNN)进行车牌号图像识别中的特征提取过程,提出了优化卷积和池化的过程来提高算法的收敛速度和准确率。运用Py Charm环境建立了改进后的车牌号识别模型,并通过实验验证了其正确性与识别速度。通过BP神经网络、传统Le Net-5 CNN和改进后的CNN对相同的字符集进行对比分析实验,得出了改进后的CNN模型的优势。  相似文献   

7.
本文借助卷积的性质和傅氏变换的性质,导出了另一种形式的频域卷积定理,利用此定理中的特定点,可以解决一些广义积分问题。  相似文献   

8.
针对商用CPU的专用许可证授权费用高和卷积神经网络性能提升等问题,提出了一种基于多视图并行且具有可配置性的卷积神经网络加速器设计,同时结合RISC-V构建该加速器的片上系统。首先,扩展一组适用高速协加速器的控制访问接口和数据访问接口。其次,卷积神经网络各运算单元以多视图并行与结构复用实现。视图并行的不同组合将影响卷积单元硬件电路结构,因此多视图并行可通过复用基本运算结构来完成。池化单元由行池化和列池化子单元构成,且共享行池化的运算结构。对于全连接单元,采用调整全连接运算参数的方法来适应卷积单元的硬件结构,从而完成模型间的复用。然后,针对不同运算单元的硬件结构设计不同寄存器组,并结合开源RISC-V处理实现多种网络模型。最后,将卷积神经网络各运算单元分别部署在不同平台,计算运算时间、吞吐量和速度等。实验结果表明,提出方法的卷积加速比是CPU的189倍, VGG16的卷积运算吞吐量可达178GOP/s。因此,利用多视图并行能够达到加速效果,且以配置寄存器方式可实现不同网络模型。  相似文献   

9.
针对公共空间中人脸情绪识别准确率不高的问题,提出一种结合不同感受野和双流卷积神经网络的人脸情绪识别方法。首先建立基于公共空间视频的人脸表情数据集;然后设计一个双流卷积网络,以尺寸为224×224的单帧人脸图像输入卷积神经网络(convolution neural network,CNN),分析图像纹理静态特征;以尺寸为336×336视频序列输入CNN网络,再将提取的特征送入长短期记忆网络(long short term memory network,LSTM)分析局部、全局运动特征;最后通过Softmax分类器将两通道网络的描述子进行加权融合,得到分类结果。结果表明,本文方法能有效利用不同感受野的信息特征清晰识别公共空间的4种典型人脸情绪,识别准确率达88.89%。  相似文献   

10.
时间序列分类是流式数据事件分析和数据挖掘的基础.针对现有方法损失时间属性、分类准确率低、效率低等问题,提出基于Gram矩阵的T-CNN时间序列分类方法.该方法对时间序列进行小波阈值去噪,过滤正态曲线噪声,提出基于Gram矩阵的无损时间域图像转换方法,保留事件全部信息.改进时间序列CNN分类方法,在卷积层计算引入Toeplitz卷积核矩阵,实现矩阵乘积替换卷积运算.引入Triplet网络思想,构建T-CNN分类模型,通过计算同类事件与不同类事件间的相似度优化CNN的平方损失函数,提高T-CNN模型梯度下降的收敛速率及分类准确性.实验表明,相比现有方法,T-CNN时间序列分类方法能够提高35%的分类准确率、35%的分类精确率及40%的分类效率.  相似文献   

11.
With the rapid development and popularization of artificial intelligence technology, convolutional neural network(CNN) is applied in many fields, and begins to replace most traditional algorithms and gradually deploys to terminal devices. However, the huge data movement and computational complexity of CNN bring huge power consumption and performance challenges to the hardware, which hinders the application of CNN in embedded devices such as smartphones and smart cars. This paper implements a convolutional neural network accelerator based on Winograd convolution algorithm on field-programmable gate array (FPGA). Firstly, a convolution kernel decomposition method for Winograd convolution is proposed. The convolution kernel larger than 3×3 is divided into multiple 3×3 convolution kernels for convolution operation, and the unsynchronized long convolution operation is processed. Then, we design Winograd convolution array and use configurable multiplier to flexibly realize multiplication for data with different accuracy. Experimental results on VGG16 and AlexNet network show that our accelerator has the most energy efficient and 101 times that of the CPU, 5.8 times that of the GPU. At the same time, it has higher energy efficiency than other convolutional neural network accelerators.  相似文献   

12.
针对卷积神经网络(CNN)模型的压缩和加速问题,提出基于滤波器裁剪的新型卷积神经网络模型加速算法. 通过计算卷积层中滤波器的标准差值衡量该滤波器的重要程度,裁剪对神经网络准确率影响较小的滤波器及对应的特征图,可以有效地降低计算成本. 与裁剪权重不同,该算法不会导致网络稀疏连接,不需要应用特殊的稀疏矩阵计算库. 基于CIFAR-10数据集的实验结果表明,该滤波器裁剪算法能够对VGG-16和ResNet-110模型加速30%以上,通过微调继承的预训练参数可以使结果接近或达到原始模型的精度.  相似文献   

13.
一维卷积神经网络实时抗噪故障诊断算法   总被引:3,自引:0,他引:3  
针对旋转机械智能诊断方法计算量大和抗噪能力差的问题,在经典模型LeNet-5的基础上提出基于一维卷积神经网络的故障诊断算法.采用全局平均池化层代替传统卷积神经网络中的全连接层,在降低模型计算量的同时,降低模型参数数量和过拟合的风险;利用随机破坏后的时域信号进行训练以提高其抗噪能力;采用改进后的一维卷积核和池化核直接作用于原始时域信号,将特征提取和故障分类合二为一,通过交替的卷积层和池化层实现原始信号自适应特征提取,结合全局平均池化层完成故障分类.利用轴承数据和齿轮数据进行实验验证并对比经典模型LeNet-5、BP神经网络和SVM.结果表明:采用全局平均池化层可有效降低模型计算量,提高模型在低信噪比条件下的诊断精度,采用随机破坏输入训练策略可显著提升模型的抗噪诊断能力;改进后的模型可以实现噪声环境下准确、快速和稳定的故障诊断.通过t-SNE可视化分析说明了模型在特征学习上的有效性.  相似文献   

14.
提出了一种应用于跨年龄人脸识别的联合学习方法,该方法由深度卷积神经网络构建而成,能在特征学习的同时学习到最优的测度函数,从而避免不合适的固定阈值所带来的匹配错误.针对有限的内存、过拟合和计算复杂性高的问题,在模型训练过程中采用了多种新颖和有效的训练策略.实验证实了该联合学习方法的有效性,在公开数据库MORPH-II上的识别正确率达到了93.6%.  相似文献   

15.
针对典型卷积神经网络卷积核由经验设置且网络结构固定不变难以后期再学习的问题,基于稀疏自编码器(Sparse Autoencoder, SAE)和卷积神经网络(Convoutional Neural Network, CNN),提出新的CNN模型。该模型通过SAE预训练CNN网络的卷积核,提取有效特征;并在典型CNN结构基础上增加一条网络支路,使得后续再学习时只更新支路权值,记忆已有特征并增加新特征。文中模型在MNIST数据集上迭代更新10次网络权值可以使测试识别率达到97.65%;在手写汉字数据集HCL2000中的简单字,中等字,复杂字及相似字上的测试正确率能达93%以上;50个训练样本,250个测试样本时,相似字识别率可达80.36%;比典型CNN及传统手写汉字识别方法更具泛化性。实验表明所提出方法可有效应用于手写字等图像识别应用中。  相似文献   

16.
针对短文本数据特征少、提供信息有限,以及传统卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)对短文本特征表示不充分的问题,提出基于串并行卷积门阀循环神经网络的文本分类模型,处理句子特征表示与短文本分类。该网络在卷积层中去除池化操作,保留文本数据的时序结构和位置信息,以串并行的卷积结构提取词语的多元特征组合,并提取局部上下文信息作为RNN的输入;以门阀循环单元(gated recurrent unit,GRU)作为RNN的组成结构,利用文本的时序信息生成句子的向量表示,输入带有附加边缘距离的分类器中,引导网络学习出具有区分性的特征,实现短文本的分类。实验中采用TREC、MR、Subj短文本分类数据集进行测试,对网络超参数选择和卷积层结构对分类准确率的影响进行仿真分析,并与常见的文本分类模型进行了对比实验。实验结果表明:去掉池化操作、采用较小的卷积核进行串并行卷积,能够提升文本数据在多元特征表示下的分类准确率。相较于相同参数规模的GRU模型,所提出模型的分类准确率在3个数据集中分别提升了2.00%、1.23%、1.08%;相较于相同参数规模的CNN模型,所提出模型的分类准确率在3个数据集中分别提升了1.60%、1.57%、0.80%。与Text-CNN、G-Dropout、F-Dropout等常见模型相比,所提出模型的分类准确率也保持最优。因此,实验表明所提出模型可改善分类准确率,可实际应用于短文本分类场景。  相似文献   

17.
基于支持向量机(SVM)的卷积神经网络(CNN)模型结合了大间隔原理,在图像识别中表现出了优异的泛化性能。然而,该方法忽视了一个关键:SVM的泛化性能不仅取决于不同类之间的间隔,还与所有样本的最小包含球(MEB)的半径有关。针对这一事实,文章提出一种基于半径间隔界(RMB)驱动的CNN模型的图像特征提取和识别的方法。与传统CNN模型相比,该模型采用基于SVM泛化误差界的策略来指导CNN深度模型学习和相应分类器构建,不仅考虑了不同类别之间的间隔,还考虑了MEB的半径。该模型能提高深度卷积模型的泛化能力而不会额外增加网络的复杂度,还能够应用于不同的深度模型中而不受限于某一特定的网络结构。在多个数据集上的实验结果表明,相比于基于Sofmax损失的CNN模型、基于中心损失的CNN模型以及基于 SVM 的 CNN 模型,该模型能够提取到鉴别性更强的图像特征,取得更高的识别率。  相似文献   

18.
地震信号的随机噪声压制是地震信号处理中的重要问题.卷积神经网络(Convolutional Neural Network,CNN)近两年在地震信号去噪领域展现其巨大的潜力.该方法可以突破先验约束,从大量的数据中学习噪声模式,可以高效智能地实现地震数据去噪.为了进一步提高去噪效果,本文提出基于双重残差结构的CNN网络地震...  相似文献   

19.
为了检测输气管道阀门泄漏,对改进AlexNet网络结构进行了研究,提出了基于改进卷积神经网络(CNN)的阀门泄漏超声信号识别方法.针对泄漏信号短时稳定的窄带线谱特征,从图像邻域信息密度角度出发,将卷积核形状由图像识别领域通常使用的"正方形"改进为"扁横状".同时,对AlexNet层数进行优化,重新确定卷积核和全连接层神经元数目,并选择小尺寸卷积核,在减少参数量的同时增加网络容量和模型复杂度,防止模型出现过拟合.分别建立二分类和不同泄漏量下的多分类模型,通过输气管道实验平台采集阀门泄漏数据集,生成对应时频图样本,包括不同阀门开度、不同管道压力下的泄漏及背景声信号.结果表明,对比传统的CNN分类模型,改进CNN分类模型在测试集上取得了更高的识别性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号