首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对进一步提高人脸表情识别率的问题,采用了一种基于深度学习的堆栈式混合自编码器(Stacked Hybrid Auto-Encoder,SHAE)的人脸表情识别方法。该方法的结构是由去噪自编码器(Denoising Auto-Encoder,DAE)、稀疏自编码器(Sparse Auto-Encoder,SAE)以及自编码器(Auto-Encoder,AE)组合而成的5层网络结构。为了增加网络的鲁棒性以及泛化能力,采用去噪自编码器对样本进行提取特征,为了对提取的特征进行降维以及进一步提取更抽象的稀疏特征,采用稀疏自编码器进行级联,来对特征进一步处理。训练过程首先由无标签的数据进行预训练和整体微调,对整个结构的权重进行初始化和更新调整,然后使用有标签的数据进行测试训练。在JAFFE和CK+两个数据集上实验显示,相较于单纯的堆栈式去噪自编码或者单纯的堆栈式稀疏自编码,该方法具有更好的识别效果。  相似文献   

2.
针对传统人脸表情识别算法鲁棒性差,易受到人脸身份信息干扰的问题,本文在基于降噪自编码器的基础上,提出一种人脸表情识别算法。首先,从图片中检测出人脸部分,并进行尺度归一化处理;再构造堆栈式降噪自编码神经网络模型进行预训练;最后为了避免由训练样本不足容易造成的过拟合问题,在深度网络模型的全连接层采用了Dropout技术。实验结果在数据集CK 、JAFFE和Yale上均取得了较高的准确率,说明了该方法具有较强的鲁棒性和抗身份信息干扰的能力。  相似文献   

3.
人脸表情识别作为人机交互系统的重要组成部分,在安防监控、人机交互等领域有广泛的应用,是计算机视觉的研究热点。传统的卷积神经网络方法一般提取单张人脸图像或者人脸标记点作为特征提取的输入数据,未能考虑到人脸全域的表情信息。提出了一种基于三通道多信息融合的深度学习人脸表情识别模型,以人脸图像表情平静到高峰时期标记点坐标的相对位移为输入,提取整个人脸表情图像特征信息,模型融合了稀疏自编码器以提高对边缘特征提取效率。该模型在CK+数据集上进行了训练和测试,实验结果表明,与该领域中的同类算法相比,该算法模型提高了表情识别的准确率。  相似文献   

4.
针对物联网环境下数据量大且人脸表情识别率低的问题,提出基于边缘云框架的高效安全人脸表情识别方法.物联网设备通过多秘密共享技术获取用户信息,并分发到不同的边缘云.边缘云利用语谱图和局部二值模式的方法提取语音特征,采用差值中心对称局部二值模式获得图像特征,将特征送至核心云.基于栈式稀疏去噪自编码器融合语音和图像特征,实现人脸表情的识别,并在RML和eNTERFACE'05数据库上进行实验.实验结果表明,该方法的识别准确率明显高于对比方法,抵御网络攻击的能力较强.  相似文献   

5.
针对采煤机监测参数间关联性强、冗余信息多且受强噪声干扰导致其健康状态识别困难及传统的采煤机状态识别方法在健康状态指标构建中人工参与过多导致识别准确率不高的问题,提出一种基于降噪自编码器(denoising autoencoder,DAE)与改进卷积神经网络(improved convolutional neural network,ICNN)的采煤机健康状态识别方法。首先,对原始监测数据作滑动平均降噪处理并进行归一化;其次,通过无监督训练降噪自编码器实现数据降维、特征提取,进而构建健康状态指标;然后,根据降噪后的监测数据与健康状态指标训练改进卷积神经网络模型,实现采煤机健康状态的自动识别;最后,利用采煤机仿真数据完成模型验证并与其他多种健康状态识别方法进行对比。结果表明:该方法识别准确率达98.38%,明显高于其他方法,可为后期的预知维护提供理论支持。  相似文献   

6.
传统的人脸表情识别方法主要针对六类基本人脸表情,但在现实场景下,存在更加丰富的由基本人脸表情组合而成的复合人脸表情,原先识别基本人脸表情的工作难以去识别复合人脸表情,并且复合人脸表情的数据集缺乏足够的训练数据.针对该问题,提出基于图卷积多标签学习的复合人脸表情识别方法.通过特征提取网络提取到人脸表情的全局特征和感兴趣区...  相似文献   

7.
单样本人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。单张训练样本条件下训练样本的缺少和复杂的类内人脸表情、光照、遮挡变化给单样本人脸识别研究带来困难。传统的基于稀疏表示的人脸识别方法需要大量的训练样本构成过完备的字典,因而在单样本条件下识别效果明显下滑。针对这一问题,提出一种基于有监督自编码器的带变化人脸样本生成方法,在保留身份信息的同时自动生成带变化的人脸图像用于单样本条件下的字典扩充,一定程度上缓解了单样本条件下的欠采样问题,弥补了训练集和测试集间的人脸变化信息差异,使得传统的稀疏表示方法能够适用于单样本人脸识别问题。在公共数据库上的实验结果不仅证明了该方法的有效性,而且对测试集中不同的人脸变化也展现出了较强的鲁棒性。  相似文献   

8.
针对现有的在人脸表情识别中应用的卷积神经网络结构不够轻量,难以精确提取人脸表情特征,且需要大量表情标记数据等问题,提出一种基于注意力机制的人脸表情识别迁移学习方法.设计一个轻量的网络结构,在其基础上进行特征分组并建立空间增强注意力机制,突出表情特征重点区域,利用迁移学习在目标函数中构造一个基于log-Euclidean距离的损失项来减小迁移学习中源域与目标域之间的相关性差异.在数据集JAFFE和CK+上的实验结果表明,该方法相比其它人脸表情识别方法具有更优的识别能力.  相似文献   

9.
针对基于深度学习干扰识别方法在小样本集情况下性能恶化问题,提出一种基于辅助分类器和变分自编码生成对抗网络(AC-VAEGAN)的干扰识别方法。利用生成对抗网络和变分自编码器的核心思想设计识别模型,得到连续有意义的干扰样本集潜在空间;确定编码器、生成器和鉴别器的损失函数,且鉴别器采用动态学习率的优化算法,使得模型训练过程更加有效且稳定。仿真结果表明,在干扰时频图小样本数据集情况下,当干噪比为-10 dB~10 dB时,该方法对宽带噪声干扰、部分频带噪声干扰、单音干扰、多音干扰、脉冲干扰、跳频干扰、线性扫频干扰和二次扫频干扰这八种干扰的正确识别率均高于ACGAN和CNN。  相似文献   

10.
图像数据解压缩问题是一类重要的数据处理问题,数据特征学习在数据压缩研究中有重要的研究价值。提出了一种基于云模型的变分自编码器特征表征模型,将云模型作为变分自编码器的先验分布,解决变分自编码器在特征表征上的局限性。变分自编码器的编码器部分负责构建数据的特征空间,通过在该空间中采样获得隐变量,完成数据压缩;解码器部分完成从数据特征到原数据的生成,即数据的解压。在人脸数据集上与原方法作实验对比,验证了该方法的正确性和有效性。  相似文献   

11.
生活中似是而非的手语表达语义含糊,欠规范的手势动作易混淆,同时从有限样本中难以获得充足特征用于训练手语识别模型,模型容易过拟合进而导致识别准确率较低.针对此问题,提出一种在有限样本条件下扩充欠规范手语识别容错特征的表示学习方法.该方法基于手语表达时人体骨架的运动信息,面向手语的时空关联性构建自编码器,从手语语料库中少量...  相似文献   

12.
基于嵌入式HMM的脸部表情识别   总被引:1,自引:0,他引:1  
提出了一种基于嵌入式EHMM的表情识别方法。通过分析人脸表情的变化情况,利用DCT提取脸部表情特征构成特征向量,构建嵌入式HMM来识别静态图像中的人脸表情,并在单层嵌入式HMM的基础上提出了更利于区分易混淆表情的双层嵌入式HMM结构。实验表明该方法能有效地识别6种基本表情。  相似文献   

13.
面部表情识别已经广泛运用于人机交互、教育、自动驾驶等各种领域,针对现有表情识别方法网络结构复杂、参数多、泛化能力不足、识别率低等问题,且人脸表情在自然环境下易受到光照、姿态和局部遮挡等环境因素的影响,提出了一种多尺度残差注意力网络.以ResNet-18网络为基础,提出了一种新的多尺度残差注意力模块,通过提取不同尺度特征,增加特征多样性.引入CBAM注意力机制获取表情图像重点特征信息,有利于提升遮挡表情的识别.构建特征残差融合块,将浅层特征与深层特征进行残差融合,有利于获取丰富的人脸表情图像整体特征.实验结果表明,本文方法在CK+、JAFFE和Oulu-CASIA 3个公开表情数据集上分别达到了99.49%、98.53%和97.08%的准确率,与一些现有方法相比,本文方法表情识别率更高,证明了该方法可用于人脸表情识别.  相似文献   

14.
王潇 《信息与电脑》2023,(21):148-150
常规人脸面部情感识别方法不准确,存在识别后的情感反馈误差大的问题,为此提出基于更快的区域卷积神经网络(Faster Region-Convolutional Neural Network,Faster R-CNN)的人脸面部情感识别方法。首先,采集人脸图像数据,通过面部检测、面部对齐、面部数据增强、面部归一化4个步骤预处理面部图像;其次,基于多尺度特征融合算法提取表情特征,生成情感识别数据标签;最后,利用FasterR-CNN构建人脸面部情感识别模型,并识别人脸面部情感。实验结果表明,基于FasterR-CNN的人脸面部情感识别方法在6种基本表情中均具有90%以上的识别准确率。  相似文献   

15.
为了识别视频会议发言者语音,扩大语音识别精度,研究基于偏好转移矩阵与数据库的视频会议发言者语音识别方法。提取有价值的语音信息,结合矢量量化与规整网络,生成有价值语音的音节状态偏好转移矩阵,将数个训练后的稀疏自编码器叠加,构成自编码神经网络,逐层训练该网络后,输入至Softmax分类器中,完成会议发言者语音识别。实验结果表明,该方法应用后,在2层隐含层、500个神经元的神经网络结构下,识别率最高可达到96.55%,具有最佳的语音识别效果,且所识别语音与初始实验发言者语音几乎吻合,识别精度高,识别效果理想。提高视频会议通信质量,保障用户体验。  相似文献   

16.
人脸表情识别是人类情感识别的基础,是近年来模式识别与人工智能领域研究的热点问题。本文首先总结了人脸表情识别的发展过程,主要包括传统的表情特征提取、表情分类方法与基于深度学习的表情识别方法,并对各种算法的识别率与性能进行了分析与比较。然后介绍了表情识别常用的数据集及各数据集的优势与存在的问题,并针对这些问题归纳分析了生成对抗网络等用于数据增强的技术与方法。最后,总结了表情识别领域目前存在的问题并展望了未来可能的发展。  相似文献   

17.
针对传统的聚类算法无法捕获高维轨迹数据在低维空间中的隐含关系,且难以定义适当的相似性度量以同时考虑轨迹的局部和全局特征的问题,提出了一种基于深度神经网络的多变量轨迹深度聚类框架(MTDC)并将其用于航空交通流识别与异常检测。该框架主要包含一个非对称的自编码器和一个自定义的轨迹聚类层。自编码器由一维卷积神经网络和双向长短时记忆网络堆叠而成,用于学习原始输入在低维隐空间中的特征表示。轨迹聚类层则通过计算隐空间中样本的Q分布实现聚类。结合自编码器的重建损失和轨迹聚类Q分布定义了一个新的异常分数,用于检测异常轨迹。使用基于广播式自动相关监视(ADS-B)的真实轨迹数据进行实验,结果表明,所提框架能有效地进行航空交通流识别,并能检测出具有实际意义且可解释的异常轨迹。  相似文献   

18.
现有的大多数面部表情识别方法都是假定样本中每个人脸表情对应单一的情绪,而后作为分类问题进行解决。但是在实际情况中,一个人脸表情往往是多种不同基础情绪的混合体。因此,具有相似表情的样本在基础情绪层面存在一定的相关性,这种相关性也通常会导致样本的表情标签呈现多样性。也就是说,每个样本的表情状况与潜在的情绪标签分布相关联。为此,提出了一种通过数据进行自适应学习潜在标签分布的方法,不需要任何预先假设的标签分布形式,便可得到每个表情与其相应的多个情绪的关联情况。该方法可得到每个表情所包含情绪的特定描述度以及表情图像到情绪分布的映射。实验结果表明,该方法在表情识别上具有较高准确率,且能够有效地解决人脸表情的分析问题。  相似文献   

19.
深度学习已成为图像识别领域的一个研究热点。与传统图像识别方法不同,深度学习从大量数据中自动学习特征,并且具有强大的自学习能力和高效的特征表达能力。但在小样本条件下,传统的深度学习方法如卷积神经网络难以学习到有效的特征,造成图像识别的准确率较低。因此,提出一种新的小样本条件下的图像识别算法用于解决SAR图像的分类识别。该算法以卷积神经网络为基础,结合自编码器,形成深度卷积自编码网络结构。首先对图像进行预处理,使用2D Gabor滤波增强图像,在此基础上对模型进行训练,最后构建图像分类模型。该算法设计的网络结构能自动学习并提取小样本图像中的有效特征,进而提高识别准确率。在MSTAR数据集的10类目标分类中,选择训练集数据中10%的样本作为新的训练数据,其余数据为验证数据,并且,测试数据在卷积神经网络中的识别准确率为76.38%,而在提出的卷积自编码结构中的识别准确率达到了88.09%。实验结果表明,提出的算法在小样本图像识别中比卷积神经网络模型更加有效。  相似文献   

20.
针对当前人脸识别中姿态变化会影响识别性能,以及姿态恢复过程中脸部局部细节信息容易丢失的问题,提出一种基于多任务学习的多姿态人脸重建与识别方法——多任务学习堆叠自编码器(MtLSAE)。该方法通过运用多任务学习机制,联合考虑人脸姿态恢复和脸部局部细节信息保留这两个相关的任务,在步进逐层恢复正面人脸姿态的同时,引入非负约束稀疏自编码器,使得非负约束稀疏自编码器能够学习到人脸部的部分特征;其次在姿态恢复和局部信息保留两个任务之间通过共享参数的方式来学习整个网络框架;最后将重建出来的正脸图像通过Fisherface进行降维并提取具有判别信息的特征,并用最近邻分类器来识别。实验结果表明,MtLSAE方法获得了较好的姿态重建质量,保留的局部纹理信息清晰,而且与局部Gabor二值模式(LGBP)、基于视角的主动外观模型(VAAM)以及堆叠步进自编码器(SPAE)等经典方法相比,识别率性能得以提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号