首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
针对公共空间中人脸情绪识别准确率不高的问题,提出一种结合不同感受野和双流卷积神经网络的人脸情绪识别方法。首先建立基于公共空间视频的人脸表情数据集;然后设计一个双流卷积网络,以尺寸为224×224的单帧人脸图像输入卷积神经网络(convolution neural network,CNN),分析图像纹理静态特征;以尺寸为336×336视频序列输入CNN网络,再将提取的特征送入长短期记忆网络(long short term memory network,LSTM)分析局部、全局运动特征;最后通过Softmax分类器将两通道网络的描述子进行加权融合,得到分类结果。结果表明,本文方法能有效利用不同感受野的信息特征清晰识别公共空间的4种典型人脸情绪,识别准确率达88.89%。  相似文献   

2.
针对人脸表情识别的准确率较低、鲁棒性较差的问题,本文提出一种加深层数的卷积神经网络,将卷积神经网络LeNet的2层卷积、2层池化、一层全连接分别修改为4层卷积、4层池化、2层全连接.首先对人脸表情图像进行关键点定位、人脸裁剪、图像归一化等预处理,然后利用卷积层提取人脸图像的低维度和高维度的特征信息,池化层对提取的人脸特征信息进行降维处理.最后采用softmax分类器对训练样本图像的表情进行分类识别.为了提高表情识别的准确率,在表情训练集中加入了自制的标注图片集.仿真对比实验表明改进的模型精度更高、损失曲线更平滑,验证了改进网络的有效性.  相似文献   

3.
基于数据融合的表情识别   总被引:1,自引:0,他引:1  
本文为了解决表情识别中单一数据所包含人脸表情信息不全面的问题,融合了图像与标记点数据;针对传统模式识别方法中手动提取特征的复杂性,采用了神经网络框架,从而实现特征的自动提取。本文算法以人脸表情的图像与标记点数据为基础,以神经网络为框架,采用稀疏自动编码器对网络进行预训练,实现了网络的稀疏连接,另外,在网络权值更新过程中结合了结构化正则项(Structured Regularization),限制了不同数据与隐层神经元的连接。实验表明:图像与标记点数据的融合更全面地表达了人脸表情信息;稀疏自动编码器和结构化正则项的运用能更有效的提取关键特征并使神经网络自动分析不同输入数据在表情识别中所起到的作用强弱。  相似文献   

4.
为了解决表情识别中单一数据所包含人脸表情信息不全面的问题,融合了图像与标记点数据;针对传统模式识别方法中手动提取特征的复杂性,采用神经网络框架,从而实现了特征的自动提取。本文算法以人脸表情的图像与标记点数据为基础,以神经网络为框架,采用稀疏自动编码器对网络进行预训练,实现了网络的稀疏连接,另外,在网络权值更新过程中结合了结构化正则项(structured regularization),限制了不同数据与隐层神经元的连接。实验表明:图像与标记点数据的融合更全面地表达了人脸表情信息;稀疏自动编码器和结构化正则项的运用能更有效地提取关键特征,并使神经网络自动分析不同输入数据在表情识别中所起到的作用强弱。  相似文献   

5.
面部表情识别是机器感知人类情绪变化的重要途径,但表情识别受不同个体及情绪强弱差异影响较大,难以手动设计准确的特征.提出一种基于双通道卷积神经网络的面部表情识别方法,首先对采集得到的人脸图像进行预处理以限制分析范围,同时分析人脸灰度图像与对应的LBP图像以兼顾全局与细节特征;针对双通道输入数据,利用不同参数的卷积神经网络自动提取面部特征,通过加权融合分类网络进行特征融合,并利用softmax分类不同表情.实验结果表明,该算法能够以较高的准确率识别6种基本面部表情(高兴、悲伤、愤怒、沮丧、恐惧及惊讶).该方法性能优于基于手动设计特征的面部表情识别方法及单通道CNN方法,相比于其他双通道CNN方法,能通过更简单的处理得到近似的识别结果.  相似文献   

6.
为了提高多帧视频序列中动态手势的识别效果,结合计算机视觉分析,提出了基于卷积神经网络视觉融合的动态手势识别方法.采用模糊数据多频谱方法进行多帧视频序列中动态手势视觉图像采集,对采集的图像用Harris角点检测和多传感识别方法进行多模状态分层特征点标定,用卷积神经网络视觉融合方法提取多帧视频序列中动态手势动作的边界轮廓特征点信息,分析多帧视频序列中动态手势的层次化分割特征,用图像分割和边缘信息增强方法,提高动态手势图像的分辨能力,结合角点优化检测技术,用视觉动态跟踪分析实现对手势动作特征点的自动化标定,根据动态手势的帧点分布规则实现多帧视频序列中动态手势动作图像的自适应特征检测和识别.仿真结果表明,采用该方法进行多帧视频序列中动态手势识别的准确性较高、实时性较好.  相似文献   

7.
针对视频序列中人体动作识别存在信息冗余大、准确率低的问题,提出基于关键帧的双流卷积网络的人体动作识别方法.该方法构建了由特征提取、关键帧提取和时空特征融合3个模块构成的网络框架.首先将空间域视频的单帧RGB图像和时间域多帧叠加后的光流图像作为输入,送入VGG16网络模型,提取视频的深度特征;其次提取视频的关键帧,通过不断预测每个视频帧的重要性,选取有足够信息的有用帧并汇聚起来送入神经网络进行训练,选出关键帧并丢弃冗余帧;最后将两个模型的Softmax输出加权融合作为输出结果,得到一个多模型融合的人体动作识别器,实现了对视频的关键帧处理和对动作的时空信息的充分利用.在UCF-101公开数据集上的实验结果表明,与当前人体动作识别的主流方法相比,该方法具有较高的识别率,并且相对降低了网络的复杂度.  相似文献   

8.
针对传统机器学习方法在人脸表情识别上存在特征提取繁琐、表情识别准确率不高的问题,提出一种基于深度学习的人脸表情自动识别方法.设计了一个卷积神经网络模型,以原始图像数据为输入,中间以卷积层和池化层交替作为隐层进行特征自动提取,最后将提取到的特征数据映射到全连接层,并采用Softmax函数作为分类器计算分类得分概率,实现人脸表情的自动识别分类.在公开的人脸表情数据集CK+上进行实验,结果表明本文方法能更准确地识别人脸表情.  相似文献   

9.
针对目前表情生成网络中存在的人脸表情失真、不同帧间图像明暗差异明显的问题,提出一种基于递归双对抗网络模型的人脸表情生成框架。首先通过提取深度人脸特征并生成表情特征图,将其作为监督信号,生成人脸表情种子图像;然后使用生成的种子图像和原始目标人脸一起作为输入,生成特征保持图像,作为当前帧的输出,同时该特征保持图像也作为下一帧种子图像生成的输入;最后,将种子图像生成网络和特征保持图像生成网络递归进行下一帧图像的生成,多次递归得到与原始输入表情一致的特征保持人脸表情视频序列。在CK+和MMI数据库上的实验结果表明,提出的方法能够生成清晰自然的人脸表情视频帧,且在目标人脸形状和驱动的表情特征图像有较大形状差异时具有鲁棒性。  相似文献   

10.
为了避免传统表情识别方法中复杂的特征手动提取过程,同时保证能够提取到更多的表情特征,文中提出一种融合卷积神经网络(Convolutional Neural Network,CNN)、方向梯度直方图(Histogram of Oriented Gradient,HOG)以及人脸关键点定位(facial landmark detection)的人脸表情识别方法.该方法首先通过在图像预处理中使用多任务卷积神经网络(Multi-task convolutional neural network,MTCNN)对不同尺度输入图像进行人脸检测并得到人脸的关键点位置信息(facial landmark).然后根据facial landmark的位置信息计算出人脸表情图像的几何结构特征,并且计算人脸表情图像局部区域的方向梯度直方图来构成HOG特征,采用特征融合的方式将facial landmark和HOG特征做进一步的融合形成新的特征向量LM_HOG.最后将融合后的特征与经过CNN提取的全局特征再次融合输入到支持向量机(Support Vector Machine,SVM)和Softmax中进行表情识别.在FER2013和Extended Cohn-Kanade(CK+)人脸表情库上的实验结果表明,将融合得到的LM_HOG特征作为局部特征,用以描述图像的局部性差异,CNN提取的特征作为全局特征,用以描述人脸表情图像的整体性差异,融合后的特征能更好的提取图像细节特征,平均识别率分别达到了75.14%和97.86%,具有优越的性能.  相似文献   

11.
为了提升卷积神经网络特征提取能力,设计了一种基于连续卷积的深度卷积神经网络模型.该模型采用小尺度的卷积核来更细致地提取局部特征,并借助连续的两个卷积层增加模型的非线性表达能力,结合Dropout技术降低神经元之间的相互依赖,利用抑制网络过拟合对模型进行优化.人脸表情、手写数字字符和彩色图像的目标识别实验表明,在图像较为复杂时,该模型在识别的准确性和泛化性能上比手工特征提取方法及一般的2、3层卷积结构具有明显的优势.  相似文献   

12.
基于PReLUs-Softplus非线性激励函数的卷积神经网络   总被引:1,自引:0,他引:1  
针对卷积神经网络表达能力和识别效果受卷积层激励函数影响的问题,提出了一种新型非线性激励函数PRe LUs-Softplus,并将其应用于神经网络卷积层.对新型神经网络和采用传统激励函数的神经网络在MNIST和CIFAR-10标准数据库上进行了图像识别对比实验,结果表明,相比于采用传统激励函数的神经网络,使用PRe LUs-Softplus激励函数的卷积神经网络在不同的池化方式下图像识别计算收敛速度更快,显著降低了识别的错误率.  相似文献   

13.
为了更准确地从视频中检测面部微表情,针对微表情数据库样本规模较小的特点,采用迁移学习方法将深度卷积神经网络应用于微表情检测问题. 选取预训练过的深度卷积神经网络模型,保留卷积层及预训练参数,添加全连接层和分类器,构造一个二分类的微表情检测深度网络(MesNet). 为了去除微表情数据库中影响网络训练的噪声标签,提出过渡帧的概念和自适应识别过渡帧算法. MesNet在CASME II、SMIC-E-HS与 CAS(ME)2数据库上的曲线下面积(AUC)分别达到0.955 6、0.933 8与0.785 3,其中在CASME II短视频数据库和 CAS(ME)2长视频数据库上均取得最优结果,表明MesNet具有高精度和广适用范围的特点;过渡帧对比实验结果表明,构造训练集时从原始视频中去除过渡帧能够有效提高MesNet微表情检测性能.  相似文献   

14.
在混合气体识别的研究中,针对目前电子鼻应用于化工污染物种类监测时难以达到理想精度的问题,提出了一个基于卷积神经网络的气体分类识别算法.首先利用卷积神经网络的自适应特征提取能力,有效降低原始数据对后续操作的影响;其次进行多次实验训练,对卷积神经网络进行参数优化,提高网络模型性能;最后将提出的卷积神经网络算法与BP神经网络算法分别应用于加州大学公开数据集中一氧化碳和乙烯混合气体的实验数据中.实验结果表明,卷积神经网络算法对此数据集的气体种类检测准确率达到93%,比BP神经网络算法应用于气体识别时精度更高、误差更小,为电子鼻系统气体种类检测提供了一种新的方法.  相似文献   

15.
设计了一种软硬结合的多模态情感识别系统,使用语音和面部表情两个模态,通过梅尔频率倒谱系数与卷积神经网络对情感进行识别和分类,同时将语音情感识别迁移到神经网络计算棒以降低环境负载. 在模态融合时,采用决策层融合的方式来提高识别准确率. 实验结果表明,系统拥有较高的识别准确率,且能够在性能较差的运行环境中保持运行速度.  相似文献   

16.
针对传统星载合成孔径雷达(SAR)工作模式反演方法在识别准确率和时效性上存在局限性的问题,根据SAR信号的特点,提出基于一维卷积神经网络的星载SAR工作模式识别模型.该模型以星载SAR信号脉冲峰值幅度作为输入,利用卷积神经网络的自主学习和模式识别能力,避免了传统方法的人为影响因素,能够学习原始信号更具有代表性的特征,最终实现星载SAR工作模式的有效识别.在设计一维卷积神经网络结构时,参考了现有性能较优的卷积神经网络,根据网络训练过程中准确率和损失值的反馈,调整设置了较优的参数以训练得到具有良好识别性能的模型.基于仿真数据的对比实验表明,该模型相较于传统反演方法具有更高的识别准确率,同时对于主旁瓣信号和不同侦收条件均具有较优的鲁棒性和抗噪性.  相似文献   

17.
针对复杂地面背景环境下的武器装备精确探测识别需求,采用Lee增强滤波、对比度自适应直方图均衡化和能量归一化等图像预处理方法,提高SAR图像质量;通过引入两个可学习的参数和采用基于非极大值抑制(NMS)方法构建了优化的YOLO神经网络目标识别方法,对基于轮廓、纹理等特征的地面目标SAR图像自动识别进行了实验.实验结果表明...  相似文献   

18.
对由可穿戴设备采集的针对人体活动识别的数据集进行处理,并用处理后的数据对一维卷积神经网络进行训练,测试并得到精准度结果。对数据集的处理使得原本数据集中一些噪音和无效数据被过滤排除掉,在训练神经网络时减少了运算量,提升了神经网络的效率。后经测试,在神经网络结构不变的情况下,处理后的数据集可以使神经网络性能得到提升。  相似文献   

19.
针对已有的动作识别方法的特征提取不足、识别率较低等问题,结合双流网络、3D卷积神经网络和卷积LSTM网络的优势,提出一种融合模型. 该融合模型为了更好地提取人体动作特征,采用SSD目标检测方法将人体目标分割出作为局部特征和原视频的全局特征共同训练,并采用后期融合进行分类; 将3D卷积块注意模块采用shortcut结构的方式融合到3D卷积神经网络中,加强神经网络对视频的通道和空间特征提取; 并且通过将神经网络中部分3D卷积层替换为ConvLSTM层的方法,更好地得到视频的时序关系. 实验在公开的KTH数据集  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号