共查询到18条相似文献,搜索用时 78 毫秒
1.
2.
3.
人脸表情识别是模式识别研究的一个重要领域,现实环境中人脸表情识别容易受到光照、姿态、个体表情差异等因素的影响,识别效果仍有待提高。为了取得更好的人脸表情识别效果,本文提出一种基于迁移卷积神经网络的人脸表情识别方法,本文在训练得到人脸识别网络模型的基础上,采用迁移学习方法将所得人脸识别模型迁移到人脸表情识别任务上,并提出Softmax-MSE损失函数和双激活层(Double Activate Layer, DAL)结构,以提高模型的识别能力。在FER2013数据库和SFEW2.0数据库上的实验表明,本文所提方法分别取得了61.59%和47.23%的主流识别效果。 相似文献
4.
5.
徐奇 《电子技术与软件工程》2022,(9):190-193
本文针对传统脱机手写体汉字识别特征提取非常困难的问题,文章在GoogLeNet网络的基础上搭建了一个适合脱机手写体汉字识别的卷积神经网络。文章首先介绍了卷积神经网络的基本原理和GoogLeNet网络中Inception模块的特点,然后通过激活函数,批量归一化,加入注意力机制等方法对网络进行优化。实验结果表明,改进后的神经网络准确率达到98.1%,相比于AlexNet,Xinception等卷积神经网络模型的识别准确率有明显的提高。 相似文献
6.
7.
在日常的沟通与交流过程中,运用面部表情可以促使沟通交流变得更加顺畅,因此对于人类而言,进行面部表情的解读也是获取相关沟通交流内容的重要程序。随着科学技术的不断发展,人工智能在日常人类交流沟通中运用的越发广泛,因此面部表情人工智能识别这一项技术的发展与创新也更加受到关注。文章将对卷积神经网络的人脸表情识别技术进行深入的研究与探析。 相似文献
8.
针对目前人脸表情识别(Facial Expression Recognition, FER)方法准确率低、模型大和识别时间长的问题,提出了一种基于卷积神经网络的通道注意力FER算法,在普通的卷积层中加入Xception网络中的可分离卷积网络,减少参数量和运算成本。在可分离卷积层的输出加入通道注意力Senet,实现对输出通道的权值按重要程度进行重新分配。引入Resnet网络中残差机制,减轻梯度消失现象。对设计的模型分别在CK+,RAF-DB数据集和FER2013数据集进行训练。实验结果显示,在CK+,RAF-DB数据集和FER2013数据集准确率分别提高至99.45%,78.10%和62.65%。模型参数量仅有1.8 MB,识别时间1.24 s。实现了更准、更快、更轻的FER。 相似文献
9.
为了解决传统卷积神经网络用于人脸表情识别准确率不高的问题,提出了一种基于改进深度AlexNet卷积神经网络的表情识别方法。该方法基于AlexNet网络的基本结构,采用单图形处理单元(Graphics Processing Unit,GPU)进行训练,减少了两层卷积层和一层全连接层,在每层卷积层后加上批标准化(Batch Normalization,BN)代替原来的局部归一化,并在全连接层后加上Dropout正则化进一步防止过拟合。与AlexNet模型相比,改进的网络结构更简单、复杂度低、参数量少,可以节省大量模型训练时间进行快速预测,且更不易过拟合,同时加快了模型收敛速度,提高了网络泛化能力。在Fer2013数据集以及CK+数据集上进行实验,结果表明,所提方法分别得到了68.85%和97.46%的识别率,较其他人脸表情识别方法的识别率有一定提高。 相似文献
10.
针对复杂田间环境下杂草形态相似对深度学习模型识别效果的影响,本文以玉米及其主要伴生杂草作为研究对象,提出一种基于双线性卷积神经网络的细粒度杂草识别方法,用于提升作物与杂草识别的准确率.首先,研究对比了常见通用图像分类模型在杂草识别上的表现,选用识别效果较好的VGGNet-19和ResNet-50作为双线性网络的主干结构,以获取更有效的杂草特征,并采用迁移学习的方式训练网络.实验结果表明,该方法在数据集上的识别准确率高达98.5%,高于单一网络模型的识别效果且能够准确地区分具有高相似度的田间杂草,为智能田间除草作业提供高精度的信息支持. 相似文献
11.
手势识别是人机交互,智能语义识别和远程人机 交流领域的热门研究课题。目前基于 视觉的手势识别问题仍是研究的难点,在多变背景下的手势姿态识别仍然存在较大问题。近 年来,随着深度神经网络技术的快速发展,利用网络自主学习的方法来提取手势姿态有关特 征得到了广泛关注。由于卷积神经网络具有较强的学习能力和个体特征的表达能力,本文针 对传统手势识别算法精度低,鲁棒性差的问题,提出了基于卷积神经网络的TensorFlow框架 下加入扁平卷积模块的FD-CNN网络手势识别算法。在预处理数据集后,基于FD-CNN网络的 手 势识别方法可以直接将预处理后的图像输入网络进行训练,最终输出测试结果的识别精度为 99.0%。与传统方法和经典卷积神经网络方法相比,本文方法提高了 网 络系统对样本数据的多样性和复杂性的有效识别,具有较高的识别率和较好的鲁棒性效果。 相似文献
12.
面部情绪识别已成为可见光人脸识别应用的重要部 分,是光学模式识别研究中最重要的领域之一。为了进一步实现可见光条件下面部情绪的自 动识别,本文结合Viola-Jones、自适应直方图均衡(AHE)、离散小波变换(DWT)和深度卷 积神经网络(CNN),提出了一种面部情绪自动识别算法。该算法使用Viola-Jones定位脸 部和五官,使用自适应直方图均衡增强面部图像,使用DWT完成面部特征提取;最后,提取 的特征直接用于深度卷积神经网络训练,以实现面部情绪自动识别。仿真实验分别在CK+数 据库和可见光人脸图像中进行,在CK+数据集上收获了97%的平均准确 率,在可见光人脸图像测试中也获得了95%的平均准确率。实验结果 表明,针对不同的面部五官和情绪,本文算法能够对可见光面部特征进行准确定位,对可见 光图像信息进行均衡处理,对情绪类别进行自动识别,并且能够满足同框下多类面部情绪同 时识别的需求,有着较高的识别率和鲁棒性。 相似文献
13.
人类行为识别作为视频分类中的重要问题,成为计算机视觉中的热门话题.由于卷积神经网络(CNN)的几何结构固定统一,这将会使得其几何变形建模受限,使得行为识别网络难以鲁棒性的识别行为类别.本文提出了一种融入可形变卷积的行为识别网络模型.首先,引入可形变卷积,构建了一种可协同学习空间外观和时间运动线索的模块,该模块分别学习视... 相似文献
14.
15.
针对非合作接收条件下信号的调制识别问题,提出了一种基于循环谱特征和深度卷积神经网络的自动调制分类算法。该算法首先利用二值化、形态学操作等技术对循环谱数据集预处理,提高网络泛化能力;然后将数据集输入到卷积神经网络模型中,经过网络的特征提取实现分类识别。在网络中添加残差块网络增大感受野,提高特征提取能力。采用Dropout、优化函数等技术优化网络结构,防止训练过拟合。仿真结果表示,与传统方法和现有的一些深度学习调制识别方法相比,该算法在低信噪比条件下有更高的准确率,具有明显的抗噪声优势,是一个有效的调制识别算法。 相似文献
16.
The face is the window to the soul. This is what the 19th-century French doctor Duchenne de Boulogne thought. Using electric shocks to stimulate muscular contractions and induce bizarre-looking expressions, he wanted to understand how muscles produce facial expressions and reveal the most hidden human emotions. Two centuries later, this research field remains very active. We see automatic systems for recognizing emotion and facial expression being applied in medicine, security and surveillance systems, advertising and marketing, among others. However, there are still fundamental questions that scientists are trying to answer when analyzing a person’s emotional state from their facial expressions. Is it possible to reliably infer someone’s internal state based only on their facial muscles’ movements? Is there a universal facial setting to express basic emotions such as anger, disgust, fear, happiness, sadness, and surprise? In this research, we seek to address some of these questions through convolutional neural networks. Unlike most studies in the prior art, we are particularly interested in examining whether characteristics learned from one group of people can be generalized to predict another’s emotions successfully. In this sense, we adopt a cross-dataset evaluation protocol to assess the performance of the proposed methods. Our baseline is a custom-tailored model initially used in face recognition to categorize emotion. By applying data visualization techniques, we improve our baseline model, deriving two other methods. The first method aims to direct the network’s attention to regions of the face considered important in the literature but ignored by the baseline model, using patches to hide random parts of the facial image so that the network can learn discriminative characteristics in different regions. The second method explores a loss function that generates data representations in high-dimensional spaces so that examples of the same emotion class are close and examples of different classes are distant. Finally, we investigate the complementarity between these two methods, proposing a late-fusion technique that combines their outputs through the multiplication of probabilities. We compare our results to an extensive list of works evaluated in the same adopted datasets. In all of them, when compared to works that followed an intra-dataset protocol, our methods present competitive numbers. Under a cross-dataset protocol, we achieve state-of-the-art results, outperforming even commercial off-the-shelf solutions from well-known tech companies. 相似文献
17.