首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 390 毫秒
1.
年龄是人的固有属性,在人的社会交往中起到了基础性作用,因此人脸图像的年龄估计是人工智能领域的重要问题之一.为了解决非受限条件下人脸图像年龄估计困难的问题,提出一种非受限条件下的多级残差网络人脸年龄估计方法.首先针对高分辨率图像数据集构建多级残差神经网络模型;然后采用Image Net数据集对多级残差网络进行预训练,以获得图像的基本特征表达;最后在非受限人脸年龄数据集上结合随机深度算法对网络模型进行微调.在非受限的Adience人脸年龄分类数据集上进行年龄分类对比实验的结果表明,该方法能够明显地提高非受限条件下人脸年龄估计的准确率,并在提高网络学习能力的同时有效地抑制小规模数据集带来的过拟合问题.  相似文献   

2.
朱常宝  程勇  高强 《计算机科学》2016,43(Z6):46-50
近年来,深度学习在图像、语音、视频等非结构化数据中获得了成功的应用,已成为机器学习和数据挖掘领域的研究热点。作为一种监督学习模型,成功的深度学习应用往往要求较大的高质量的训练集。基于此,研究了多个受限波尔兹曼机组成的深度信念网络,结合半监督学习的思想,使用较小的训练集提高深度网络模型的分类准确性。分别采用了Knn,SVM和pHash 3种方法来学习非标示数据集,实验结果表明半监督深度信念网络比传统多层受限波尔兹曼机在图像分类准确率方面提高了约3%。  相似文献   

3.
《微型机与应用》2019,(5):42-47
对于人脸验证应用于课堂场景的问题,通过教室内的摄像头采集学生图像数据集,然而受光照、姿势和环境因素的影响,采集到的图像质量较低,一般的深度学习模型学习难度很大。针对这些问题,对采集到的图像进行了图像预处理,建立卷积图像分类模型与残差网络图像分类模型,并且修改损失函数,提高学习复杂度,训练出紧凑的人脸特征表达。设置了人脸验证阈值,实现人脸验证。通过实验分析在不同数据集上两个模型的精度,并验证修改的损失函数可改善模型性能,最后结果表明在采集到的图像数据集上正确率最高可以达到99. 97%,通过理论分析和实验证实了设计方法的有效性。  相似文献   

4.
针对深度卷积神经网络随着卷积层数增加而导致网络模型难以训练和性能退化等问题,提出了一种基于深度残差网络的人脸表情识别方法。该方法利用残差学习单元来改善深度卷积神经网络模型训练寻优的过程,减少模型收敛的时间开销。此外,为了提高网络模型的泛化能力,从KDEF和CK+两种表情数据集上选取表情图像样本组成混合数据集用以训练网络。在混合数据集上采用十折(10-fold)交叉验证方法进行了实验,比较了不同深度的带有残差学习单元的残差网络与不带残差学习单元的常规卷积神经网络的表情识别准确率。当采用74层的深度残差网络时,可以获得90.79%的平均识别准确率。实验结果表明采用残差学习单元构建的深度残差网络可以解决网络深度和模型收敛性之间的矛盾,并能提升表情识别的准确率。  相似文献   

5.
针对计算机视觉领域的人脸图像检索计算复杂和检索时长问题,提出一种基于深度卷积特征的快速人脸图像检索算法.首先使用人脸图像训练集对深度卷积神经网络模型进行人脸分类训练;然后采用三元组损失方法对已训练好的人脸分类网络模型进行微调,更新网络的参数,使得网络能够更加有效地提取不同人的人脸图像特征,构建高效的卷积特征向量进行人脸检索初步过滤;为了进一步提高系统的检索性能,提出一阶段查询扩展方法对待检索人脸图像的卷积特征向量进行均值融合加强,再次执行检索任务,得到最终的检索结果.在Celebrities Face Set和Labeled Faces in the Wild dataset这2个人脸检索数据集上进行实验的结果表明,该算法不仅能够显著地提高检索结果的准确率,而且简单可靠,能够快速地实现人脸检索任务.  相似文献   

6.
为了进一步从人脸图像中提高年龄估计的精度,提出一种基于深度学习与有向无环图支持向量机(SVM)的局部调整年龄估计算法.在训练阶段,首先将经过VGGFace2数据集预训练的SE-ResNet-50网络进行微调,并在收敛时提取全连接层,将其首尾相连形成的向量作为表征并训练得到多个one-versus-oneSVM;在测试阶...  相似文献   

7.
《信息与电脑》2021,(1):21-24
人脸图像年龄估计在社交媒体、零售业务和学术研究等各个领域都具有重要的研究意义。ResNet网络是解决深度网络结构退化问题的一种成熟算法,本文使用ResNet50网络对人脸图像的年龄估计模型进行训练。首先,使用ResNet50网络在大型数据集ImageNet上进行模型预训练;其次,在数据集morph2上训练模型;最后,在数据集morph1上进行模型测试。实验结果表明,ResNet50网络在数据集morph1和morph2上获得较高的估计精度。  相似文献   

8.
在肺癌早期筛查过程中,人工诊断胸部CT扫描图像费时费力,而深度学习网络缺乏足够的医学数据进行训练。为此,提出一种渐进式微调(PFT)策略,将其应用于深度迁移学习网络以辅助诊断肺结节良恶性。利用神经网络在粗粒度的自然图像大数据集中学习特征知识,经重构网络分类层将所学到的特征信息迁移至肺结节的细粒度小数据集。采用PFT策略从全连接分类层开始,逐层释放、微调训练卷积层直至所有网络层,并通过定量分析各层微调后肺结节良恶性分类的AUC值,确定最佳微调深度。此外,采用梯度加权类激活映射图和t-SNE算法为网络预测结果提供相应的视觉支持与解释。在LIDC数据集中的实验结果表明,该方法对肺结节良恶性诊断的准确率可达91.44%,其AUC值为0.962 1。  相似文献   

9.
无约束场景下,低质量的人脸图像不仅浪费计算资源而且降低系统识别率.针对此问题,提出一种基于人脸识别的人脸质量评估方法对人脸图像进行预评估.以人脸识别系统特征提取网络为基础网络在COX数据集上进行微调,并使用微调后网络对COX数据集进行质量分数标定.最后,结合基础网络及质量预测网络并以相应损失函数在标定数据上进行回归学习以获取质量评估模型.实验结果表明,该方法能够有效区分不同质量的人脸图像并提升人脸识别系统性能.  相似文献   

10.
端到端双通道特征重标定DenseNet图像分类   总被引:1,自引:0,他引:1       下载免费PDF全文
目的 针对密集连接卷积神经网络(DenseNet)没有充分考虑通道特征相关性以及层间特征相关性的缺点,本文结合软注意力机制提出了端到端双通道特征重标定密集连接卷积神经网络。方法 提出的网络同时实现了DenseNet网络的通道特征重标定与层间特征重标定。给出了DenseNet网络通道特征重标定与层间特征重标定方法;构建了端到端双通道特征重标定密集连接卷积神经网络,该网络每个卷积层的输出特征图经过两个通道分别完成通道特征重标定以及层间特征重标定,再进行两种重标定后特征图的融合。结果 为了验证本文方法在不同图像分类数据集上的有效性和适应性,在图像分类数据集CIFAR-10/100以及人脸年龄数据集MORPH、Adience上进行了实验,提高了图像分类准确率,并分析了模型的参数量、训练及测试时长,验证了本文方法的实用性。与DenseNet网络相比,40层及64层双通道特征重标定密集连接卷积神经网络DFR-DenseNet(dual feature reweight DenseNet),在CIFAR-10数据集上,参数量仅分别增加1.87%、1.23%,错误率分别降低了12%、9.11%,在CIFAR-100数据集上,错误率分别降低了5.56%、5.41%;与121层DFR-DenseNet网络相比,在MORPH数据集上,平均绝对误差(MAE)值降低了7.33%,在Adience数据集上,年龄组估计准确率提高了2%;与多级特征重标定密集连接卷积神经网络MFR-DenseNet(multiple feature reweight DenseNet)相比,DFR-DenseNet网络参数量减少了一半,测试耗时约缩短为MFR-DenseNet的61%。结论 实验结果表明本文端到端双通道特征重标定密集连接卷积神经网络能够增强网络的学习能力,提高图像分类的准确率,并对不同图像分类数据集具有一定的适应性、实用性。  相似文献   

11.
由于空气污染与吸烟等原因, 肺炎已成为人类死亡率最高的疾病之一. 随着机器学习与深度学习技术在医疗图像检测上的应用, 为临床专家诊断各类疾病提供了帮助. 但由于缺少有效的配对肺部X射线数据集, 以及现有针对肺炎检测的方法均采用不是针对肺炎任务的普遍分类模型, 难以发现肺炎图像与正常图像的细微差别, 导致识别失败. 为此, 本文通过数据裁剪、旋转等方式扩充数据集中的正常图像; 再使用50层深度残差网络对胸部X射线中的浅层肺炎特征进行学习; 然后, 通过两层字典对残差网络学习到的肺炎特征进行更深度的抽象和学习, 发现不同肺部图像之间的微小差别; 最后, 融合残差网络和字典学习提取到的多级肺炎特征, 构建肺炎检测模型. 为了验证算法的有效性, 在Chest X-ray肺炎数据集上评估肺炎检测模型的性能. 根据测试结果, 本文提出模型的检测准确率为97.12%; 指标测试中, 精度与召回率之间的调和平均数上的得分为97.73%. 与现有方法相比, 获得了更高的识别精度.  相似文献   

12.
目的 卫星图像往往目标、背景复杂而且带有噪声,因此使用人工选取的特征进行卫星图像的分类就变得十分困难。提出一种新的使用卷积神经网络进行卫星图像分类的方案。使用卷积神经网络可以提取卫星图像的高层特征,进而提高卫星图像分类的识别率。方法 首先,提出一个包含六类图像的新的卫星图像数据集来解决卷积神经网络的有标签训练样本不足的问题。其次,使用了一种直接训练卷积神经网络模型和3种预训练卷积神经网络模型来进行卫星图像分类。直接训练模型直接在文章提出的数据集上进行训练,预训练模型先在ILSVRC(the ImageNet large scale visual recognition challenge)-2012数据集上进行预训练,然后在提出的卫星图像数据集上进行微调训练。完成微调的模型用于卫星图像分类。结果 提出的微调预训练卷积神经网络深层模型具有最高的分类正确率。在提出的数据集上,深层卷积神经网络模型达到了99.50%的识别率。在数据集UC Merced Land Use上,深层卷积神经网络模型达到了96.44%的识别率。结论 本文提出的数据集具有一般性和代表性,使用的深层卷积神经网络模型具有很强的特征提取能力和分类能力,且是一种端到端的分类模型,不需要堆叠其他模型或分类器。在高分辨卫星图像的分类上,本文模型和对比模型相比取得了更有说服力的结果。  相似文献   

13.
人脸图像的年龄和性别识别是人脸分析的重要任务,在真实多变场景下完成识别依然面临挑战。改进深度卷积神经网络(Convolutional Neural Network,CNN),将首层大尺寸卷积核替换为级联3[×]3卷积核;采用跨连卷积层融合中层和高层抽象特征;加入Batch Normalization(BN)层,设置较高的学习率和较小的Dropout比率;采用1[×]1卷积核与全局平均池化(Global Average Pooling)取代全连接层。实验表明,所提方法与主流的年龄性别识别方法比较具有较好的识别率,在Adience数据集上,年龄识别精度达到89.8%,性别识别精度达到93.3%。  相似文献   

14.

Grapevine (Vitis vinifera L.) is a major fruit crop with commercial importance worldwide. Black rot, Black measles, and Leaf blight are three diseases commonly found in the grapevine. The timely and accurate diagnosis is crucial in preventing the spread of the disease and reducing loss in production. The advancement in deep learning has opened doors for new diagnostic algorithms in the domain of plant disease identification. In this paper, we propose a grapevine disease identification method using a convolutional neural network (CNN). A light weight 6-layer CNN model was designed from scratch and trained using an open repository with 3 disease classes and 1 healthy leaf image dataset. The dataset contained a total of 3423 grapevine leaf images. The model was trained with a 70–30 train-test ratio. Image augmentation and early stopping techniques were used to avoid overfitting of the model. The proposed model achieved 98.4% classification accuracy on the test dataset. Additionally, the key feature of the proposed 6-layer model is that it has lesser number of trainable parameters which reduces its computational complexity as compared to the existing pre-trained models.

  相似文献   

15.
The classification of human's age and gender from speech and face images is a challenging task that has important applications in real-life and its applications are expected to grow more in the future. Deep neural networks (DNNs) and Convolutional neural networks (CNNs) are considered as one of the state-of-art systems as feature extractors and classifiers and are proven to be very efficient in analyzing problems with complex feature space. In this work, we propose a new cost function for fine-tuning two DNNs jointly. The proposed cost function is evaluated by using speech utterances and unconstrained face images for age and gender classification task. The proposed classifier design consists of two DNNs trained on different feature sets, which are extracted from the same input data. Mel-frequency cepstral coefficients (MFCCs) and fundamental frequency (F0) and the shifted delta cepstral coefficients (SDC) are extracted from speech as the first and second feature sets, respectively. Facial appearance and the depth information are extracted from face images as the first and second feature sets, respectively. Jointly training of two DNNs with the proposed cost function improved the classification accuracies and minimized the over-fitting effect for both speech-based and image-based systems. Extensive experiments have been conducted to evaluate the performance and the accuracy of the proposed work. Two publicly available databases, the Age-Annotated Database of the German Telephone Speech database (aGender) and the Adience database, are used to evaluate the proposed system. The overall accuracy of the proposed system is calculated as 56.06% for seven speaker classes and overall exact accuracy is calculated as 63.78% for Adience database.  相似文献   

16.
古印章文本因图像退化与超多分类等特点导致识别难度大,部分字符的标注数据不足造成基于深度学习的模型识别准确率不高,泛化能力差.针对上述问题,提出基于深度残差网络(ResNet)和迁移学习的古印章文本识别方法.使用深度残差网络作为特征提取网络,利用人工合成字符样本作为源域进行预训练.将自建古印章文本识别数据集作为目标域,引...  相似文献   

17.
针对人脸识别过程中人脸图像质量较低造成的低识别率问题,提出了一种基于卷积神经网络的人脸图像质量评价模型。首先建立一个8层的卷积神经网络模型,提取人脸图像质量的深层语义信息;然后在无约束环境下收集人脸图像,并通过传统的图像处理方法以及人工筛选进行过滤,得到的数据集用以进行模型参数的训练;其次通过在图形处理器(GPU)上加速训练,得到用于拟合人脸图像到类别的映射关系;最后将输入在高质量图像类别的概率作为图像的质量得分,建立人脸图像的质量打分机制。实验结果表明,与VGG-16网络相比,所提模型准确率降低了0.21个百分点,但是参数规模减小了98%,极大地提高了模型运算效率;同时所提模型在人脸模糊、光照、姿态和遮挡方面都具有较强的判别能力。因此,可将该模型应用在实时人脸识别系统中,在不影响系统运行效率的前提下提高系统的准确性。  相似文献   

18.
目的 人脸姿态偏转是影响人脸识别准确率的一个重要因素,本文利用3维人脸重建中常用的3维形变模型以及深度卷积神经网络,提出一种用于多姿态人脸识别的人脸姿态矫正算法,在一定程度上提高了大姿态下人脸识别的准确率。方法 对传统的3维形变模型拟合方法进行改进,利用人脸形状参数和表情参数对3维形变模型进行建模,针对面部不同区域的关键点赋予不同的权值,加权拟合3维形变模型,使得具有不同姿态和面部表情的人脸图像拟合效果更好。然后,对3维人脸模型进行姿态矫正并利用深度学习对人脸图像进行修复,修复不规则的人脸空洞区域,并使用最新的局部卷积技术同时在新的数据集上重新训练卷积神经网络,使得网络参数达到最优。结果 在LFW(labeled faces in the wild)人脸数据库和StirlingESRC(Economic Social Research Council)3维人脸数据库上,将本文算法与其他方法进行比较,实验结果表明,本文算法的人脸识别精度有一定程度的提高。在LFW数据库上,通过对具有任意姿态的人脸图像进行姿态矫正和修复后,本文方法达到了96.57%的人脸识别精确度。在StirlingESRC数据库上,本文方法在人脸姿态为±22°的情况下,人脸识别准确率分别提高5.195%和2.265%;在人脸姿态为±45°情况下,人脸识别准确率分别提高5.875%和11.095%;平均人脸识别率分别提高5.53%和7.13%。对比实验结果表明,本文提出的人脸姿态矫正算法有效提高了人脸识别的准确率。结论 本文提出的人脸姿态矫正算法,综合了3维形变模型和深度学习模型的优点,在各个人脸姿态角度下,均能使人脸识别准确率在一定程度上有所提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号