共查询到20条相似文献,搜索用时 15 毫秒
1.
目的 人脸年龄估计技术作为一种新兴的生物特征识别技术,已经成为计算机视觉领域的重要研究方向之一。随着深度学习的飞速发展,基于深度卷积神经网络的人脸年龄估计技术已成为研究热点。方法 本文以基于深度学习的真实年龄和表象年龄估计方法为研究对象,通过调研文献,分析了基于深度学习的人脸年龄估计方法的基本思想和特点,阐述其研究现状,总结关键技术及其局限性,对比了常见人脸年龄估计方法的性能,展望了未来的发展方向。结果 尽管基于深度学习的人脸年龄估计研究取得了巨大的进展,但非受限条件下年龄估计的效果仍不能满足实际需求,主要因为当前人脸年龄估计研究仍存在以下困难:1)引入人脸年龄估计的先验知识不足;2)缺少兼顾全局和局部细节的人脸年龄估计特征表达方法;3)现有人脸年龄估计数据集的限制;4)实际应用环境下的多尺度人脸年龄估计问题。结论 基于深度学习的人脸年龄估计技术已取得显著进展,但是由于实际应用场景复杂,容易导致人脸年龄估计效果不佳。对目前基于深度学习的人脸年龄估计技术进行全面综述,从而为研究者解决存在的问题提供便利。 相似文献
2.
针对深度卷积神经网络随着卷积层数增加而导致网络模型难以训练和性能退化等问题,提出了一种基于深度残差网络的人脸表情识别方法。该方法利用残差学习单元来改善深度卷积神经网络模型训练寻优的过程,减少模型收敛的时间开销。此外,为了提高网络模型的泛化能力,从KDEF和CK+两种表情数据集上选取表情图像样本组成混合数据集用以训练网络。在混合数据集上采用十折(10-fold)交叉验证方法进行了实验,比较了不同深度的带有残差学习单元的残差网络与不带残差学习单元的常规卷积神经网络的表情识别准确率。当采用74层的深度残差网络时,可以获得90.79%的平均识别准确率。实验结果表明采用残差学习单元构建的深度残差网络可以解决网络深度和模型收敛性之间的矛盾,并能提升表情识别的准确率。 相似文献
3.
现有年龄估算方法的性能度量主要是基于训练集与测试集独立同分布的假设。为了能更好地符合实际场景以及更好地评估年龄估算方法的泛化性能,提出一种异构数据集评估协议,即在年龄估算时更关注训练集与测试集具有的不同分布和特征情况。此外,为了提高基于卷积神经网络的年龄估算方法的拟合能力,在充分考虑相邻年龄特性的基础上,通过将年龄估算问题建模为基于高斯模型的标签分布学习,提出一种新颖的损失函数。理论分析与实验结果皆说明本文方法的有效性与鲁棒性。 相似文献
4.
多标签学习广泛应用于文本分类、标签推荐、主题标注等.最近,基于深度学习技术的多标签学习受到广泛关注,针对如何在多标签学习中有效挖掘并利用高阶标签关系的问题,提出一种基于图卷积网络探究标签高阶关系的模型TMLLGCN.该模型采用GCN的映射函数从数据驱动的标签表示中生成对象分类器挖掘标签高阶关系.首先,采用深度学习方法提... 相似文献
5.
三维重建技术常用于自动驾驶、机器人、无人机和增强现实等领域。视差估计是三维重建的关键步骤,随着数据集的增加、硬件和网络模型的发展,深度学习视差估计模型被广泛使用并取得良好效果。然而,这些方法常用室外场景的物体,很少使用在室内场景的数据集中。回顾了双目视差估计的深度学习方法,选用5种深度学习网络:PSMNet(pyramid stereo matching network)、GA-Net(guided aggregation network)、LEAStereo(hierarchical neural architecture search for deep stereo matching)、DeepPruner(learning efficient stereo matching via differentiable patchmatch)、BGNet(bilateral grid learning for stereo matching networks),将其运用在一套真实世界的街景数据集(KITTI2015)和两套室内场景数据集(Middlebury2014、Instereo2K... 相似文献
6.
Malware has considerably increased recently, posing a serious security danger to both people and enterprises. In order to distinguish and stop the negative effects of malware, a variety of machine and deep learning approaches have been used to detect it. However, while extracting malware features, the feature-to-feature spatial hierarchy is not taken into account by the existing techniques and as a result, information is lost during the pooling operation. Hence, a modified capsule deep neural network was developed in which discriminative features are extracted from three channel image derived from malware binary with considering feature-to-feature spatial hierarchy. Also, conventional capsule deep neural network is modified by adding a global average pooling layer before fully connected layer thereby classified the dataset as malicious or benign without any loss of information. Moreover, these malwares were not accurately classified based on their families using existing variants of convolutional neural network (CNN) since malware family variants can modify due to minute changes in malware binaries. Hence, a hybrid deep convolutional neural network (DCNN) and long-short-term memory (LSTM) has been utilized that determine minute changes in malware binaries using LSTM without vanishing gradient issue and effectively perform malware family classification using DCNN. As a result, the proposed approach successfully identifies malware in executable files and categorizes malware into families with 98.5% accuracy. 相似文献
7.
二维人体姿态估计作为人体动作识别的基础,随着深度学习和神经网络的流行已经成为备受学者关注的研究热点.与传统方法相比,深度学习能够得到更深层图像特征,对数据的表达更准确,因此已成为研究的主流方向.本文主要介绍了二维人体姿态估计算法,首先根据检测人数分为单人姿态估计与多人姿态估计两类,其次对单人姿态估计分为基于坐标回归与基于热图检测的方法;对多人姿态估计可分为自顶向下(top-down)和自底向上(bottom-up)的方法.最后介绍了姿态估计常用数据集以及评价指标对部分多人姿态估计算法的性能指标进行了对比,并对人体姿态估计研究所面临的问题与发展趋势进行了阐述. 相似文献
8.
Parham M. Kebria Abbas Khosravi Syed Moshfeq Salaken Saeid Nahavandi 《IEEE/CAA Journal of Automatica Sinica》2020,7(1):82-95
Providing autonomous systems with an effective quantity and quality of information from a desired task is challenging. In particular, autonomous vehicles, must have a reliable vision of their workspace to robustly accomplish driving functions. Speaking of machine vision, deep learning techniques, and specifically convolutional neural networks, have been proven to be the state of the art technology in the field. As these networks typically involve millions of parameters and elements, designing an optimal architecture for deep learning structures is a difficult task which is globally under investigation by researchers. This study experimentally evaluates the impact of three major architectural properties of convolutional networks, including the number of layers, filters, and filter size on their performance. In this study, several models with different properties are developed,equally trained, and then applied to an autonomous car in a realistic simulation environment. A new ensemble approach is also proposed to calculate and update weights for the models regarding their mean squared error values. Based on design properties,performance results are reported and compared for further investigations. Surprisingly, the number of filters itself does not largely affect the performance efficiency. As a result, proper allocation of filters with different kernel sizes through the layers introduces a considerable improvement in the performance.Achievements of this study will provide the researchers with a clear clue and direction in designing optimal network architectures for deep learning purposes. 相似文献
9.
针对现有的深度卷积神经网络往往训练平行的分类器层,很少关注类别的层次性结构,导致均衡性分类器训练难度较大的问题,提出一种结构化的深度多任务学习算法.该算法结合深度卷积神经网络与层次分类,使类别之间的结构性信息融入至深度卷积神经网络中.依托树形的类别结构设计了一个带有共享层的多分支网络结构,并使用一种关联性多任务分类器学习算法协同训练各网络分支的分类器层;为了抑制层次间的误差传播,在各分支网络的分类器层的学习过程中添加一个基于父子关系的结构化限制.采用CIFAR100和手工采集到服装数据集,在tensorflow平台上进行实验,结果表明文中算法相比于基准网络可以提高2%~4%的分类准确度. 相似文献
10.
本文提出了一种新型的基于人脸五官辅助的深度年龄估计方法,将传统的人脸五官区域特征提取加分类器设计方法与基于深层卷积神经网络(convolutional neural network,CNN)的端到端分类方法进行融合来解决年龄估计问题,增强了系统模型的泛化能力.该方法将面部关键点生成的局部对齐的人脸图像块作为CNN的输入,直接从图像的像素点评估年龄,采用多尺度分析网络结构极大地提高了性能,同时又利用传统算法增强了五官区域的信息.最后通过在MORPH AlbumⅡ上的实验表明文中提出方法比其他同类研究方法更加优秀. 相似文献
11.
由于半导体制造过程的高度复杂性和动态性,各种过程故障通常导致晶圆表面出现各种缺陷模式.为了有效地识别晶圆表面缺陷模式从而及时地诊断和控制故障源,提出一种深度神经网络模型--二维主成分分析卷积自编码器(two-dimensional principal component analysis-based convolutional autoencoder, PCACAE).首先,提出一种基于改进的二维主成分分析算法(conditional2DPCA,C2DPCA)的图像卷积核,形成PCACAE的第1个卷积层;其次,对卷积输出进行池化操作并卷积编码重构,构建一个卷积编码器,并提取其编码部分作为PCACAE的第2层卷积层的初始化权值,从而形成一个深度网络模型,实现晶圆图像的特征学习;最后, PCACAE网络进行训练微调得到最终网络模型.将PCACAE应用于WM-811K晶圆图像数据库并与其他算法进行对比测试,实验结果表明, PCACAE在晶圆表面缺陷识别上的性能优于其他经典的卷积神经网络模型(如GoogLeNet,DensNet等),从而验证了该方法的有效性与工业可应用性. 相似文献
12.
卷积神经网络是人体姿态估计中应用最成功的深度学习模型,但仍存在着一些诸如关节搜索空间过于巨大以及不同卷积核得到的抽象特征被平等对待等缺陷.为此,提出了一种基于改进卷积神经网络的人体姿态估计算法,利用先验分布减小关节搜索空间,改进卷积神经网络结构建立新的关节外观模型.改进的网络利用单个卷积核对应的全局和局部抽象特征计算关节的初始定位概率,通过对所有卷积核对应的关节初始定位概率进行线性组合来计算关节的最终定位概率,利用线性组合中不同的权值来体现不同抽象特征在定位关节时所起的不同作用.仿真实验表明,与现有基于卷积神经网络的人体姿态估计算法相比,所提出的算法具有更低的计算复杂度和更高的估计准确度. 相似文献
13.
为了解决复杂、海量三维模型的形状识别问题,提出了一种结构感知深度学习的三维形状分类方法.通过联合学习三维模型的几何结构和空间结构,生成具有结构感知的特征向量表示,该特征向量具有更强的识别力与稳定性,在三维形状分类中取得显著的效果.首先,提取优化的多尺度热核特征,并通过CNN学习模型,有效地获取三维形状的几何结构特征;其次,建立多视图卷积学习网络提取三维形状的空间结构特征;最后,通过联合优化学习生成具有结构感知的深度特征表示.文中采用了C++,Matlab,TensorFlow框架实现,并在公开的三维数据库中进行了大量实验,实验结果表明,文中方法获取的深层结构特征对于复杂拓扑结构、大尺度几何形变的三维形状具有稳定性;与相关方法对比,在三维形状分类中具有更高的分类精度. 相似文献
14.
为重建边缘清晰平滑的高分辨率图像,提出一种基于卷积神经网的单幅图像超分辨率重建算法.该算法使用固定大小的小卷积核,有效地提取梯度信息;设计深度为6层的卷积神经网,重建出边缘更清晰的图像,在一定程度上抑制了边缘的振铃效应;使用更大的样本库进行训练,避免发生过拟合.实验结果表明,虽然文中算法在Dong的卷积神经网超分辨率重建算法所提供的小训练库上优势不明显;但在Image Net这类大训练库上,该算法重建的高分辨率图像在主观视觉感受和客观图像质量评价(如峰值信噪比)上都有更好的表现. 相似文献
15.
16.
17.
深度学习在面部特征点识别领域已取得了较为显著的成果,然而在处理遮挡、光照、角度不当等复杂条件下的面部图像时,预测数目较多的面部特征点仍是一个具有挑战性的问题。为解决面部多特征点在复杂条件下的定位问题,设计了一种C-Canny算法和改进单层神经网络相结合的网络结构,将传统Canny算法应用到面部区域定位阶段,使得神经网络可以快速进行面部区域重定位,从而提升识别的准确率。实验结果表明,在300-w和300-vw数据集上与一些传统方法、神经网络相比,该神经网络结构将损失函数的值平均降低了12.2%。 相似文献
18.
针对非协作通信条件下信号调制方式识别问题,提出了一种基于深度神经网络的调制方式自动识别新方法。该方法对接收到的信号进行预处理,生成星座图,并将星座图形状作为深度卷积神经网络的输入,根据训练好的网络模型对调制信号进行分类识别。与以往的识别方法相比,该方法利用卷积神经网络自动学习各种数字调制信号的星座图特征,克服了特征提取困难,通用性不强,抗噪声性能差等缺点,处理流程简单,并对星座图的形变具有不敏感性。针对4QAM、16QAM和64QAM三种典型的数字调制方式,进行了仿真实验,当信噪比大于4时,调制方式的识别正确率大于95%,实验结果表明,基于深度卷积神经网络的信号调制方式识别方法是有效的。 相似文献
19.
人脸图像的年龄和性别识别是人脸分析的重要任务,在真实多变场景下完成识别依然面临挑战。改进深度卷积神经网络(Convolutional Neural Network,CNN),将首层大尺寸卷积核替换为级联3[×]3卷积核;采用跨连卷积层融合中层和高层抽象特征;加入Batch Normalization(BN)层,设置较高的学习率和较小的Dropout比率;采用1[×]1卷积核与全局平均池化(Global Average Pooling)取代全连接层。实验表明,所提方法与主流的年龄性别识别方法比较具有较好的识别率,在Adience数据集上,年龄识别精度达到89.8%,性别识别精度达到93.3%。 相似文献