首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为实现快速而准确的人脸检测,提出了一种基于全卷积神经网络的多尺度人脸检测的方法,将卷积神经网络模型AlexNet的全连接层改为全卷积层,并将分类层改为人脸与非人脸的二分类,训练之后准确率达到99.16%。将训练好的分类模型用于人脸检测时,待检测图片通过多尺度变换后输入全卷积网络得到特征图的概率矩阵,用非极大值抑制得到最精准的人脸框。检测结果表明,该方法在人脸检测时准确率高,检测时间短,表现出较好的性能。  相似文献   

2.
针对目前人脸润饰检测算法特征提取复杂、识别率低的问题,提出了一种基于多尺度卷积神经网络的人脸润饰检测算法.不同于传统的卷积神经网络,本文的网络增加了图像预处理,利用基于方向梯度直方图(Histograms of Oriented Gradient,HOG)特征的人脸提取算法从原始图像中提取出人脸部分;在第一个池化层后连接局部归一化(Local Response Normalization,LRN)层,加速模型的收敛;提出了多尺度卷积层,将大小为1×1,3×3和5×5的卷积核进行级联,提高模型分类效果.实验结果表明,本文算法的检测精度在人脸润饰数据集LFW和ND-ⅢTD分别达到99.5%和92.9%,相比于主流网络结构和最新人脸润饰检测算法,检测精度有显著提高.  相似文献   

3.
疲劳驾驶检测具有重要的警示作用,对检测方法的准确性和实时性均有较高要求。为此,提出了一种基于卷积神经网络的疲劳驾驶检测方法。首先,针对车内特定使用环境,对MTCNN算法进行了加速优化,在保证高准确率的同时检测速度提升高达27倍。其次,在实现人脸特征点精确定位基础上,提出了一种基于稀少特征点快速准确提取目标区域图像的ERFP(extracting images based on rare feature points)方法。再次,利用构建的眼、嘴数据集EMSD(eye and mouth state date sets)完成了眼、嘴部状态分类模型的训练。最终,利用训练得到的模型,结合相应的判定算法,实现了疲劳驾驶的检测判定。实验结果表明,该方法在实车环境下对瞌睡和哈欠行为的判定准确率均达到了96%以上,且每秒可完成约50帧图像的检测,具备良好的实时性。  相似文献   

4.
卷积神经网络在检测不同尺度的人脸时所需要的计算量很大,检测过程由多个分离的步骤组成,过于复杂。针对这两方面的不足,提出一种多尺度卷积神经网络模型。根据卷积神经网络各个层具有大小不同的感受野,从不同层提取多个尺度的特征向量分别进行人脸分类与回归,并将网络的全连接层改成卷积层,以适应不同大小的图片输入。该方法将人脸检测的多个步骤集成到一个卷积神经网络中,降低了模型复杂度。实验结果表明,相同测试条件下,所提方法相比其他人脸检测模型在准确率和检测速度上均有显著提升。  相似文献   

5.
卷积神经网络在进行图片处理时需要输入固定尺寸大小的图片,该限制会导致原图在放缩过程中损失大部分信息。另外,目前人脸检测算法多用单一结构网络进行特征提取,这就使得算法的泛化能力较弱。针对以上两个问题,提出了一种将级联卷积神经网络与空间金字塔池化相结合的人脸检测算法。该方法将三级卷积神经网络模型连接起来,其中三级神经网络模型之间各不相同,结构从简单到复杂,在不同层次的神经网络上提取不同的人脸特征并筛选图片,完成对图片中人脸区域的检测。同时,在每级网络层次中加入空间金字塔池化层,这种池化策略无须固定尺寸大小的输入,增加了模型输入的尺寸选择。在标准人脸数据集中,该方法相对于传统方法实现了模型的多尺度输入,提升了检测的性能,并降低了检测人脸的时间。  相似文献   

6.
为解决随机池化中零元素概率为0导致不能被选择的问题,提出一种改进的混合概率随机池化方法。将池化域中的元素去重复并按升序排序,然后加上对应次序的幂次,得到元素的权重概率。在此基础上,根据多项分布取样给出池化值。在数据集MNIST、CIFAR-10、CIFAR-100上进行实验,结果表明,该方法在3种数据集上的分类准确率分别为99.50%、72.25%、39.05%,相较于传统池化方法具有较好的分类效果与稳健性。  相似文献   

7.
基于多纵卷积神经网络的交通标志识别算法识别率较高,但识别和训练时间较长,实用性较差。为此,构造一种基于多尺度卷积神经网络的道路交通标志识别模型。通过改进单尺度卷积神经网络中特征提取的基网络,将网络不同层级所产生的特征融合为多尺度特征并提供给分类器,以提高低层特征的利用率。在GTSRB数据集上的实验结果表明,该模型准确识别率达到99.25%,与多纵卷积神经网络模型相比,其在保证高精度的同时,识别和训练时间的降幅均超过90%,更适用于真实路况下交通标志的精准检测。  相似文献   

8.
针对自然场景图像中多尺度Logo的检测需求,提出了一种基于卷积神经网络的多尺度Logo检测算法。该算法基于两阶段目标检测的实现思路,通过构建特征金字塔并采取逐层预测的方式实现多尺度候选区域的生成,通过融合卷积神经网络中的多层特征图以增强特征的表达能力。在FlickrLogos-32数据集上的实验结果显示,相比基线方法,所提算法能够提升生成候选区域的召回率,并且在保证大中尺度 Logo 检测精度的前提下,提升小尺度Logo的检测性能,验证了所提算法的优越性。  相似文献   

9.
目的 传统显著性检测模型大多利用手工选择的中低层特征和先验信息进行物体检测,其准确率和召回率较低,随着深度卷积神经网络的兴起,显著性检测得以快速发展。然而,现有显著性方法仍存在共性缺点,难以在复杂图像中均匀地突显整个物体的明确边界和内部区域,主要原因是缺乏足够且丰富的特征用于检测。方法 在VGG(visual geometry group)模型的基础上进行改进,去掉最后的全连接层,采用跳层连接的方式用于像素级别的显著性预测,可以有效结合来自卷积神经网络不同卷积层的多尺度信息。此外,它能够在数据驱动的框架中结合高级语义信息和低层细节信息。为了有效地保留物体边界和内部区域的统一,采用全连接的条件随机场(conditional random field,CRF)模型对得到的显著性特征图进行调整。结果 本文在6个广泛使用的公开数据集DUT-OMRON(Dalian University of Technology and OMRON Corporation)、ECSSD(extended complex scene saliency dataset)、SED2(segmentation evalution database 2)、HKU、PASCAL-S和SOD(salient objects dataset)上进行了测试,并就准确率—召回率(precision-recall,PR)曲线、F测度值(F-measure)、最大F测度值、加权F测度值和均方误差(mean absolute error,MAE)等性能评估指标与14种最先进且具有代表性的方法进行比较。结果显示,本文方法在6个数据集上的F测度值分别为0.696、0.876、0.797、0.868、0.772和0.785;最大F测度值分别为0.747、0.899、0.859、0.889、0.814和0.833;加权F测度值分别为0.656、0.854、0.772、0.844、0.732和0.762;MAE值分别为0.074、0.061、0.093、0.049、0.099和0.124。无论是前景和背景颜色相似的图像集,还是多物体的复杂图像集,本文方法的各项性能均接近最新研究成果,且优于大多数具有代表性的方法。结论 本文方法对各种场景的图像显著性检测都具有较强的鲁棒性,同时可以使显著性物体的边界和内部区域更均匀,检测结果更准确。  相似文献   

10.
恶意代码文件大小差异巨大,使用传统卷积神经网络对其可视化图像进行训练时会因分辨率调整导致大量信息丢失。为此,文章提出一种基于多尺度卷积神经网络的恶意代码分类方法。该方法首先将不同大小的恶意代码生成为多种特定分辨率的图像;然后利用DenseNet网络提取特征,避免因调整至同一分辨率导致信息损失;最后通过空间金字塔模型处理多尺度特征,进而训练分类模型。实验结果表明,该方法有效提高了恶意代码分类性能。  相似文献   

11.
12.
针对传统障碍物检测中的立体匹配算法存在特征提取不充分,在复杂场景和光照变化明显等区域存在误匹配率较高,算法所获视差图精度较低等问题,提出了一种基于多尺度卷积神经网络的立体匹配方法。首先,在匹配代价计算阶段,建立了一种基于多尺度卷积神经网络模型,采用多尺度卷积神经网络捕获图像的多尺度特征。为增强模型的抗干扰和快速收敛能力,在原有损失函数中提出改进,使新的损失函数在训练时可以由一正一负两个样本同时进行训练,缩短了模型训练时间。其次,在代价聚合阶段,构造一个全局能量函数,将二维图像上的最优问题分解为四个方向上的一维问题,利用动态规划的思想,得到最优视差。最后,通过左右一致性检测对所得视差进行进一步精化,得到最终视差图。在Middlebury数据集提供的标准立体匹配图像测试对上进行了对比实验,经过实验验证算法的平均误匹配率为4.94%,小于对比实验结果,并提高了在光照变化明显以及复杂区域的匹配精度,得到了高精度视差图。  相似文献   

13.
针对疲劳驾驶引发众多交通事故的问题,提出一种结合核相关滤波器与卷积专家局部约束模型的多特征融合疲劳驾驶检测算法。为多任务级联卷积神经网络检测到的人脸建立自适应核相关滤波器,获取每帧图像人脸位置,利用卷积专家局部约束模型检测人脸68个关键特征点;分别运用基于角度的检测算法、基于相对位置的检测算法和PnP (perspectiven-point)算法检测眼睛闭合度、嘴巴张开度和低头行为;通过支持向量机进行多特征融合疲劳状态分类。实验结果表明,该方法准确率达到95.5%,能有效识别疲劳状态。  相似文献   

14.
针对Web攻击流量检测问题,提出一种基于动态自适应池化算法(Dynamic Adaptive Pooling Algorithm,DAPA)的卷积神经网络模型。首先将数据集中每一条请求流量进行剪裁、对齐、补足等操作,生成一系列50×150的矩阵数据A作为输入,然后搭建基于动态自适应的卷积神经网络模型去进行异常流量检测,使之可以根据特征图的不同,动态地调整池化过程,在网络结构中添加Dropout层来解决流量特征提取过程中的过拟合问题。实验表明,该方法比未使用动态自适应池化的方式精确度提升了1. 2%,损失值降低了2. 6%,过拟合问题也得到了解决。  相似文献   

15.
在大多数受限情况下人脸检测已经有了许多有效方案,但对于人脸尺度变化极大、小人脸,以及模糊、遮挡、光照等非受限环境的人脸检测问题,仍面临更多挑战。针对以上问题,提出一种多尺度卷积神经网络模型。在R-FCN网络的基础上进行改进,以多尺度特征替代单一特征,使网络对多尺度信息更加敏感,在预测阶段同时输出分类置信度与回归置信度,改进非极大值抑制(non-maximum suppression,NMS)算法,提出基于回归置信度的NMS算法。在WIDER FACE数据集上训练模型,在FDDB与WIDER FACE人脸评测库进行实验,实验结果表明,召回率、准确率等指标均优于其它人脸检测算法。  相似文献   

16.
目的 传统人脸检测方法因人脸多姿态变化和人脸面部特征不完整等问题,导致检测效果不佳。为解决上述问题,提出一种两层级联卷积神经网络(TC_CNN)人脸检测方法。方法 首先,构建两层卷积神经网络模型,利用前端卷积神经网络模型对人脸图像进行特征粗略提取,再利用最大值池化方法对粗提取得到的人脸特征进行降维操作,输出多个疑似人脸窗口;其次,将前端粗提取得到的人脸窗口作为后端卷积神经网络模型的输入进行特征精细提取,并通过池化操作得到新的特征图;最后,通过全连接层判别输出最佳检测窗口,完成人脸检测全过程。结果 实验选取FDDB人脸检测数据集中包含人脸多姿态变化以及人脸面部特征信息不完整等情况的图像进行测试,TC_CNN方法人脸检测率达到96.39%,误检率低至3.78%,相比当前流行方法在保证算法效率的同时检测率均有提高。结论 两层级联卷积神经网络人脸检测方法能够在人脸多姿态变化和面部特征信息不完整等情况下实现精准检测,保证较高的检测率,有效降低误检率,方法具有较好的鲁棒性和泛化能力。  相似文献   

17.
针对神经网络训练过程存在分辨率不断降低和梯度消失的共性问题,提出一种基于多尺度卷积神经网络的遥感影像道路提取方法。首先,针对网络前向传播过程分辨率逐渐降低的问题,采用子影像训练网络模型,增强网络对细节信息的获取,然后应用多尺度卷积学习获取不同维度的分层特征,解决由分辨率下降导致的信息缺失问题;其次针对网络在反向传播阶段中出现的梯度消失问题,融入残差连接限制梯度过度更新,改善网络的深度受限问题;最后,针对网络深度和宽度的挖掘导致的网络训练效率问题,使用全局均值池化优化全连接层中大量的冗余数据。大量遥感影像实验结果表明,相对于U-Net网络和经典卷积网络,该方法在Accuracy和F1值上均具有较大优势。  相似文献   

18.
邱津怡  罗俊  李秀  贾伟  倪福川  冯慧 《计算机应用》2019,39(10):2930-2936
葡萄品种质量检测需要识别多类别的葡萄,而葡萄图片中存在多种景深变化、多串等多种场景,单一预处理方法存在局限导致葡萄识别的效果不佳。实验的研究对象是大棚中采集的15个类别的自然场景葡萄图像,并建立相应图像数据集Vitis-15。针对葡萄图像中同一类别的差异较大而不同类别的差异较小的问题,提出一种基于卷积神经网络(CNN)的多尺度葡萄图像识别方法。首先,对Vitis-15数据集中的数据通过三种方法进行预处理:旋转图像的数据扩增方法、中心裁剪的多尺度图像方法以及前两种方法的数据融合方法;然后,采用迁移学习方法和卷积神经网络方法来进行分类识别,迁移学习选取ImageNet上预训练的Inception V3网络模型,卷积神经网络采用AlexNet、ResNet、Inception V3这三类模型;最后,提出适合Vitis-15的多尺度图像数据融合的分类模型MS-EAlexNet。实验结果表明,在同样的学习率和同样的测试集上,数据融合方法在MS-EAlexNet上的测试准确率达到了99.92%,相较扩增和多尺度图像方法提升了近1个百分点,并且所提方法在分类小样本数据集上具有较高的效率。  相似文献   

19.
苏志明  王烈  蓝峥杰 《计算机工程》2021,47(12):299-307,315
人脸表情细微的类间差异和显著的类内变化增加了人脸表情识别难度。构建一个基于多尺度双线性池化神经网络的识别模型。设计3种不同尺度网络提取人脸表情全局特征,并引入分层双线性池化层,集成多个同一网络及不同网络的多尺度跨层双线性特征以捕获不同层级间的部分特征关系,从而增强模型对面部表情细微特征的表征及判别能力。同时,使用逐层反卷积融合多层特征信息,解决神经网络通过多层卷积层、池化层提取特征时丢失部分关键特征的问题。实验结果表明,该模型在FER2013和CK+公开数据集上的识别率分别为73.725%、98.28%,优于SLPM、CL、JNS等人脸表情识别模型。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号