共查询到20条相似文献,搜索用时 15 毫秒
1.
随着深度学习的快速发展,基于深度学习的场景识别方法逐渐取代传统的基于手工特征的场景识别方法,成为未来研究的主要方向。针对基于深度学习的场景识别方法,对基本思想进行了总结,将其大体分为以下四类:深度学习与视觉词袋结合场景识别法、基于显著部分的场景识别法、多层特征融合场景识别法、融合知识表示的场景识别法,分析了各个方法的特点及局限性,并对识别效果进行了比较,最后对未来研究方向进行展望。 相似文献
2.
文字识别是一种通用的图像理解技术,对信息检索、车牌识别和自动驾驶等应用的研究有着重要意义。随着神经网络的伟大复兴,场景文字识别任务得到了很大推动,近年来涌现了许多基于深度学习的文字识别算法。本文提出了一种基于特征融合的CRNN改进算法,使用三个通用的文字识别数据集从识别准确率、运行效率和模型大小三个方面进行分析。实验结果表明该算法在提高准确率的同时,运行效率也有所提高。 相似文献
3.
随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展.受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战.从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以... 相似文献
4.
自然场景文本检测对于机器理解场景等有着重要作用。近年来,随着深度学习的发展,自然场景文字检测方法也日新月异,取得了很好的检测效果。分析、总结了近年来基于深度学习的场景文字检测方法,将其归纳分类为基于回归、基于分割,以及两者混合三种类型,并对各类检测方法的优缺点进行了对比分析。介绍了场景文本检测性能指标及常用的公开数据集以及下载方式。对场景文字检测领域研究进行总结和展望,有望为深度学习场景文本检测方法提供新的研究方向。 相似文献
5.
考古出土的青铜器铭文是非常宝贵的文字材料,准确、快速地了解其释义和字形演变源流对考古学、历史学和语言学研究均有重要意义.青铜器铭文的辨识需要综合文字的形、音、义进行研究,其中第一步也是最重要的一步就是分析文字的形体特征.本文提出一种基于两阶段特征映射的神经网络模型来提取每个文字的形体特征,最后对比目前已知的文字研究成果,如《古文字类编》、《说文解字》,得出识别的结果.通过定性和定量的实验分析,我们发现本文提出的方法可达到较高的识别精度.特别地,在前10个预测类别中(Top-10)准确率达到了94.2%,大幅缩小了考古研究者的搜索推测空间,提高了青铜铭文识别的效率和准确性. 相似文献
6.
近年来,深度学习算法逐渐尝试应用于目标检测领域。本文针对实际交通场景下的车辆目标,应用深度学习目标分类算法中具有代表性的Faster R-CNN框架,结合ImageNet中的车辆数据集,把场景中的目标检测问题转化为目标的二分类问题,进行车辆目标的检测识别。相比传统机器学习目标检测算法,基于深度学习的目标检测算法在检测准确度和执行效率上优势明显。通过本实验结果分析表明,该方法在识别精度以及速度上均取得了显著的提高。 相似文献
7.
李玲俐 《计算机与数字工程》2021,49(9):1912-1914,1929
针对基于深度学习理论的人脸识别技术应用进行了综述.分析了传统人脸识别技术面临的问题,阐述深度学习理论及研究现状,提出深度学习是人脸识别技术发展的重要研究方向,介绍了人脸识别领域中应用最多的两种模型深度信念网络和卷积神经网络,对基于深度信念网络的人脸识别技术和基于卷积神经网络的人脸识别技术进行了论述,最后对基于深度学习的... 相似文献
8.
9.
目前国内外的疲劳状态识别算法大多数是基于单一的、人为制定的疲劳状态特征实现的,且大部分算法结构复杂,效率比较低下,对驾驶员的个人行为习惯的适应性不强。为此,提出一种基于深度学习的疲劳状态识别算法,它引入深信度网络(DBN)来模拟输入图像数据分布,完成对疲劳特征的分层自动抽取,进而基于时间窗实现视频流图像的疲劳状态识别;同时,算法自适应调整网络学习率以减少网络预训练时间,采用反馈机制实现网络自进化,从而提高对用户个性化疲劳特征的适应性。实验结果表明,算法可以使网络获取到良好的疲劳特征,且误判率会随使用时间的增加而逐渐降低。 相似文献
10.
基于深度学习的车标识别方法研究 总被引:1,自引:0,他引:1
对交通监控录像中车牌污损、遮挡的肇事车辆信息进行确认是现阶段智能交通系统中的一个重要问题,车标作为一个关键特征,可以起到辅助判别的作用.提出了一种基于深度学习的车标识别方法,相对于以人工提取特征为主的传统车标识别方法,该方法具有可自主学习特征、可直接输入图像等优点.实验表明,这种方法正确率较高,在光照变化和噪声污染下的准确性和稳定性较好,能够有效降低车标识别的错误率. 相似文献
11.
提出一种基于深度神经网络的多模态动作识别方法,根据不同模态信息的特性分别采用不同的深度神经网络,适应不同模态的视频信息,并将多种深度网络相结合,挖掘行为识别的多模态特征。主要考虑人体行为静态和动态2种模态信息,结合微软Kinect的多传感器摄像机获得传统视频信息的同时也能获取对应的深度骨骼点信息。对于静态信息采用卷积神经网络模型,对于动态信息采用递归循环神经网络模型。最后将2种模型提取的特征相融合进行动作识别和分类。在MSR 3D的行为数据库上实验结果表明,本文的方法对动作识别具有良好的分类效果。 相似文献
12.
13.
针对城市环境卫生提出的对市民生活垃圾进行分类回收的要求,考虑计算机卷积神经网络在图片分类中的强大表现,提出了基于深度学习中卷积神经网络对垃圾图片处理以及输出识别的新模型与方法.针对目前图像局部特征表达存在的复杂性,模糊性等不足,采用特征多层池化以及系统神经网络学习的方式进行优化.同时在ResNet101模型的基础上设计... 相似文献
14.
15.
深度学习在图像识别和声音处理方面已经展现了它优越的性能和广阔的发展前景,对于在禁飞区设立的无人机侦测系统,使用深度学习的方法判断无人机的声音信号具有一定的意义.为了获得更优的侦测效果,首先列举了目前具有代表性的特征提取和分类方法,并分析其优缺点;然后提出了一种扩大可用样本数量的数据处理方式,同时在实验中使用不同组合的深... 相似文献
16.
分心驾驶行为识别是提高驾驶安全的主要方法之一。针对分心驾驶行为识别精度低的问题,本文提出一种基于深度学习的驾驶员分心行为识别算法,由目标检测网络和行为精确识别网络级联构成。基于State Farm公开数据集,第一级利用目标检测算法SSD(Single Shot Multibox Detector)对数据集中的驾驶员原始图像进行局部信息提取,确定行为识别候选区域;第二级分别利用迁移学习VGG19、Res Net50和MobileNetV2模型对候选区域内的行为信息进行精确识别;最后,实验对比级联架构与单模型架构对分心驾驶行为的识别精度。结果表明,提出的级联网络模型相较于主流单模型检测方法,驾驶员行为识别的准确率总体上提升4~7%个百分点。该算法不仅减少噪声和其他背景区域对模型的影响,提高分心行为识别准确率,还可以有效识别更多的行为类别以避免动作的误分类。 相似文献
17.
随着年龄的增长,人脸的形状、纹理等特征会随之发生较明显的改变从而造成显著的类内干扰,这使得人脸识别的性能大大降低.为了解决上述问题,本文基于深度卷积神经网络将年龄估计任务和人脸识别任务相结合,提出了一种抗年龄干扰的人脸识别新方法AD-CNN(Age decomposition convolution neural network),首先将卷积块注意力模型(Convolutional block attention module,CBAM)嵌入到残差网络中以学习更具有代表性的面部特征,随后利用线性回归指导年龄估计任务,提取出年龄干扰因子,通过多层感知机将整个面部特征与年龄干扰特征投影到同一线性可分空间,最后从面部稳定的特征中将年龄干扰分离,得到与年龄无关的面部特征,并采用改进后的角度损失函数基于年龄无关的身份特征进行人脸识别任务,从而达到抑制年龄干扰的目的.本文在MORPH和FGNET数据集上的识别正确率分别达到了98.93%,和90.0%,充分证实了本文所提方法的先进性和有效性. 相似文献
18.
19.
潘陈听 《计算技术与自动化》2020,39(4):123-127
快速有效地识别出视频中的人体动作,具有极其广泛的应用前景及潜在的经济价值,深度学习的火热给视频动作自动识别带来了巨大的发展。提出了一种基于深度学习和非局域平均法的自注意时间段网络,作用于剪切好的视频片段。通过构造非局域模块并将其加入到以ResNet为基本模型的时间段网络,可以得到新模型。经过在TDAP数据集上验证,该模型可较为精确地识别出人体动作,与原有模型相比在不增加时间复杂度的前提下有一定程度的提升。 相似文献
20.
针对传统室内定位指纹法存在定位精度低、容易受到环境影响的问题,提出了一种基于深度学习的Wi-Fi与iBeacon融合的室内定位方法。离线阶段在参考点处采集各个AP和iBeacon的信号强度,使用这些信号强度数据对堆叠自动编码机进行训练并从大量带有噪声的信号强度样本中提取特征,构建位置指纹数据库;在线定位阶段,使用堆叠自动编码机获得待测点信号强度特征并与位置指纹数据库中信号强度特征进行匹配,通过近邻算法估计待测点位置。实验结果表明,基于堆叠自动编码机的室内定位算法具有更高的定位精度。 相似文献