首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 31 毫秒
1.
深度学习在语音识别中的研究进展综述   总被引:1,自引:0,他引:1  
在如今的大数据时代里,对于处理大量未经标注的原始语音数据的传统机器学习算法,很多都已不再适用。与此同时,深度学习模型凭借着其对海量数据的强大建模能力,能够直接对未标注数据进行处理,成为当前语音识别领域的一个研究热点。首先主要分析和总结了当前几种具有代表性的深度学习模型;其次是其在语音识别中对于语音特征提取及声学建模中的应用;最后总结了当前所面临的问题和发展方向。  相似文献   

2.
文章主要论述了深度学习目标识别的算法,对其主要运用进行了研究分析。神经网络的结构是一种基于人脑结构设计的技术手段,卷积神经网络属于一种特殊的深度前馈网络信息,为了避免在不同层级之间信息链接产生参数冗余,通过局部链接以及权值共享的方式进行处理,卷积神经网络具有稀疏特征,可以链接符合生物神经元稀疏的响应特性,可以有效的降低网络的参数规模,使得模型训练更为简单便捷。  相似文献   

3.
面向在无纸化考试中的视频行为识别应用需求,提出了基于深度学习的可疑行为识别方法。首先,分析考试视频,提取事件信息。其次,结合深度学习模型,将事件信息作为输入进行训练,以识别可疑行为。最后,基于考试视频数据集进行对比实验,评估所提出方法的准确率。实验结果表明,文章提出的卷积神经网络-长短期记忆网络(Convolutional Neural Networks-Long Short Term Memory,CNN-LSTM)组合模型适用于视频较长的应用场景,CNN-BiGRU适用于视频较短的场景。  相似文献   

4.
传统系统的计算能力较弱,在车辆驾驶行为识别实际应用中经常出现错误识别,准确率较低,为此提出基于深度学习的车辆驾驶行为识别系统。系统硬件方面设计了主控制器、惯性传感器和报警器3个硬件设备,软件方面设计了数据清洗和基于深度学习识别驾驶行为两个功能模块,利用数据清洗模块对原始数据进行无效值处理、标准化处理,将处理后的数据利用深度学习网络模型进行分析,输出识别结果。实验结果表明,该系统的准确率高于传统系统,能够准确识别出车辆驾驶行为。  相似文献   

5.
火灾事故频发严重威胁着社会公共安全和人们的生命财产安全.火灾发生的不可预见性增加了火灾防控的难度.传统温感、烟感火灾探测设备对室内空间火灾探测效率较高;以人工选择特征为依据的火灾图像识别技术受限于实际火灾场景特征复杂多变,存在误报情况;深度学习技术通过海量火灾场景图片训练和网络参数优化,自动提取火灾图像深度抽象特征,以...  相似文献   

6.
为提升湖羊的福利化养殖水平和推动动物福利事业健康发展,提出了基于深度信念网络(Deep Belief Network, DBN) 的湖羊维持行为识别方法。挑选6只湖羊佩戴装有姿态传感器的颈环,经数据采集和整理,构建了包括58680个样本的湖羊维持行为数据集,记录了湖羊卧息、采食、饮水、反刍4种维持行为,结合错误率和重构误差两项评价指标,构建了逐层贪婪二次划分算法的DBN识别模型,经训练后,在测试集上与传统的BP神经网络(BPNN)、随机森林(RF)、支持向量机(SVM)模型 进行对比分析?同时对湖羊进行分组识别对比分析,结果表明:本文方法明显优于其他三种方法,4种维持行为的平均识别精度和灵敏度分别为0.9916和0.9915,验证了该方法在湖羊维持行为识别上的有效性。本研究结果可为湖羊的福利化养殖、 行为学研究、异常行为识别及疾病预警提供技术支持  相似文献   

7.
8.
SAR图像目标识别主要针对桥梁、机场等战略军事目标以及飞机、坦克、汽车等战术目标,进行精确的识别分类及定位,是SAR图像解译的重要一环。首先,构建C6678的卷积神经网络主要处理层,然后结合C6678的处理及存储特性,对卷积层和网络调度进行优化设计,完成了YOLOv3-TINY目标识别网络在C6678上的设计实现方法。该方法能够对常用卷积神经网络模型进行重构及修改,解决了C6678等多核DSP处理平台运行深度学习网络的难题。实验结果表明,该方法在检测性能上与GPU一致,考虑到机载SAR的实时图像帧率,虽然该方法在C6678的实时性能相对GPU还有较大差距,但其能够满足机载SAR实时处理需求。  相似文献   

9.
10.
人体行为识别旨在对视频监控中的人体行为进行检索并识别,是人工智能领域的研究热点。基于传统方法的人体行为识别算法存在对样本数据依赖大、易受环境噪声影响等不足。为解决此问题,许多适用于不同应用场景的基于深度学习的人体行为识别算法被提出。介绍了人体行为识别任务中传统特征提取方法和基于深度学习的特征提取方法;从性能和应用两方面对基于深度学习的人体行为识别算法进行总结,重点分析了基于3D卷积神经网络、混合网络、双流卷积神经网络和少样本学习(few-shot learning,FSL)的人体行为识别方法及其在UCF101和HMDB51数据集上的表现;在深度学习的基础上,归纳了主流模型迁移方法的优缺点及其有效性;总结了现有基于深度学习的人体行为识别算法存在的不足,并讨论了以元学习(meta-learning)和transformer为代表的FSL算法将成为未来模型主流算法的可能性,同时对未来基于深度学习的人体行为识别算法的发展方向进行展望。  相似文献   

11.
随着人工智能和深度学习在教育领域的交叉融合,行为识别技术为学生课堂行为观察提供了一种有别于传统的新方法.以云南省X高校课堂视频为基础,经过预处理,获得六大类行为(听课、看书、书写、拍照、低头玩手机、桌面玩手机)30000张图像样本,运用Inception V3算法模型进行了研究,实验结果:六大类行为总识别率达到88.1...  相似文献   

12.
支持向量机(SVM)是一种基于统计学习理论的机器学习与模式识别方法。它通过结构风险最小化准则和核函数方法.较好地解决了小样本、非线性及高维模式识别问题。本文主要从联机手绘草图编辑的角度出发,谈谈支持向量机在草绘手势笔划识别中的具体应用。  相似文献   

13.
支持向量机(SVM)是一种基于统计学习理论的机器学习与模式识别方法。它通过结构风险最小化准则和核函数方法,较好地解决了小样本、非线性及高维模式识别问题。本文主要从联机手绘草图编辑的角度出发,谈谈支持向量机在草绘手势笔划识别中的具体应用。  相似文献   

14.
基于视觉的车辆异常行为检测能够快速检测交通监控视频中的车辆异常行为并报警,在提升交通执法效率,改善城市交通状况和减少交通事故率等方面具有重要作用.当前基于视觉的车辆异常行为检测已取得较大进步,但在实际应用中仍面临如缺乏数据、异常定义的不确切性、遮挡和实时性较差等问题.文中归纳总结近年来提出的基于视觉的车辆异常行为检测算法.首先,介绍当前算法中典型的行为表示特征,从监督学习和非监督学习两方面讨论现有车辆行为学习方法的优缺点.然后,根据行为建模方法将车辆异常行为检测算法分为基于模型的方法、基于重建的方法和深度学习方法,介绍和分析每类方法.最后,讨论当前算法存在的问题,并展望未来的改进方向.  相似文献   

15.
自然场景下的中文识别一直以来都是十分重要的研究领域,而深度学习的快速发展为中文识别提供了非常有效的方法。本文提出了一种基于FOTS模型的方式实现中文识别。首先对实现文本检测识别任务的FOTS模型的基本结构进行介绍;然后对FOTS模型进行了改进,以提高识别效果;最后展示了改进后的FOTS模型在实际应用中的识别效果。  相似文献   

16.
人脸检测方法综述*   总被引:20,自引:1,他引:19  
人脸图像处理包括人脸检测、人脸识别、人脸跟踪、姿态估计和表情识别等。为了构造自动处理人脸图像的信息系统,首先需要鲁棒、有效的人脸检测算法。分析了有关人脸检测问题的研究方法,并对其进行了分类和评价。从基于知识的方法、特征不变方法、模板匹配方法和基于外观的方法等四个方面介绍了相关的算法和理论,分析了各种方法的优缺点,并提出了关于人脸检测问题的进一步研究方向。  相似文献   

17.
我们生活在一个由大量不同模态内容构建而成的多媒体世界中,不同模态信息之间具有高度的相关性和互补性,多模态表征学习的主要目的就是挖掘出不同模态之间的共性和特性,产生出可以表示多模态信息的隐含向量.主要介绍了目前应用较广的视觉语言表征的相应研究工作,包括传统的基于相似性模型的研究方法和目前主流的基于语言模型的预训练的方法....  相似文献   

18.
基于LBP/VAR与DBN模型的人脸表情识别*   总被引:1,自引:0,他引:1  
针对现有表情识别研究中均采用有监督模型实现特征提取,提出一种新的基于DBN(Deep Belief Net)模型无监督的表情特征提取与识别方法。首先对人脸表情图片提取对光照与旋转具有鲁棒性的LBP/VAR初次特征,再通过DBN网络对初次特征来实现人脸表情的二次特征提取与分类学习。对DBN参数本文采用动态搜索的方法,即在一个大范围内搜索确定RBM Mini-batch 、BP Mini-batch与RBM隐层数量的最优值,再确定DBN深度与迭代次数最佳值。在CK 数据库上与传统k-NN、SVM有监督分类模型进行的对比实验表明,本文提出的方法在识别率上分别提高了19.34%和14.22%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号