首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于深度学习的图像语义分割方法综述   总被引:5,自引:0,他引:5  
田萱  王亮  丁琪 《软件学报》2019,30(2):440-468
近年来,深度学习技术已经广泛应用到图像语义分割领域.主要对基于深度学习的图像语义分割的经典方法与研究现状进行分类、梳理和总结.根据分割特点和处理粒度的不同,将基于深度学习的图像语义分割方法分为基于区域分类的图像语义分割方法和基于像素分类的图像语义分割方法.把基于像素分类的图像语义分割方法进一步细分为全监督学习图像语义分割方法和弱监督学习图像语义分割方法.对每类方法的代表性算法进行了分析介绍,并详细总结了每类方法的基本思想和优缺点,系统地阐述了深度学习对图像语义分割领域的贡献.对图像语义分割相关实验进行了分析对比,并介绍了图像语义分割实验中常用公共数据集和性能评价指标.最后,预测并分析总结了该领域未来可能的研究方向及相应的发展趋势.  相似文献   

2.
舌体分割是智能医学诊断的重要组成部分,其目的是通过分割舌诊图像生成精准的舌体轮廓.近年来,深度学习方法在图像处理领域得到了广泛的应用并取得了较好的结果.随着医学图像分割对性能的要求越来越高,许多研究人员将深度学习运用到舌体分割中.主要对基于深度学习的舌体分割方法研究现状进行分析梳理和归纳总结.在舌体分割应用领域中,以各种深度学习方法作为研究对象,将基于深度学习的舌体分割方法划分为卷积神经网络(CNN)、全卷积网络(FCN)、卷积模型与图形模型、基于编解码器的模型、基于区域卷积网络模型、扩张卷积模型结构、迁移学习以及其他方法.在每类方法中,针对其改进和扩展的研究成果进行了全面的论述,总结分析其优势与不足;并对基于深度学习的舌体分割常用的数据集和评价指标进行了视觉比较与性能评估;最后讨论了未来研究工作中的发展潜力.  相似文献   

3.
针对一类离散时间单输入-单输出(single-input single-output, SISO)非线性动态系统,将非线性切换控制与基于深度学习的未建模动态估计方法相结合,提出了一种新的非线性广义预测控制方法。该方法针对未建模动态的未知增量,通过使用基于深度学习技术的长短记忆神经网络(long short-term memory, LSTM)进行预估,设计了一种带有未建模动态增量估计的非线性广义预测控制器,增强控制性能。对所提的控制算法进行了稳定性和收敛性分析,最后通过数值仿真实验验证了所提方法的有效性。  相似文献   

4.
人-物体交互检测(HOI),就是把图像作为输入,检测出图像中存在交互行为的人和物体以及他们之间的交互动词。它是计算机视觉范畴里继目标检测、图像分割和目标跟踪之后又一新任务,旨在对图像进行更深层的理解。针对目前基于深度学习的HOI检测综述性文章的空白,以HOI检测方法的发展历程为主线,对基于深度学习的HOI检测方法进行了分类与分析。首先简要总结了早期的技术方法,然后根据模型结构将现有算法分为两阶段方法和一阶段方法并对一些代表性算法进行分析介绍。将两阶段方法分为融入注意力、图模型以及姿势和身体部位三类进行重点论述,总结了每类方法的基本思想与优缺点。此外,还详细介绍了HOI检测任务的实验评价指标、基准数据集和大多数现有方法的实验结果,对不同类别的方法取得的结果进行说明。最后对该技术面临的主要挑战进行总结分析并对未来发展趋势进行展望。  相似文献   

5.
单幅图像深度估计是三维重建中基于图像获取场景深度的重要技术,也是计算机视觉中的经典问题,近年来,基于监督学习的单幅图像深度估计发展迅速.文中介绍了基于监督学习的单幅图像深度估计及其模型和优化方法;分析了现有的参数学习、非参数学习、深度学习3类方法及每类方法的国内外研究现状及优缺点;最后对基于监督学习的单幅图像深度估计进行总结,得出了深度学习框架下的单幅图像深度估计是未来研究的发展趋势和重点.  相似文献   

6.
基于视觉的车辆异常行为检测能够快速检测交通监控视频中的车辆异常行为并报警,在提升交通执法效率,改善城市交通状况和减少交通事故率等方面具有重要作用.当前基于视觉的车辆异常行为检测已取得较大进步,但在实际应用中仍面临如缺乏数据、异常定义的不确切性、遮挡和实时性较差等问题.文中归纳总结近年来提出的基于视觉的车辆异常行为检测算法.首先,介绍当前算法中典型的行为表示特征,从监督学习和非监督学习两方面讨论现有车辆行为学习方法的优缺点.然后,根据行为建模方法将车辆异常行为检测算法分为基于模型的方法、基于重建的方法和深度学习方法,介绍和分析每类方法.最后,讨论当前算法存在的问题,并展望未来的改进方向.  相似文献   

7.
人脸识别系统的快速发展对人脸活体检测技术提出了新要求,包括检测实时性、面对复杂环境的泛化性、对多种攻击类型的鲁棒性以及用户体验的友好性等.主要阐述了人脸活体检测的必要性,对方法进行了分类、整理和总结,根据所提特征的不同,将活体检测分为基于手工特征的方法和基于深度学习的方法,并将近期针对算法泛化性的研究进展归纳为基于辅助监督信号方法、基于域适应域泛化的方法、基于特征解耦的方法、基于噪声建模的方法、基于异常检测的方法,对每类方法的代表性算法进行了分析介绍,详细总结了每类方法的基本思想和优缺点.从各方面系统地概括了人脸活体检测问题,包括不同类型的呈现攻击、先进的人脸活体检测方法、常用公共数据库、标准化评价指标、测试方法等的介绍.此外,还讨论了该领域的难点与挑战,总结了未来的研究方向扣发展趋势.  相似文献   

8.
伴随着信息技术的发展,传统纸质新闻逐渐向新媒体新闻转变.与此同时,近年来数据挖掘和自然语言处理等技术得到了极大的发展,使得对新闻所蕴含丰富语义和主题进行深度挖掘成为可能.然而,信息的超载使得主题可视化成为一个新的挑战,即如何以更好的方式来呈现海量互联网文本所蕴含的主题.隐形语义分析(LDA)是近年来兴起的主题建模方法,被当前学术界认为是主流的主题建模技术.文中首先介绍以LDA为主的文本概率主题建模技术及其发展,讨论了新闻主题建模特点;随后概括对比新闻主题可视化的若干方法,并对其进行分类,分析不同方法的适用性和局限性;最后对新闻主题可视化进行总结和展望.  相似文献   

9.
视频质量评价(VQA)是以人眼的主观质量评估结果为依据,使用算法模型对失真视频进行评估。传统的评估方法难以做到主观评价结果与客观评价结果相一致。基于深度学习的视频质量评价方法无需加入手工特征,通过模型自主学习即可进行评估,对视频质量的监控和评价有重要意义,已成为计算机视觉领域的研究热点之一。首先对视频质量评价的研究背景和主要研究方法进行介绍;其次从全参考型和无参考型两方面介绍基于深度学习的客观质量评价方法,并且从所用的卷积神经网络模型对无参考型评价方法进行了分类比较;接着介绍视频质量评价算法的相关数据库和评价算法性能指标,并对算法性能进行比较;最后对目前视频质量评价研究存在的问题进行总结,并展望了该领域面临的挑战和未来发展方向。  相似文献   

10.
近年来,基于会话的推荐方法受到学术界的广泛关注。随着深度学习技术的不断发展,不同的模型结构被应用于基于会话的推荐方法中,如循环神经网络、注意力机制、图神经网络等。该文对这些基于会话的推荐模型进行了详细的分析、分类和对比,阐明了这些方法各自解决的问题与存在的不足。具体而言,该文首先通过调研,将基于会话的推荐方法与传统推荐方法进行比较,阐明基于会话的推荐方法的主要优缺点;其次,详细描述了现有的基于会话的推荐模型如何建模会话集中的复杂数据信息,以及这些模型方法可解决的技术问题;最后,该文讨论并指出了在基于会话推荐的领域中存在的挑战和未来研究的方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号